分类:Release
摘要:Dify 0.6.12 正式集成 LangSmith 与 Langfuse,为 LLM 应用提供开箱即用的可观测性支持。通过一键配置,开发者可实时监控应用性能、追踪成本与延迟,并结合细粒度指标持续优化提示词与模型效果,全面升级 LLMOps 体验。
借助 LangSmith 与 Langfuse 提升 Dify 上的 LLM 应用可观测性
为构建更开放、更稳健的 LLM 生态,Dify 0.6.12 正式集成 LangSmith 和 Langfuse 两款强大的 LLM 应用可观测性工具。只需简单配置,即可获取详细的运行数据,轻松评估在 Dify 上构建的 LLM 应用的成本、延迟与质量。

什么是 LLMOps?
LLM 虽具备出色的推理与文本生成能力,但其内部机制仍如“黑盒”,给基于 LLM 的应用开发带来挑战。在 Dify Workflow 中构建的 LLM 应用通常节点众多、逻辑复杂。因此,运维监控至关重要。你需要实时掌握应用运行状态,以便在关键时刻及时干预。
本次集成中,Dify 借助 LangSmith 和 Langfuse 提供全面的 LLMOps 支持,涵盖以下核心场景:
- 模型选型:Dify 支持主流 LLM,助你精准匹配业务需求。
- 提示词优化:Dify 提供直观的提示词编辑界面。结合 LangSmith 与 Langfuse,可深度追踪并分析提示词的实际效果。
- 性能监控:通过这两款工具,可全面监控 Dify 上的 LLM 应用,实时跟踪准确率、延迟及资源占用情况。
- 持续迭代:工具提供细粒度的监控指标。结合人工标注的 LLM 回复数据,可不断优化应用,提升用户体验。
- 成本优化:Dify 提供基础资源用量统计,LangSmith 与 Langfuse 则补充详细的成本与 Token 消耗分析,助力高效优化资源配置。
为何选择 LangSmith 与 Langfuse?
这两款工具是先进的 LLM 应用性能监控平台,能为 Dify 用户提供从开发到优化的全链路支持。
LangSmith
由 LangChain 团队开发,提供强大的链路追踪与深度评估能力,助力团队在应用规模化时保持高效监控。LangSmith 内置丰富的评估功能,可直接从提示词触发运行,包括:
- 成对测试与回归测试
- 基于 LLM 的自动评分(LLM-as-a-judge),适用于微调场景,内置开箱即用的 RAG 评估器
- 支持代码生成等任务的自定义评估器
Langfuse
作为开源平台,Langfuse 具备低性能开销,且对复杂场景支持极佳。核心特性包括:
- 开源且支持私有化部署,架构轻量,部署便捷
- 提供功能完整的 API 与数据导出接口,便于构建下游应用场景
- 框架无关的追踪与分析能力
- 自动化评估、自定义评估流水线及人工标注工作流
- 内置数据集,支持实验基准测试、Few-shot 示例收集与模型微调
值得一提的是,Langfuse 采用 MIT 开源协议,支持通过容器化方式私有化部署。单容器即可运行,对注重数据安全或希望完全掌控基础设施的用户极具吸引力。
如何与 Dify 配合使用?
在 Dify 中接入 LangSmith 和 Langfuse 非常简单。创建应用后,只需在概览页点击一键配置即可启用。

配置完成后,Dify 应用的运行数据将自动同步至对应平台。在 LangSmith 和 Langfuse 的项目管理界面中,你可以查看详细的性能指标、成本数据与使用统计,从而针对性地优化 Dify 上的应用。


展望未来
随着 LangSmith 与 Langfuse 的集成,Dify 0.6.12 树立了透明、高效的 LLM 应用开发新标杆。但这只是开始。我们的使命是不断突破 LLMOps 的边界,赋能开发者充分释放 LLM 的潜力。敬请期待!