7. 日志与监测


功能介绍

Dify 为每个应用提供了完善的日志记录和性能监测功能,帮助开发者了解应用的实际运行情况,发现问题并持续优化。日志功能记录了最终用户与 AI 应用之间的每一次交互详情,包括用户输入、AI 输出、使用的模型、消耗的 token 数量等信息。监测功能则提供了更宏观的统计数据,如消息量趋势、活跃用户数、费用消耗、平均调用次数等。

日志页面支持按时间范围筛选(如过去 7 天)、按状态筛选、以及关键词搜索。对于 Chatflow 和聊天助手类型的应用,还支持「标注」功能——你可以对 AI 的回复进行人工标注(标记为好/不好),这些标注数据可以用于后续的模型微调和提示词优化。

使用方法

查看日志

image-20260407165051121

进入要查看的应用,点击左侧边栏的「日志与标注」。

image-20260407165123203

使用顶部的筛选器选择时间范围和状态。

image-20260407165144384

点击具体的日志条目查看详细信息。

查看监测数据

image-20260407165316551

进入应用后点击左侧边栏的「监测」。

image-20260407165233919

可以按时间范围查看各项指标的趋势图表。

监测指标说明

指标名称说明
全部消息数统计时间范围内的总消息数量。
活跃用户数统计时间范围内的不重复用户数量。
费用消耗模型 API 调用产生的费用统计。
平均用户调用次数每个用户的平均对话次数。

使用技巧

  • 定期查看日志可以发现用户的高频问题和 AI 回答不佳的情况,作为优化提示词的依据。
  • 利用标注功能对 AI 的回答质量进行人工评估,积累的标注数据可以用于构建评测集。
  • 监测数据可以帮助你了解应用的使用趋势,为容量规划和成本控制提供依据。
  • 如果需要更深入的监控和分析,Dify 支持集成 Langfuse、Opik、Arize Phoenix 等外部可观测性平台。
  • 建议关注"费用消耗"指标,及时发现异常的 token 消耗。

示例

示例一:发现高频失败问题

操作:在日志中筛选"失败"状态的记录
发现:大量用户咨询"退款政策"时 AI 回答不准确
优化:在知识库中补充详细的退款政策文档,并调整提示词

示例二:分析用户使用模式

操作:查看过去 30 天的监测数据
发现:工作日上午 10-12 点是使用高峰
决策:在高峰期切换到更快速的模型以提升响应速度

示例三:人工标注优化

操作:对过去一周的对话日志进行人工标注
标注标准:回答准确性(1-5分)、回答有用性(1-5分)
目的:识别提示词的薄弱环节,针对性优化

示例四:成本监控

操作:查看"费用消耗"趋势图
发现:某天费用突然翻倍
排查:有一个工作流的迭代节点配置错误,导致重复调用 LLM
修复:修正工作流逻辑,费用恢复正常

示例五:集成外部监控

操作:将 Langfuse 集成到 Dify 应用
效果:获得更详细的 LLM 调用链路追踪、延迟分布、Token 使用统计等深度监控能力