近日,大模型初创公司Kimi(月之暗面)发布的技术论文《Attention Residuals: Rethinking depth-wise aggregation》引发行业广泛关注。特斯拉CEO埃隆·马斯克(Elon Musk)在社交媒体上公开点赞该研究成果,评价其为“来自Kimi的亮眼工作(Impressive work)”。
对此,Kimi官方账号互动回应,称赞马斯克的“火箭造得也不错”,这一跨界互动迅速成为全球AI技术社区的热议焦点。

Kimi在此次研究中提出了全新的“注意力残差”(Attention Residuals)方法,旨在挑战并改进大模型中长期沿用的固定累积残差连接模式。该技术通过引入更灵活的深度方向聚合机制,替代了传统的递归结构。这一创新意味着模型在处理极其复杂的上下文信息时,能够打破原有计算路径的局限,显著提升长序列数据的表达精度与处理效率。
原文链接: 马斯克点赞Kimi“注意力残差”研究,长文本大模型架构迎新突破
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/243367.html