2026年32B逆袭GPT-5.2：首个端到端GPU编程智能体框架StitchCUDA问世

科技前沿 • 2026-04-03 18:57 • 阅读 0

32B逆袭GPT-5.2：首个端到端GPU编程智能体框架StitchCUDA问世p 本文作者包括明尼苏达大学的李世阳共同第一作者张子健共同第一作者 Winson Chen 罗越波洪明毅丁才文 p p 现有的 LLM 自动化 CUDA 方法大多只能优化单个 Kernel 面对完整的端到端 GPU 程序如整个 Visio i i nTransformer 推理往往束手无策 lt p

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

 本文作者包括明尼苏达大学的李世阳（共同第一作者），张子健（共同第一作者），Winson Chen，罗越波，洪明毅，丁才文。
现有的 LLM 自动化 CUDA 方法大多只能优化单个 Kernel，面对完整的端到端 GPU 程序（如整个 VisionTransformer 推理）往往束手无策。
本文中，StitchCUDA 提出了一个根本性的问题转向：从优化单个 Kernel，到生成完整的端到端 GPU 程序。通过多智能体协作框架与基于 Rubric Reward 的 Agentic RL，StitchCUDA 在 KernelBench Level 3 端到端任务上实现了90% 的成功率和 1.50× 的平均加速比，分别比多智能体基线高出 1.72× 和 RL 模型基线高出 2.73×。

小讯

Kimi-Audio：月之暗面开源的高性能语音处理工具包

上一篇 2026-04-03 18:58

2026年DeepSeek模型快速部署教程：从零搭建私有化AI服务

下一篇 2026-04-03 18:56

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/224482.html

2026年32B逆袭GPT-5.2：首个端到端GPU编程智能体框架StitchCUDA问世

相关推荐