九游体育 摩尔线程MusaCoder开源 首个基于国产全功能GPU全栈考核的代码大模子

近日,摩尔线程认真发布并开源面向GPU底层算子生成的专用代码大模子MusaCoder。这是业内首个基于国产GPU算力底座完周至链路考核与考证的开源代码大模子,其圆善后考核进程均在基于MTT S5000构建的夸娥智算集群上完成。
在KernelBench严格评测中,MusaCoder-27B-RL以Overall Pass@8 93.2%、Avg.@8 88.60%的收获,超越Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6等主流SOTA代码模子,性能达到现时行业卓绝水平。
据先容,MusaCoder是摩尔线程面向GPU底层算子生成任务缱绻的专用代码大模子,包含9B和27B两个参数规模。该模子要点支抓从PyTorch款式算子自动生成高性能CUDA/MUSA原生Kernel代码,旨在裁汰开辟者手写底层GPU算子的门槛,普及GPU高性能估量场景下的代码生成、考证和优化服从。
2026世界杯中国官方app传统代码大模子诚然具备较强的通用编程智商,但在GPU Kernel生成任务中仍靠近权臣挑战:一方面,GPU Kernel对并行估量、线程组织、内存拜谒、索引映射和硬件实际特点条目极高;另一方面,生成代码不仅要语法正确,还必须不详通过编译、数值正确性考证、反舞弊检测,并在确实实际中得回性能收益。
针对上述难点,MusaCoder构建了一套面向GPU原生算子(CUDA/MUSA)生成的大模子全栈后考核款式论。该进程笼罩数据构建、实际考证、强化学习优化等要害款式,使模子不详从基础代码智商迟缓进化为具备底层算子生成与缔造智商的专用模子。
据悉,九游体育9GameSports中国官网MusaCoder的SFT(监督微调)、RFT(拒绝采样微调)、RL(强化学习)、异步rollout、在线编译实际考证及reward估量等全栈考核与考证进程,均依托摩尔线程旗舰级AI训推一体智算卡MTT S5000所构建的夸娥智算集群完成。
这一后果,充分考证了国产GPU不仅不详支抓大模子推理和成例微调任务,更不详踏实承载代码大模子后考核全周期算力需求。尤其是在GPU Kernel生成这一类任务中,考核系统需要频频进行代码生成、编译、实际、考证和响应估量,对硬件、编译栈、启动时、挪动系统和评测基础设施皆提倡了更高条目。
摩尔线程示意,MusaCoder的认真开源,旨在为MUSA生态提供面向PyTorch到原生算子生成的基础模子智商,匡助开辟者更高效地完成GPU Kernel的生成、考证、缔造和优化,裁汰底层算子开辟门槛。同期,MusaCoder也为高校、科研机构和开源社区提供了一个基于国产全功能GPU的代码生成商议平台,推进异构估量编程、AI编译优化和自动化Kernel生成等标的的盛开商议与工夫雷同。
瞻望异日,摩尔线程将抓续增强MusaCoder在复杂任务上的生成与缔造智商,并进一步探索与IDE插件、自动调试用具、profiling用具等开辟者用具链的聚首九游体育,迟缓酿成从PyTorch参考完了到MUSA原生Kernel的自动生成、考证、缔造和优化闭环,抓续推进国产GPU生态建树与AI基础设施翻新。