无粘预应力钢绞线算力密度提升50%，摩尔线程全功能GPU路线图次公开

12月20日，摩尔线程届MUSA开发者大会（简称：MDC 2025）在北京开幕，系统展示了摩尔线程以自主MUSA统一架构为核心的全栈技术成果，展现公司在端全功能GPU领域的关键突破与前瞻布局。

其中，全功能GPU架构“花港”，支持FP4到FP64的全精度计算，算力密度提升50%，能提升10倍。

摩尔线程创始人、董事长兼CEO张建中还发布AI算力本MTT AIBOOK笔记本。目前该笔记本已在京东开放预售，32GB、1TB 版本预售价9999元。

揭晓新一代全功能GPU架构“花港”

MUSA（Meta-computing Unified System Architecture）是摩尔线程自主研发的元计算统一计算架构，覆盖从芯片架构、指令集、编程模型到软件运行库及驱动程序框架等的全栈技术体系。

基于MUSA统一体系，摩尔线程揭晓新一代全功能GPU架构“花港”，该架构在计算密度、能、精度支持、互联能力及图形技术等方面实现突破。

计算能显著提升：基于新一代指令集，算力密度提升50%，能大幅优化；支持从FP4到FP64的全精度端到端计算，新增MTFP6/MTFP4及混合低精度支持。

异步编程与大规模互联：集成新一代异步编程模型，优化任务调度与并行机制；通过自研MTLink速互联技术，支持十万卡以上规模智算集群扩展。

图形与AI度融合：内置AI生成式渲染架构，增强硬件光线追踪加速引擎，完整支持DirectX 12 Ultimate，实现图形渲染与智能计算的度协同。

基于“花港”架构，摩尔线程公布了未来将发布的两款芯片技术路线：

“华山”注AI训一体与大规模智能计算。集成新一代异步编程与全精度张量计算单元，支持从FP4至FP64的全精度计算，为万卡智算集群提供稳定的算力支撑，是构建下一代“AI工厂”的坚实底座。

“庐山”攻能图形渲染。其图形能实现跨越：AI计算能提升64倍，几何处理能提升16倍，光线追踪能提升50倍，并显著增强纹理填充、原子访存能力及显存容量。集成AI生成式渲染、UniTE统一渲染架构及全新硬件光追引擎，为3A游戏、端图形创作提供强大算力支持。

智算集群支撑万亿参数模型训练

本次大会正式发布了“夸娥万卡”智算集群。该集群具备全精度、全功能通用计算能力，在万卡规模下实现稳定的AI训练与理。

其核心突破包括：浮点运算能力达到10Exa-Flops，钢绞线厂家训练算力利用率（MFU）在Dense大模型上达60%，MOE大模型上达40%，有训练时间占比过90%，训练线扩展率达95%，与国际主流生态度兼容，并在多项指标上具备显著能优势。

手机号码：13302071130

在训练侧，基于原生FP8能力完整复现顶大模型训练流程，并在多项关键精度指标上达到国际主流水平。技术层面实现关键优化：Flash Attention算力利用率95%，并突破FP8累加精度等关键技术瓶颈，充分释放国产GPU在大模型训练中的能潜力。

这枚宝苏局咸丰开炉/镇库大钱，以165mm的大直径、8.7mm的厚重形制与1439克的沉坠分量，直接奠定“清代铸币艺术巅峰”的地位，是咸丰大钱中为罕见的顶珍品。

在理侧，摩尔线程联合硅基流动，经过系统工程优化与FP8精度加速，在DeepSeek R1 671B全量模型上实现能突破：MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s，树立国产理能新标杆。

9999元AI算力本支持国产操作系统

会上，还发布了AI算力本，提供“开箱即用”的开发体验：作为连接开发者与MUSA生态的核心入口，MTT AIBOOK搭载自研“长江”智能SoC，提供达50TOPS的端侧AI算力，次实现从芯片、驱动到开发环境的全栈整合。

该笔记本集开发、办公、娱乐等于一体，支持Windows虚拟机、Linux、安卓容器以及所有的国产操作系统。

大会同时预告了基于“长江”SoC打造的迷你型计算设备MTT AICube，进一步丰富端侧计算产品形态。

现场还分享了面向下一代大规模智算中心的MTT C256节点架构，着眼密硬件架构，实现致智算能。

系列成果的发布，意味着摩尔线程已构建起一套以自主统一架构为根基、贯穿“芯-边-端-云”的完整技术栈，实现了从底层硬件到上层应用的系统化闭环。该体系为国产智能计算生态的持续演进与产业融合，提供了平台支撑。

南方+记者郜小平无粘预应力钢绞线

无粘预应力钢绞线 算力密度提升50%，摩尔线程全功能GPU路线图次公开