
这两天我刷到个消息,差点把茶水给呛出来——摩尔线程在 12 月 20 日的 MDC 2025 上,把自家新一代 GPU 架构“花港”给亮出来了,还直接把关键词拉满:算力密度提升 50%,能效提升 10 倍,目标支撑十万卡以上规模的智算集群。听着像吹牛?先别急着笑,很多硬参数是跟着发布会一起出来的,而且这回说的是“架构”,不是“某一张卡跑分涨了点”。
我跟你讲,普通人看 GPU 新闻,最容易陷在“这卡几 TFLOPS、那卡多少显存”的小账本里。但行业里真正掰腕子的地方,其实是“架构”——它就像发动机平台,你今天换个涡轮、明天换个排气,只能算修修补补;你把发动机平台换了,后面一排车型、一个系列的产品路线都跟着变。所以“花港”这种级别的发布,意义不在于你现在能不能马上买到,而在于它把未来一两年的牌给亮了:明年量产,并且围绕它去出“华山”(AI 训推一体)和“庐山”(图形渲染方向)。
展开剩余78%说到这里,咱就把“十万卡”翻译成大白话——不是“办公室里摆十万张显卡”,而是“在工程上能把十万张 GPU 当成一个整体来用”。这事儿难在哪?难在互联、调度、通信、同步、容错,还有一大堆你看不见的脏活累活。你卡再猛,连起来一乱套,等于一群大力士扛着沙袋在原地转圈。现在“花港”说自己支持十万卡以上规模智算集群,我更关注的不是“喊得有多响”,而是它背后透露的一个方向:国产 GPU 开始把“超大规模系统工程”当成主战场了,不再只盯着单卡成绩单。再聊一个很多人容易忽略、但其实很“硬核”的点:全精度。报道里说“花港”能支持从 FP4 到 FP64 的全精度计算。
你可能会问:这堆 FP 是啥?我给你打个比方:
FP64 就像你做科学计算、仿真、工程分析时那种“精确到小数点后老远”的计算;FP16/FP8/FP6/FP4 更像是大模型训练推理里为了速度和成本做的“低精度快跑”。现在大模型越卷越大,大家都在想办法让计算“更省、更快”,低精度就是必经之路;但很多行业场景又离不开高精度。能把全精度谱系打通,意味着这套架构不是只想吃一口“AI 算力”的快钱,而是想把“通用计算平台”这条路走宽。你再看它提的另外两个词:“全精度端到端加速技术”和“新一代异步编程模型”。
很多时候你 GPU 并不是“算不过来”,而是“等得太多”——等数据、等通信、等同步、等别的任务释放资源。所谓“异步”,就是尽量让它别傻等,能并行的并行,能重叠的重叠,把空转时间挤干净。你想想十万卡集群,哪怕每张卡多等 1% 的时间,乘上十万,就是一个离谱的“浪费池”。所以“异步编程模型”这事儿如果真做扎实了,它是系统级效率的底座
然后是图形侧的“狠活”。“花港”说它在图形上也有突破,提到第一代 AI 生成式渲染架构(AGR) 和第二代光追硬件加速引擎,并且能支持 DirectX 12 Ultimate。
这话啥意思?就是它没打算把自己变成“只会跑 AI 的算力卡”,而是继续守着“全功能 GPU”那条难走的路:图形渲染、光线追踪、游戏生态这些“硬骨头”也要啃。甚至 IT 之家还提到,新设计的光追硬件加速引擎在某些维度上,相比早期架构有“50 倍”的提升说法(这是现场信息,咱就当作厂商披露来听)。
我对这种路线是挺佩服的,因为搞图形生态比搞一张“专用 AI 卡”更磨人——驱动、兼容、游戏适配、开发者工具链,都是细水长流的活。
讲到生态,我得顺手把一个“看似枯燥但很关键”的东西拎出来:专利。券商中国那篇里提到,截至 2025 年 6 月 30 日,摩尔线程已经拿到 超 500 项授权专利,覆盖 GPU 虚拟化、功耗管理、AI 计算加速架构、超高清视频编解码等方向。
专利不是用来吓人的,它代表的是——你是不是把那些关键模块真干出来了,而且能在工程和知识产权层面站稳。GPU 这种产业,拼到最后就是“细节地狱”:功耗怎么压、调度怎么写、通信怎么跑、驱动怎么稳。别小看这些“土活儿”,它们才决定你能不能从“能用”走到“好用”。
当然,说到“十万卡”,你不聊互联就像吃火锅不点锅底。IT 之家现场信息里提到,“华山”面向超十万卡级 AI 工厂,搭载新一代 Scale-up 系统,兼容 MTLink 4.0 和多种以太协议,适配多种 Scale-up switch,还提到片间互联速率可达 1314 GB/s。
这些字眼看着像“工程师的朋友圈”,但意思很直白:想把集群做大,互联就是命门。你不把这条命门打通,所有“算力密度”“能效提升”都是纸面上的漂亮话。反过来,如果互联与系统路线打通了,国产算力就不是“单点突破”,而是“成体系地往前推”。
说到最后,我想说点“人话的感慨”。
现在 AI 这波浪潮,说白了就是“算力时代”。算力不是面子,是粮食。你要做工业、做科研、做医疗、做金融、做制造、做内容——最后都绕不过去一个问题:谁来供给你稳定、可控、可扩展的计算底座。所以我真心觉得,中国必须把这类“单项技术突破”看得更重一点:不是热搜上鼓掌三分钟,而是给足耐心、给足场景、给足生态土壤。
国内像摩尔线程这种企业,别管它今天股价怎么走、媒体怎么吵,真正决定它能不能“迎头赶上”的,是一件很朴素的事:能不能让更多开发者把代码跑起来、让更多企业把业务迁过去、让更多系统集成商把方案做出来。GPU 行业的护城河从来不是一句口号,而是“软件栈+工具链+兼容+驱动+生态伙伴”这种一点点堆出来的。你堆得慢,就永远跟在别人屁股后面吃灰;你堆得扎实,才有资格谈“十万卡”、谈“下一代”、谈“产业底座”。
我就一句话收尾:
“花港”这次我不敢说它已经赢了,但它至少把中国国产 GPU 的野心说得明明白白——不是小打小闹,是奔着体系化、规模化去的。要是这条路真跑通了,咱们以后聊 AI、聊大模型、聊数字产业,就不会总是“借别人的船出海”。
#国产GPU #摩尔线程 #花港架构 #AI芯片 #算力 #大模型 #十万卡集群 #国产替代 #AI基础设施 #图形渲染
发布于:四川省股市杠杆平台提示:文章来自网络,不代表本站观点。