本文来源:时代周报 作者:朱成呈
继摩尔线程(688795.SH)之后,国产GPU赛道很快迎来第二家登陆科创板的企业。
12月17日,被市场称为“中国版AMD”的沐曦股份(688802.SH)正式挂牌交易。上市首日,股价以700元/股高开,较104.66元/股的发行价上涨568.83%。
开盘后,资金持续推高股价,盘中一度触及895元/股,公司市值最高攀升至约3580亿元,超过此前上市的摩尔线程。按盘中最高价计算,中一签(500 股)的投资者浮盈约39.52万元,成为年内收益最为可观的新股。
这场火爆行情并非始于上市当天。12月8日晚,沐曦披露IPO 中签结果时,市场情绪已明显升温。其网上发行最终中签率仅 0.03348913%,低于摩尔线程,显示出投资者对国产GPU资产的高度追捧。
值得关注的是,在网下配售的私募机构中,宁波幻方量化位列获配首位,获配股份约4.69万股;同一实控人旗下的浙江九章资产亦获配约1.6万股。两家机构背后,均指向同一个名字——梁文锋。其既是宁波幻方量化的创始人,也是大模型公司DeepSeek的创始人。
12月17日,沐曦股份报收829.90元/股,上涨692.95%。按收盘价估算,梁文锋旗下私募平台浮盈约4561.76万元。若按当日盘中最高价计算,最高浮盈约4971.24万元。
连续“命中”国产GPU明星股
沐曦股份专注于自主研发全栈高性能GPU芯片及计算平台,产品覆盖智算推理的曦思 N 系列、训推一体和通用计算的曦云 C 系列,以及仍在研发中的图形渲染曦彩 G 系列。此次IPO,公司共发行4010万股,募资约41.97亿元。
在沐曦股份之前,梁文锋旗下平台已现身摩尔线程的网下配售名单。私募排排网数据显示,在摩尔线程IPO中,获配金额居前的量化机构包括宁波幻方量化、上海衍复投资和九坤投资。其中,幻方量化合计获配 6.13 万股,按摩尔线程上市首日600.5 元/股的收盘价计算,其持股市值达 3681.07万元,收益率约425.46%。
梁文锋的量化投资版图,依托于九章资产与宁波幻方量化两大平台,二者均在基金业协会备案,实控人均为其本人。梁文锋持有九章资产85%股权,持有宁波幻方量化76.27%的股份。而连续两次“命中”国产GPU头部企业,他的多重身份也受到市场关注。
对此,资深投行人士王骥跃向时代周报记者指出,打新本就是常规操作,“有新就打”,宁波幻方量化产品数量多,与DeepSeek之间或不存在直接关联。
据悉,在沐曦股份的网下申购中,九坤、明汯、茂源、佳期等多家知名私募均积极参与。其中,宁波幻方量化动用162只产品、九章资产动用43只产品申报。
有产业观察人士认为,市场此次对梁文锋的关注,在于其旗下公司同时深度参与算力与大模型两个环节。GKURC产经智库首席分析师丁少将向时代周报记者表示,“依托大规模实际部署经验,(梁文锋)能精准验证芯片在全链路运行中的真实性能、稳定性与性价比,预判技术迭代适配性,比传统机构的参数化判断更贴合产业实际。”
沐曦股份与梁文锋及DeepSeek的渊源,并非始于资本层面的“打新”。今年年初,联想集团与沐曦股份联合发布基于DeepSeek大模型的首个国产一体机解决方案。面向更广泛场景的DeepSeek训推一体机,则基于联想问天WA5480 G3 AI服务器,搭载8张沐曦曦云C500国产GPU,可为大模型训练和推理提供强大的算力支撑。
浙商证券研报认为,软件算法方面,DeepSeek持续通过算法优化减少资源开支。而昇腾CANN 开源、寒武纪完善基础软件平台CambriconNeuWare,有助于摆脱对英伟达CUDA生态的依赖。
国产芯片受益DeepSeek效应
事实上,DeepSeek对沐曦股份等国产芯片企业的影响,正从减少资源开支延伸至精度层面的技术协同。
2025 年 8 月 21 日,DeepSeek 发布 DeepSeek-V3.1。官方披露,该版本采用 UE8M0 FP8 Scale 的参数精度,并在置顶评论中明确指出,这一 FP8 数据格式“是针对即将发布的下一代国产芯片设计”。
多位行业人士指出,UE8M0 FP8 对国产芯片的使用效率提升显著,将进一步缩小与英伟达芯片的效率、成本差距,大大增加国产芯片的可用性。
FP8技术能够在保持较高计算精度的同时,显著降低计算资源需求。半导体资深专家张国斌向时代周报记者表示,关于国产芯片支持FP8精度,是因为原生支持FP8精度可以使国产芯片在AI计算领域更具竞争力,缩小与国际旗舰产品在性能上的差距,更好地满足国内日益增长的AI应用需求,为国产芯片在市场中赢得更多份额,也可以减少对国外芯片的依赖。
彼时,由于DeepSeek并未明确指出FP8适配哪家国产AI芯片,市场一度将目光投向中国信通院发布的首批DeepSeek大模型适配名单。名单显示,中国电信、华为、寒武纪、昆仑芯、海光信息、沐曦、中昊芯英、中科加禾等8家企业通过了相关测试。
值得注意的是,沐曦股份今年7月发布的曦云C600与摩尔线程MTT S5000都支持FP8精度计算。长城证券援引电子发烧友网数据,DeepSeek 通过 MoE 架构将激活参数量控制在合理范围,DeepSeek-V3.1的 UE8M0 FP8 精度标准使国产芯片在推理场景下的能效比提升 40%。
实测显示,在671B参数规模下,沐曦曦云C500运行DeepSeek-V3的单位算力成本较H100降低35%,推理延迟缩短至8ms以内。
在产业层面,DeepSeek的角色正在发生转变。丁少将认为,DeepSeek深度适配20余家国产GPU厂商,通过技术优化提升芯片运行效率,开源模型降低适配门槛,推动“国产算力+大模型”生态闭环构建。此外,还带动边缘计算等场景的芯片需求,助力国产芯片在实战中迭代升级。
从市场结构看,国产芯片仍处于追赶阶段。IDC数据显示,2024年中国GPU市场中,英伟达以70%的市场份额位居第一,华为昇腾以 23%的销量份额位居第二,而在具体出货量方面,英伟达出货190 万片,华为昇腾64万片,昆仑芯6.9万片,天数智芯3.8万片,寒武纪2.6万片,沐曦2.4万片,燧原1.3万片。
但增量空间正在快速打开。弗若斯特沙利文预测,2024年全球GPU市场规模超万亿元,预计2025年到2029年年复合增长率(CAGR)有望达24.5%。中国市场成长更快,市场规模将从2024年的1425亿元跃升至2029年的13368亿元,2025年到2029年CAGR高达53.7%。
在DeepSeek的催化下,国产芯片正快速发展。浙商证券研报认为,上游突破、国产算力成果涌现,加之政策推动,中国市场的AI算力供给正从由依赖英伟达转向有华为昇腾、寒武纪等厂商供应。摩尔线程、沐曦股份上市融资后,国产算力供给有望进一步扩大。



































