连续“命中”国产GPU明星股：沐曦股份首日暴涨692%，梁文锋浮盈超4500万

本文来源：时代周报作者：朱成呈

继摩尔线程（688795.SH）之后，国产GPU赛道很快迎来第二家登陆科创板的企业。

12月17日，被市场称为“中国版AMD”的沐曦股份（688802.SH）正式挂牌交易。上市首日，股价以700元/股高开，较104.66元/股的发行价上涨568.83%。

开盘后，资金持续推高股价，盘中一度触及895元/股，公司市值最高攀升至约3580亿元，超过此前上市的摩尔线程。按盘中最高价计算，中一签（500 股）的投资者浮盈约39.52万元，成为年内收益最为可观的新股。

这场火爆行情并非始于上市当天。12月8日晚，沐曦披露IPO 中签结果时，市场情绪已明显升温。其网上发行最终中签率仅 0.03348913%，低于摩尔线程，显示出投资者对国产GPU资产的高度追捧。

值得关注的是，在网下配售的私募机构中，宁波幻方量化位列获配首位，获配股份约4.69万股；同一实控人旗下的浙江九章资产亦获配约1.6万股。两家机构背后，均指向同一个名字——梁文锋。其既是宁波幻方量化的创始人，也是大模型公司DeepSeek的创始人。

12月17日，沐曦股份报收829.90元/股，上涨692.95%。按收盘价估算，梁文锋旗下私募平台浮盈约4561.76万元。若按当日盘中最高价计算，最高浮盈约4971.24万元。

连续“命中”国产GPU明星股

沐曦股份专注于自主研发全栈高性能GPU芯片及计算平台，产品覆盖智算推理的曦思 N 系列、训推一体和通用计算的曦云 C 系列，以及仍在研发中的图形渲染曦彩 G 系列。此次IPO，公司共发行4010万股，募资约41.97亿元。

在沐曦股份之前，梁文锋旗下平台已现身摩尔线程的网下配售名单。私募排排网数据显示，在摩尔线程IPO中，获配金额居前的量化机构包括宁波幻方量化、上海衍复投资和九坤投资。其中，幻方量化合计获配 6.13 万股，按摩尔线程上市首日600.5 元/股的收盘价计算，其持股市值达 3681.07万元，收益率约425.46%。

梁文锋的量化投资版图，依托于九章资产与宁波幻方量化两大平台，二者均在基金业协会备案，实控人均为其本人。梁文锋持有九章资产85%股权，持有宁波幻方量化76.27%的股份。而连续两次“命中”国产GPU头部企业，他的多重身份也受到市场关注。

对此，资深投行人士王骥跃向时代周报记者指出，打新本就是常规操作，“有新就打”，宁波幻方量化产品数量多，与DeepSeek之间或不存在直接关联。

据悉，在沐曦股份的网下申购中，九坤、明汯、茂源、佳期等多家知名私募均积极参与。其中，宁波幻方量化动用162只产品、九章资产动用43只产品申报。

有产业观察人士认为，市场此次对梁文锋的关注，在于其旗下公司同时深度参与算力与大模型两个环节。GKURC产经智库首席分析师丁少将向时代周报记者表示，“依托大规模实际部署经验，（梁文锋）能精准验证芯片在全链路运行中的真实性能、稳定性与性价比，预判技术迭代适配性，比传统机构的参数化判断更贴合产业实际。”

沐曦股份与梁文锋及DeepSeek的渊源，并非始于资本层面的“打新”。今年年初，联想集团与沐曦股份联合发布基于DeepSeek大模型的首个国产一体机解决方案。面向更广泛场景的DeepSeek训推一体机，则基于联想问天WA5480 G3 AI服务器，搭载8张沐曦曦云C500国产GPU，可为大模型训练和推理提供强大的算力支撑。

浙商证券研报认为，软件算法方面，DeepSeek持续通过算法优化减少资源开支。而昇腾CANN 开源、寒武纪完善基础软件平台CambriconNeuWare，有助于摆脱对英伟达CUDA生态的依赖。

国产芯片受益DeepSeek效应

事实上，DeepSeek对沐曦股份等国产芯片企业的影响，正从减少资源开支延伸至精度层面的技术协同。

2025 年 8 月 21 日，DeepSeek 发布 DeepSeek-V3.1。官方披露，该版本采用 UE8M0 FP8 Scale 的参数精度，并在置顶评论中明确指出，这一 FP8 数据格式“是针对即将发布的下一代国产芯片设计”。

多位行业人士指出，UE8M0 FP8 对国产芯片的使用效率提升显著，将进一步缩小与英伟达芯片的效率、成本差距，大大增加国产芯片的可用性。

FP8技术能够在保持较高计算精度的同时，显著降低计算资源需求。半导体资深专家张国斌向时代周报记者表示，关于国产芯片支持FP8精度，是因为原生支持FP8精度可以使国产芯片在AI计算领域更具竞争力，缩小与国际旗舰产品在性能上的差距，更好地满足国内日益增长的AI应用需求，为国产芯片在市场中赢得更多份额，也可以减少对国外芯片的依赖。

彼时，由于DeepSeek并未明确指出FP8适配哪家国产AI芯片，市场一度将目光投向中国信通院发布的首批DeepSeek大模型适配名单。名单显示，中国电信、华为、寒武纪、昆仑芯、海光信息、沐曦、中昊芯英、中科加禾等8家企业通过了相关测试。

值得注意的是，沐曦股份今年7月发布的曦云C600与摩尔线程MTT S5000都支持FP8精度计算。长城证券援引电子发烧友网数据，DeepSeek 通过 MoE 架构将激活参数量控制在合理范围，DeepSeek-V3.1的 UE8M0 FP8 精度标准使国产芯片在推理场景下的能效比提升 40%。

实测显示，在671B参数规模下，沐曦曦云C500运行DeepSeek-V3的单位算力成本较H100降低35%，推理延迟缩短至8ms以内。

在产业层面，DeepSeek的角色正在发生转变。丁少将认为，DeepSeek深度适配20余家国产GPU厂商，通过技术优化提升芯片运行效率，开源模型降低适配门槛，推动“国产算力+大模型”生态闭环构建。此外，还带动边缘计算等场景的芯片需求，助力国产芯片在实战中迭代升级。

从市场结构看，国产芯片仍处于追赶阶段。IDC数据显示，2024年中国GPU市场中，英伟达以70%的市场份额位居第一，华为昇腾以 23%的销量份额位居第二，而在具体出货量方面，英伟达出货190 万片，华为昇腾64万片，昆仑芯6.9万片，天数智芯3.8万片，寒武纪2.6万片，沐曦2.4万片，燧原1.3万片。

但增量空间正在快速打开。弗若斯特沙利文预测，2024年全球GPU市场规模超万亿元，预计2025年到2029年年复合增长率（CAGR）有望达24.5%。中国市场成长更快，市场规模将从2024年的1425亿元跃升至2029年的13368亿元，2025年到2029年CAGR高达53.7%。

在DeepSeek的催化下，国产芯片正快速发展。浙商证券研报认为，上游突破、国产算力成果涌现，加之政策推动，中国市场的AI算力供给正从由依赖英伟达转向有华为昇腾、寒武纪等厂商供应。摩尔线程、沐曦股份上市融资后，国产算力供给有望进一步扩大。