AI多牛看显卡，爆炸式增长需求前，国产GPU四巨头谁会笑傲江湖？

在人工智能技术革命的浪潮中，图形处理器（GPU）作为算力核心正成为全球科技竞争的战略制高点。美国英伟达公司凭借其 CUDA 生态系统和先进制程工艺，长期主导全球 GPU 市场。而中国 GPU 产业在政策扶持与市场需求的双重驱动下，正加速追赶步伐。2025 年开年，燧原科技、沐曦集成、壁仞科技、摩尔线程四大头部企业同步冲刺 IPO，这场资本盛宴不仅折射出国产算力芯片的技术突破，更预示着全球算力格局的深刻变革。燧原科技自 2018 年成立以来，专注于人工智能领域云端算力产品，其邃思 2.0 芯片采用 6 纳米工艺和 chiplet 等先进技术，GCU-CARA 全域计算架构针对人工智能计算特性深度优化，支持从 FP32 到 INT8 的全面计算精度，单精度 FP32 峰值算力 40 TFLOPS，单精度张量 TF32 峰值算力 160 TFLOPS，均国内领先。基于该芯片打造的云燧 T20 训练加速卡和云燧 T21 训练 OAM 模组，性能强、覆盖面广、可扩展性强，还有全面升级的 “驭算 TopsRider” 软件平台，通过软硬件协同架构设计，支持主流深度学习框架下的各类模型训练，为超大规模集群高效运行提供解决方案。燧原科技凭借强大的技术实力和产品性能，在数据中心市场成绩斐然，其产品广泛应用于互联网、政务、金融、制造和能源等领域，为众多客户提供强大算力支撑。 2024 年 12 月，全国首个国产万卡推理集群在甘肃庆阳点亮，搭载其最新算力卡，供给超 2500P 算力服务，Deepseek 的全量模型在多智算中心完成数万卡快速部署，展现出强大市场竞争力。预计 2025 年二季度末至三季度初上市。沐曦集成电路秉持打造全栈 GPU 生态理念，采用自主研发 GPU IP，拥有自主知识产权指令集和架构，配兼容主流 GPU 生态完整软件栈（MXMACA）。其产品线丰富，曦思 N 系列 GPU 用于智算推理，曦云 C 系列 GPU 面向通用计算，曦彩 G 系列 GPU 专注图形渲染，MXC500 系列采用 7nm 制程工艺，目标 FP32 算力 15TFLOPS，可兼容英伟达 CUDA。自主研发的 GPU IP 和指令集架构使产品在性能、功耗和灵活性上具独特优势，通过优化软件栈和算法，能更好支持主流深度学习框架和应用场景，为用户带来便捷高效开发体验。沐曦集成积极与产业链上下游企业合作，2025 年与联想集团联合推出基于 Deepseek 大模型的国产一体机解决方案，为企业提供从千亿参数大模型训练到场景化推理落地的全链条覆盖。预计 2025 年四季度上市。壁仞科技创立于 2019 年，其核心产品 BR100 系列通用 GPU 芯片基于自主原创架构开发，采用 7 纳米工艺制程和 Chiplet 等前沿技术，集成 770 亿晶体管，可搭配 64GB HBM2E 显存，超 300MB 片上缓存，支持 PCIe 5.0、CXL 互联协议等先进技术。算力性能突出，1024 TOPS INT8、512 TFLOPS BF16、256 TFLOPS TF32+、128 TFLOPS FP32，在 FP32、INT8 等维度超越国际厂商最新旗舰，单芯片峰值算力达 PFLOPS 级别。2024 年公布的异构 GPU 协同训练方案 HGCT，是中国首个三种异构芯片混训技术，突破大模型异构算力孤岛难题，可靠性高。其 BR100 芯片性能卓越，直接对标国际厂商最新旗舰产品，异构协同训练方案 HGCT 具有创新性和领先性，为其在市场中竞争提供有力技术支撑。壁仞科技的合作客户覆盖通信运营商、人工智能等领域龙头，如为中国移动智算中心（呼和浩特）提供算力支撑，与软通动力联合发布 AIPC 产品，推出 BIRENSUPA 生态方案，赋能多领域客户和开发者。摩尔线程致力于打造全功能 GPU，实现消费与 AI 双轮驱动发展。其推出的 MTT S80 消费显卡是国内唯一支持 DirectX 12 的消费级显卡，采用 “春晓” GPU 芯片，性能不错，经过驱动优化，在游戏场景中帧率提升显著，已适配多款游戏。在 AI 领域，软硬一体的夸娥 KUAE 智算集群成功将集群规模从千卡级别扩展至万卡规模，具备万 P 级浮点运算能力，专为处理万亿参数级别复杂大模型训练设计，平均无故障运行时间长，周均训练有效率高，通过系统优化实现高效训练，截至 2024 年 10 月已获 425 项授权专利，位居国内 GPU 企业专利授权数量前列。其在全功能 GPU 和智算集群技术上有独特优势，能够在消费和 AI 市场双线发展，满足不同应用场景需求。MTT S80 消费显卡在国内市场有一定知名度，随着驱动优化和游戏适配增加，市场份额有望进一步扩大。夸娥智算集群落地贵安 AI 项目，并获中国移动、浦发银行订单，在数据中心市场占据一席之地，为公司发展提供新动力。2024 年 11 月，摩尔线程启动 A 股辅导，预计 2025 年 5 月上市。尽管国产 GPU 四巨头在技术、市场等方面的显著进展，预示着国产 GPU 产业正处于快速发展的黄金时期，但不可忽视的是，与国际巨头英伟达相比，国产 GPU 仍面临诸多挑战。在技术层面，英伟达在 GPU 架构、制程工艺、算力性能等方面一直处于领先地位，其 H100 和 H200 芯片采用 4 纳米工艺，算力性能和能效比卓越，而国产 GPU 芯片在制程工艺和算力性能上与之相比仍有追赶空间。例如，壁仞科技的 BR100 系列采用 7 纳米工艺，在晶体管集成度和性能表现上与英伟达 4 纳米工艺的芯片存在一定差距。在软件生态方面，英伟达经过多年发展，构建了庞大完善的 CUDA 生态系统，拥有丰富开发工具、库和大量开发者社区支持，使其 GPU 在深度学习、科学计算等领域开发便利性高、应用基础广泛。国产 GPU 企业在软件生态建设上虽积极努力，但在工具丰富度、开发者认可度和应用广泛性上与英伟达差距较大，如燧原科技的 “驭算 TopsRider” 软件平台、沐曦集成的 MXMACA 软件栈等，还需要进一步完善和推广，以吸引更多开发者和用户 2025 年极有可能成为国产 GPU 上市元年，四巨头的 IPO 竞速不仅是企业个体的资本博弈，更是国产算力产业崛起的关键战役。燧原科技凭借腾讯背书与商业化能力暂处优势，摩尔线程的消费级市场突破开辟新赛道，壁仞科技的技术突破与沐曦集成的生态布局各具特色。然而，技术迭代压力、供应链安全等挑战仍需长期应对。随着国产 GPU 在制程工艺、生态构建与场景化创新的持续突破，有望为全球算力格局重构注入中国力量。

玩酷网

AI多牛看显卡，爆炸式增长需求前，国产GPU四巨头谁会笑傲江湖？

数字科技互联界