AI多牛看显卡,爆炸式增长需求前,国产GPU四巨头谁会笑傲江湖?

数字科技互联界 2025-03-13 07:30:35
在人工智能技术革命的浪潮中,图形处理器(GPU)作为算力核心正成为全球科技竞争的战略制高点。美国英伟达公司凭借其 CUDA 生态系统和先进制程工艺,长期主导全球 GPU 市场。而中国 GPU 产业在政策扶持与市场需求的双重驱动下,正加速追赶步伐。2025 年开年,燧原科技、沐曦集成、壁仞科技、摩尔线程四大头部企业同步冲刺 IPO,这场资本盛宴不仅折射出国产算力芯片的技术突破,更预示着全球算力格局的深刻变革。 燧原科技自 2018 年成立以来,专注于人工智能领域云端算力产品,其邃思 2.0 芯片采用 6 纳米工艺和 chiplet 等先进技术,GCU-CARA 全域计算架构针对人工智能计算特性深度优化,支持从 FP32 到 INT8 的全面计算精度,单精度 FP32 峰值算力 40 TFLOPS,单精度张量 TF32 峰值算力 160 TFLOPS,均国内领先。基于该芯片打造的云燧 T20 训练加速卡和云燧 T21 训练 OAM 模组,性能强、覆盖面广、可扩展性强,还有全面升级的 “驭算 TopsRider” 软件平台,通过软硬件协同架构设计,支持主流深度学习框架下的各类模型训练,为超大规模集群高效运行提供解决方案。燧原科技凭借强大的技术实力和产品性能,在数据中心市场成绩斐然,其产品广泛应用于互联网、政务、金融、制造和能源等领域,为众多客户提供强大算力支撑。 2024 年 12 月,全国首个国产万卡推理集群在甘肃庆阳点亮,搭载其最新算力卡,供给超 2500P 算力服务,Deepseek 的全量模型在多智算中心完成数万卡快速部署,展现出强大市场竞争力。预计 2025 年二季度末至三季度初上市。 沐曦集成电路秉持打造全栈 GPU 生态理念,采用自主研发 GPU IP,拥有自主知识产权指令集和架构,配兼容主流 GPU 生态完整软件栈(MXMACA)。其产品线丰富,曦思 N 系列 GPU 用于智算推理,曦云 C 系列 GPU 面向通用计算,曦彩 G 系列 GPU 专注图形渲染,MXC500 系列采用 7nm 制程工艺,目标 FP32 算力 15TFLOPS,可兼容英伟达 CUDA。自主研发的 GPU IP 和指令集架构使产品在性能、功耗和灵活性上具独特优势,通过优化软件栈和算法,能更好支持主流深度学习框架和应用场景,为用户带来便捷高效开发体验。沐曦集成积极与产业链上下游企业合作,2025 年与联想集团联合推出基于 Deepseek 大模型的国产一体机解决方案,为企业提供从千亿参数大模型训练到场景化推理落地的全链条覆盖。预计 2025 年四季度上市。 壁仞科技创立于 2019 年,其核心产品 BR100 系列通用 GPU 芯片基于自主原创架构开发,采用 7 纳米工艺制程和 Chiplet 等前沿技术,集成 770 亿晶体管,可搭配 64GB HBM2E 显存,超 300MB 片上缓存,支持 PCIe 5.0、CXL 互联协议等先进技术。算力性能突出,1024 TOPS INT8、512 TFLOPS BF16、256 TFLOPS TF32+、128 TFLOPS FP32,在 FP32、INT8 等维度超越国际厂商最新旗舰,单芯片峰值算力达 PFLOPS 级别。2024 年公布的异构 GPU 协同训练方案 HGCT,是中国首个三种异构芯片混训技术,突破大模型异构算力孤岛难题,可靠性高。其 BR100 芯片性能卓越,直接对标国际厂商最新旗舰产品,异构协同训练方案 HGCT 具有创新性和领先性,为其在市场中竞争提供有力技术支撑。 壁仞科技的合作客户覆盖通信运营商、人工智能等领域龙头,如为中国移动智算中心(呼和浩特)提供算力支撑,与软通动力联合发布 AIPC 产品,推出 BIRENSUPA 生态方案,赋能多领域客户和开发者。 摩尔线程致力于打造全功能 GPU,实现消费与 AI 双轮驱动发展。其推出的 MTT S80 消费显卡是国内唯一支持 DirectX 12 的消费级显卡,采用 “春晓” GPU 芯片,性能不错,经过驱动优化,在游戏场景中帧率提升显著,已适配多款游戏。在 AI 领域,软硬一体的夸娥 KUAE 智算集群成功将集群规模从千卡级别扩展至万卡规模,具备万 P 级浮点运算能力,专为处理万亿参数级别复杂大模型训练设计,平均无故障运行时间长,周均训练有效率高,通过系统优化实现高效训练,截至 2024 年 10 月已获 425 项授权专利,位居国内 GPU 企业专利授权数量前列。其在全功能 GPU 和智算集群技术上有独特优势,能够在消费和 AI 市场双线发展,满足不同应用场景需求。MTT S80 消费显卡在国内市场有一定知名度,随着驱动优化和游戏适配增加,市场份额有望进一步扩大。 夸娥智算集群落地贵安 AI 项目,并获中国移动、浦发银行订单,在数据中心市场占据一席之地,为公司发展提供新动力。2024 年 11 月,摩尔线程启动 A 股辅导,预计 2025 年 5 月上市。 尽管国产 GPU 四巨头在技术、市场等方面的显著进展,预示着国产 GPU 产业正处于快速发展的黄金时期,但不可忽视的是,与国际巨头英伟达相比,国产 GPU 仍面临诸多挑战。在技术层面,英伟达在 GPU 架构、制程工艺、算力性能等方面一直处于领先地位,其 H100 和 H200 芯片采用 4 纳米工艺,算力性能和能效比卓越,而国产 GPU 芯片在制程工艺和算力性能上与之相比仍有追赶空间。例如,壁仞科技的 BR100 系列采用 7 纳米工艺,在晶体管集成度和性能表现上与英伟达 4 纳米工艺的芯片存在一定差距。在软件生态方面,英伟达经过多年发展,构建了庞大完善的 CUDA 生态系统,拥有丰富开发工具、库和大量开发者社区支持,使其 GPU 在深度学习、科学计算等领域开发便利性高、应用基础广泛。 国产 GPU 企业在软件生态建设上虽积极努力,但在工具丰富度、开发者认可度和应用广泛性上与英伟达差距较大,如燧原科技的 “驭算 TopsRider” 软件平台、沐曦集成的 MXMACA 软件栈等,还需要进一步完善和推广,以吸引更多开发者和用户 2025 年极有可能成为国产 GPU 上市元年,四巨头的 IPO 竞速不仅是企业个体的资本博弈,更是国产算力产业崛起的关键战役。燧原科技凭借腾讯背书与商业化能力暂处优势,摩尔线程的消费级市场突破开辟新赛道,壁仞科技的技术突破与沐曦集成的生态布局各具特色。然而,技术迭代压力、供应链安全等挑战仍需长期应对。随着国产 GPU 在制程工艺、生态构建与场景化创新的持续突破,有望为全球算力格局重构注入中国力量。
0 阅读:3

数字科技互联界

简介:感谢大家的关注