人工智能浪潮席卷全球,智算中心作为支撑人工智能发展的关键基础设施,迎来了前所未有的发展机遇。
高昂的建设成本和算力利用率低的问题,也让这些“吞金兽”面临着巨大的挑战。
尤其是在DeepSeek引发AI拐点之后,智算中心的转型之路变得更加迫切。
DeepSeek的出现,将市场对算力的需求从预训练转向了后训练和推理。
过去,智算中心的主要客户是那些进行大模型预训练的大型互联网公司和AI企业,他们一租就是几十台甚至上百台服务器。
而现在,越来越多的DeepSeek相关创业者涌入市场,他们对算力的需求更加碎片化,往往只需要一部分算力资源,无力承担整台服务器的费用。
这种转变,使得智算中心原有的客户群体结构发生变化,大客户减少的风险也随之而来。
智算中心的建设成本之高,堪比“吞金兽”。
一台服务器的价格高达百万甚至数百万元,再加上配套的制冷和供电系统,一个中等规模智算中心的建设成本就高达20亿到30亿元。
截至2024年6月,中国已建和在建的智算中心超过250个,相关投资累计超过千亿元。
部分公共智算中心由于规划不足,导致算力利用率低,资源闲置严重,如何提升使用效率成为亟待解决的问题。
位于甘肃庆阳的燧弘华创绿色智算中心,或许能为我们提供一些借鉴。
这个算力超过2万P的智算中心,服务于阿里云、百度、智谱AI等用户,是国内真正投入使用的智算中心之一。
它的成功,离不开当地政府的支持和与联想、燧原科技等合作伙伴的协同创新。
庆阳市政府采用算力券奖励模式,使燧弘华创的算力价格更具竞争力,并定期召开会议解决企业发展难题。
联想则在服务器工厂建设、设备提供、算力调优等方面提供了全方位支持。
DeepSeek的出现也给燧弘华创带来了新的挑战。
过去,他们专注于满足大模型预训练的需求,而现在,他们需要转型以适应碎片化的推理算力需求。
智算中心的用户群体也从少数大型企业变成了众多DeepSeek创业者。
这意味着,智算中心需要提供更灵活的算力资源分配方式,并提升云服务和算力调优能力。
DeepSeek也为智算中心带来新的希望。
它不仅改变了用户群体构成,更引爆了AI推理需求,为解决算力供大于求的局面带来了希望。
联想中国基础设施业务群高级产品经理郭晋兵认为,DeepSeek还提供了一种新的资源销售方式:装上各种大模型,以对外卖Token数的方式销售算力资源,这使得客户不再关心硬件组合,而更关注算法的强度。
智算中心的转型,首先要从软件层面开始。
过去,智算中心主要采用裸金属模式对外出租算力。
现在,为了服务大模型后训练与推理,智算中心需要增强云服务和算力调优能力。
联想等算力基础设施提供商也在积极应对这一挑战,通过与燧弘华创和GPU芯片厂商合作,进行异构算力调优方面的联合创新。
联想在庆阳绿色智算中心部署的多元异构算力调度平台,就是为了统一管理异构算力,为用户提供更融合、更稳定的智能和科学算力。
同时,联想也在提升其AI服务器在DeepSeek大模型上的性能表现,最新的数据显示,其服务器在运行满血版DeepSeek R1大模型时,极限吞吐量可超8000 tokens/s。
除了技术层面,智算中心的算力销售模式也需要转变。
过去,智算中心主要在各主要城市建立中心就近服务客户。
现在,面对分散的推理算力市场,他们也开始尝试通过网络平台等渠道销售算力。
智算中心的云化、智算云的建设,很可能成为未来的主要发展方向。
例如,上海市在2025-2027年的智算云产业实施意见中,就明确提出要打造综合型和垂直型智算云平台,并形成一批标杆应用。
智算中心的运维并非易事,智算云的运维难度更是指数级增长。
中科院计算所研究员张云泉呼吁加强AI人才培养。
他指出,尽管基于AI大模型的后训练与推理需求激增,但目前非常缺乏既了解行业需求又掌握AI应用方法的人才。
例如,懂得将行业数据和DeepSeek大模型进行精调的工程师就非常少。
我们需要培养大量这样的工程师,才能解决AI落地的“最后一公里”问题。
智算中心的转型之路,充满了挑战与机遇。
DeepSeek的出现,既带来了新的问题,也提供了新的思路。
如何抓住机遇,应对挑战,是摆在所有智算中心面前的一道难题。
在AI技术日新月异的今天,智算中心的未来究竟会走向何方?
又将如何影响人工智能产业的发展?
这些问题值得我们深入思考和探讨。