DeepSeek为何引发美国大恐慌?揭示恐慌背后的真相

富仔视角 2025-02-02 19:48:34

就在春节前三天,中国人工智能初创公司DeepSeek尤如一颗重磅炸弹,炸得美国股市鸡飞狗跳,七朵花市值缩水超过10万亿元,芯片巨头英伟达股价更是一天内大跌17%!几天来,DeepSeek不仅在美区下载榜上超越了ChatGPT,而且引发了美国高新技术人员的恐慌,连美国总统特朗普也称DeepSeek的出现“给美国相关产业敲响了警钟”。DeepSeek为何引发美国大恐慌?恐慌背后的真相究竟是什么?

DeepSeek是什么

很多人或许不知道DeepSeek是什么,它的中文名称是深度探索(注册地:杭州),它其实就是一个人工智能大模型平台。这个大模型直接对标一直领先的、火爆去年的美国ChatGPT,它的出现直冲垮了美国的AI技术在全球的垄断地位。

DeepSeek出现,究竟有哪些值得国人狂欢的亮点?

高性价比

DeepSeek推出的R1模型,其性能与目前世界顶尖的GPT-4等大模型不相上下,但训练成本不到600万美元,仅为同性能模型的5%到10%,百万词的价格不到2.2美元,而同性能OpenAI-o1的价格却高达60美元以上。低廉的价格,显著改善了大模型的应用成本,对大模型在科研、行业、企业等智力密集型产业中的应用具有重大价值,自然也引发全球AI行业的广泛关注!相同性能下,谁还不会选用价格更低的呢?

开源模式

DeepSeek不仅价格便宜,系统能力强大,还对其进行开源。而OpenAI等在美国占据主流的大模型都是闭源系统。正因为开源,将引发美国和全球的开发人员、技术人员和公司都选择使用DeepSeek开源系统,整个AI的发展重心,很有可能会转移到以DeepSeek为核心的生态建设上,从而动摇美国在AI领域的基础设施,可见DeepSeek的开源其杀伤力多么的恐怖!

模式创新

在DeepSeek创新模式下,不仅引发美国高新技术人员恐慌,也对AI领域的相关产业造成了巨大冲击!

为了理解新模式,我们把建大模型当成建造一间房子。之前,美国建造房子(大模型)是把一块一块砖头,通过沙浆(算力)堆砌起来。而DeepSeek的新模式,是把房子(大模型)所需的构件事先进行预制,然后在建造过程中,根据需要进行调配,再通过沙浆(算力)进行装配。

可想而知,DeepSeek创新模式是一款高效的AI大模型。

事件影响

在新模型训练模式情况下,产生了多方面的巨大影响:

一是对我国的AI产业带来积极的影响

由于美国禁止对我国进口高中端芯片,我国为提高算力的服务器等根本无法得到高端芯片,就连制造高端芯片的设备(如ASML光刻机)和原材料都进行了禁止, 极大地制约了我国高科技领域的快速发展。

直到2023年,华为Mate60 Pro手机的麒麟9000s芯片问世,让美国封锁高端芯片成为泡影。这次DeepSeek的出现,又一次打破了美国对我国AI行业发展的瓶颈!中国人的智慧+拼搏精神,又为迈向世界科技高峰前进了一大步。

二是对AI领域的相关产业造成巨大冲击

对芯片市场的影响:

高端芯片需求下降:DeepSeek通过算法优化等技术,其模型可以在英伟达的H800等较低性能芯片上高效运行,降低了AI模型训练对高端GPU的依赖,导致英伟达高端GPU需求减少,受此影响,1月27日,其股价一度暴跌17%,市值蒸发近6000亿美元,对英伟达在GPU市场的主导地位形成挑战;而博通公司股价也下跌了17%,超威半导体公司(AMD)股价下跌6%。

中低端芯片市场扩大:DeepSeek的技术创新,使得一些对算力要求不高的AI应用,可以采用中低端芯片。例如,中芯国际等企业的成熟制程芯片(如28nm),可用于满足这些低成本算力需求。

整体芯片需求增长:DeepSeek的低成本AI芯片方案,影响高端芯片的需求下降,但对AI技术的广泛应用却仍将推动整体芯片需求的增长。

对芯片技术创新的影响:

推动GPU技术创新:DeepSeek对计算资源的高效利用给GPU厂商带来压力,促使他们加大在硬件架构、计算性能、能耗比等方面的研发投入,推动GPU技术创新。

拓展GPU应用场景:DeepSeek展示了利用GPU进行大规模AI模型训练的高效性,会鼓励更多企业和研究机构在AI领域开展工作,拓展GPU在自然语言处理、图像识别、智能安防等更多AI应用场景中的应用。

数据中心产业链的变化:DeepSeek新一代开源模型以约2000台H800GPU就达到了前沿AI模型性能,训练成本远低于行业常规水平。这一突破性进展有可能从2026年开始重塑数据中心产业链格局。

对能源产业的影响:

由于大模型等这类算力平台,往往需要有持续且稳定的电力作为坚实的支撑。同时,在进行大规模的深度学习训练时,成千上万的计算节点同时工作,消耗了巨大的电能。DeepSeek通过算法优化等技术,AI模型训练时节约了电力消耗,可以缓解对能源的需求,也可减少碳排放,有利于环保。受DeepSeek大模型的影响,1月27日,美国联合能源公司股价下跌21%,Vistra的股价更是下跌29%。

三是对技术人员的巨大冲击

DeepSeek的新模式打破了美国堆砌算力为先导的“豪气”方式。但DeepSeek却利用算法对数据先进行总结和分类,经过选择性处理后再输送给大模型,从而优化算力、降低成本并大幅提升模型性能。相比之下,Meta耗费大量资金和人力训练Llama,而效果还不理想,这引发了美国企业技术人员的恐慌,担心在新的模式下自己会丢失工作。

美国等西方国家的反制措施

DeepSeek的崛起引发了美国等西方国家的强烈反应,对我国的高科技采取更严格的反制措施。包括:技术封锁与出口管制、国家安全调查、限制政府采购与使用、网络攻击与技术干扰、网络攻击、技术干扰、 知识产权与法律手段、资本市场打压、联合多国打压等手段。

最近,美国国会、五角大楼以及美国海军、空军、陆军等多军种正在逐步禁止访问DeepSeek;意大利、爱尔兰等国的数据保护部门,也要求DeepSeek就其个人信息处理政策进行详细说明;DeepSeek自1月3日起遭受多轮大规模网络攻击,攻击手段从简单的HTTP代理攻击逐步升级到复杂的模拟用户行为攻击;意大利的苹果商店和谷歌商店已全部下架了DeepSeek软件;等等。

这些反制措施反映了美国等西方国家对中国AI技术快速发展的担忧,以及其试图维护自身科技霸权的决心。然而,这种封锁和打压策略将反而会激发中国在AI领域的自主创新,推动技术的进一步发展。打压华为的结果如此,限制DeepSeek更将如此!

0 阅读:0

富仔视角

简介:感谢大家的关注