xAI发布Grok-3,并基于其打造智能搜索引擎

聊点科技行叭 2025-02-19 07:00:37

继此前马斯克发布预告称,旗下AI创企xAI将发布新一代大模型Grok-3,并称其为 “地球上最聪明的AI”后。北京时间2月18日中午,Grok-3系列模型正式发布。

据了解,Grok-3系列模型包括Grok-3、Grok-3 mini,以及Grok-3 Reasoning、Grok-3 mini Reasoning等多个版本,其中Grok-3 Reasoning、Grok-3 mini Reasoning为推理模型,目前仍处于测试阶段,并且在训练过程中。

据了解,在xAI耗时8个月、采用10万块英伟达H100 GPU打造的Colossus超级计算机加持下,Grok-3的开发周期大幅缩短,且训练量是Grok-2的10倍。同时xAI方面还通过改进训练流程,引入合成数据集、自我纠错以及强化学习等技术,进一步提升了Grok-3的性能。

据xAI方面透露,Grok-3的性能比Grok-2提升了一个数量级,并且是一款“追求极致真实”的大模型。据称,在数学推理、科学逻辑推理和代码写作等能力表现方面,Grok-3在多项测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。例如在AIME(评估模型在数学问题上的表现)和 GPQA(测试模型在博士级别物理、生物和化学问题上的表现)中,Grok-3的表现已超过GPT-4o。

在 Chatbot Arena(LMSYS)中,早期版本Grok-3的得分取得了第一、达到1402分,超过了包括DeepSeek-R1在内的所有其他模型。据悉,Grok-3也成为有史以来首个在这一项目中突破1400分的模型。

值得一提的是,日前xAI方面还宣布其基于Grok-3打造了名为Deepsearch的智能搜索引擎。据了解, Deepsearch能够分析互联网和X平台的信息,并生成摘要回应用户的查询。对此xAI方面表示,Deepsearch是其第一代广泛代理工具,不仅能够帮助工程师、研究人员和科学家编写代码,而且可以助每位用户回答日常遇到的问题。

据了解,目前xAI方面已经推出Grok专属页面,供用户体验Grok-3。对此马斯克表示,“虽然我们也在积极与App Store对接,但因为上线这一平台需要满足合规等要求,所以我们最新的模型始终会是网页上的”。

需要注意的是,Grok-3将率先向X Premium Plus服务订阅用户开放。同时xAI还推出了一项全新的、适用于Grok模型的付费订阅服务Super Grok,“为那些想要最先进的功能和最早访问新功能的忠实粉丝提供”,该订阅的价格为每月30美元或每年300美元。

此外据马斯克透露,Grok-2将在Grok 3达到一般可用性(general availability)后开源。对此他表示,“我们的总体策略是在下一个版本完全推出后,开源上一个版本。当Grok-3成熟稳定后,大概在未来几个月内我们将开源Grok-2”。

0 阅读:2

聊点科技行叭

简介:感谢大家的关注