科技圈沸腾!马斯克与 DeepSeek 的巅峰对决,全新 AI 震撼登场!

科技圈沸腾!马斯克与DeepSeek的巅峰对决,全新AI震撼登场!

今天,科技界迎来了一场震撼全球的风暴!马斯克旗下的xAI重磅发布了最新大模型Grok-3,几乎在同一时刻,DeepSeek也不甘示弱,强势推出了NSA,一场没有硝烟的AI大战就此拉开帷幕!

DeepSeek的秘密武器——NSA

2月18日,DeepSeek在社交平台X上投下了一颗“技术炸弹”,发布了一篇关于NSA的纯技术论文报告。这NSA究竟是什么来头?它可是一种与硬件高度适配,能原生训练的稀疏注意力机制,简直就是为超高速长上下文训练与推理而生!

NSA的核心组件十分强大,动态分层稀疏策略、粗粒度的Token压缩、细粒度的Token选择,这些黑科技的组合,让NSA如虎添翼。DeepSeek自信满满地表示,通过针对现代硬件的优化设计,NSA在提升推理速度的同时,还能降低预训练成本,并且性能丝毫不打折扣!在通用基准测试、长上下文任务以及基于指令的推理中,NSA的表现堪称惊艳,甚至能与全注意力模型一较高下,媲美甚至超越它们。

科技圈沸腾!马斯克与 DeepSeek 的巅峰对决,全新 AI 震撼登场!

马斯克的超级杀器——Grok-3

同一天,埃隆·马斯克也没闲着,xAI正式发布了最新的大模型Grok-3。马斯克更是毫不吝啬赞美之词,直接称其为“地球上最聪明的人工智能”,这口气可不小!不过,Grok-3确实有让人服气的实力,在多项技术和性能上实现了重大突破。

马斯克在直播中那叫一个意气风发,他透露,在数学、科学和编程等基准测试中,Grok-3把Alphabet旗下的Google Gemini、DeepSeek的V3模型、Anthropic的Claude和OpenAI的GPT-4o都甩在了身后。不仅如此,Grok-3的计算能力比前代版本提升了10倍以上,并且早在今年1月初就完成了预训练。

科技圈沸腾!马斯克与 DeepSeek 的巅峰对决,全新 AI 震撼登场!

Grok-3采用了“思维链”(Chain of Thought)技术,能够模拟人类逐步推理的过程,在现场演示中,被要求解决一个复杂的物理问题——计算从地球到火星的转移轨迹,并绘制3D动画。xAI特别强调,这一任务完全没有预设脚本,Grok-3仅通过简短指令“生成地球发射、火星着陆以及下一次发射窗口返回地球的动画3D图”就开始操作。结果,Grok-3成功理解复杂的物理计算并生成可视化图形,这实力,不服不行!

为了训练Grok-3,xAI也是下了血本,搭建了由20万张英伟达H100 GPU组成的超大规模计算集群,正是这强大的算力,让Grok-3的训练效率和模型性能大幅提升。

此外,xAI还推出了名为DeepSearch的智能搜索引擎,集成于Grok-3中。这个引擎可厉害了,能够扫描互联网和X平台上的信息,并以摘要形式回应用户查询,提供更高效、精准的信息检索服务。不仅如此,Grok-3具备自我纠正机制,还引入了人类反馈循环和情境训练,确保回答更准确、自然。

马斯克的Grok-3和DeepSeek的NSA,你更看好谁呢?

原创文章,作者:产品大法师VIP Plus,如若转载,请注明出处:https://www.pmtemple.com/fengsaitao/17221/

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年2月17日 下午12:55
下一篇 2025年2月19日 上午9:01

相关推荐

发表回复

登录后才能评论
微信公众号
微信公众号
edgesensor_high 小程序
小程序
分享本页
返回顶部