麻豆国内精品欧美在线-麻豆国内精品久久久久久-麻豆国产在线观看一区二区-麻豆国产在线观看免费-麻豆国产原创-麻豆国产一区二区在线观看

“地球上最聰明AI”Grok 3發布,頭部大模型之爭愈演愈烈快訊

TechWeb.com.cn 2025-02-18 18:02
分享到:
導讀

馬斯克團隊運行這段代碼,埃隆·馬斯克的人工智能初創公司xAI發布了Grok 3大模型,Grok3 推理系列模型更是達到了 90 及以上的分數。

【TechWeb】北京時間2月18日中午,埃隆·馬斯克的人工智能初創公司xAI發布了Grok 3大模型,馬斯克稱之為“地球上最聰明的人工智能”。Grok 3的發布,勢必將現在已經炙熱的模型之戰推向新的高潮。

Grok3的現場演示

在當天的直播中,馬斯克與該公司的三位工程師一起進行了現場演示,包括使用Grok3幫助火星飛船計算航天發射窗口,以及把俄羅斯方塊和消消樂兩款游戲“融合成一款”等。

尤其是工程師僅用“開發結合俄羅斯方塊和寶石迷陣玩法的2D游戲”這一自然語言指令,Grok3完成核心代碼生成與調試的演示令人印象深刻。

在演示的過程中,馬斯克要求使用Grok 3使用pygame組件設計一款游戲,把俄羅斯方塊和寶石迷陣縫合到一起。

同時還提示代碼可能會很長,需要保存到一個文件當中,運行成功后,生成的游戲即保留了俄羅斯方塊的經典玩法,而且還加入了“同色消除”的新規則。

在發布會上,馬斯克放話,今后Space X的發射任務,包括2026年火星探索任務,都將會借助Grok 3進行AI輔助。

隨后,在場的工程師要求Grok 3現場生成一段太空發射3D動畫的代碼,而在Grok-3生成代碼后,馬斯克團隊運行這段代碼,之后畫面上顯示出了飛船在地球和火星間往返的動畫的演示,突出了Grok-3的編程能力,這對AI模型理解復雜物理知識的要求非常高。

馬斯克對此表示,我們非常高興能夠推出 Grok-3,我們認為,在很短的時間內,它的功能比Grok-2強大一個數量級。這要歸功于一支不可思議的團隊的辛勤工作,我很榮幸能與這樣一支優秀的團隊合作。此外,他還預測,三年內,計算機將在各方面打破人類水平,實現諾貝爾獎級別突破。

推理能力超競爭對手

發布會演示顯示,在數學推理、科學邏輯推理等多方面的性能表現上,Grok3和Grok-3 mini都超過或媲美Gemini、DeepSeek和ChatGPT等對手,此外xAI還推出了功能更為強大的Grok3 Thinking推理模式。

具體表現在Grok3 在 AIME'24(美國數學競賽)、GPQA(研究生水平科學知識問答能力的基準測試)等測試中均取得了比 Gemini-2 pro、DeepSeek-v3、Claude 3.5 Sonnet 和 GPT-4o 更好的效果。

尤其在推理方面 ,Grok 3 Reasoning 和 Grok 3 mini Reasoning 在 AIME'24、GPQA 等測試中取得了壓倒性的優勢,最高分達到 96 分,超過了 o3 mini(high)、o1 和 DeepSeek-R1 等前沿模型。甚至在最新的 AIME 2025 評測中 ,Grok3 推理系列模型更是達到了 90 及以上的分數,稍微領先 o3 mini(high) 的 87 分。

此外,在 Chatbot Arena 評估中,Grok-3 的得分更是達到了 1400 分,同樣超過了 Gemini 系列和 chatgpt-4o 和 DeepSeek-R1。

值得一提的是,GPT-4o和Gemini相比,Grok 3在處理復雜問題時不僅能給出正確答案,還能詳細解釋解題思路,幫助用戶理解背后的邏輯。

除了數學、編程、推理能力超強外,Grok3的多模態能力也是提升明顯,另外,Grok 3引入了DeepSearch,它能夠掃描互聯網和X平臺(原Twitter),為用戶提供信息摘要,幫助用戶查找最新的科技信息。

在發布會現場,xAI團隊預測2025年NCAA“瘋狂三月”籃球賽的全部勝負結果,最終Grok 3給出了它認為的2025年NCAA冠軍,具體預測正確與否,答案即將在3月揭曉。

xAI團隊在直播中展示稱,在訓練Grok的過程中,團隊搭建了大型算力集群,并克服了散熱、電力等問題帶來的挑戰,用了122天讓首批10萬張GPU投入使用并正常運行,后續還計劃將集群規模繼續擴大一倍。

最后,馬斯克表示,未來,最快一周后Grok 將獲得“語音模式”。幾周后,Grok 3模型將與 DeepSearch功能一起出現在xAI企業的API中。而當下一個版本完全發布時,我們將開源Grok的上一個版本。

頗具挑戰意味的是,就在Grok 3發布前數小時,OpenAI首席執行官兼聯合創始人SamAltman表示,對于高要求的測試者來說,試用GPT-4.5帶來的AGI的感受體驗,遠比我預期的要深刻得多,看來GPT-4.5已經進入測試階段,離正式發布也不遠了。

可以預見,隨著Grok-3的發布,頭部AI大模型的競爭將愈演愈烈。(御風)

Grok 馬斯克 Grok- 模型 團隊
分享到:

1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。


主站蜘蛛池模板: 久久草福利自拍视频在线观看 | 欧美日韩亚洲国内综合网香蕉 | α级毛片 | 欧美大片一区二区 | 99re8在线精品视频免费播放 | 99国产小视频 | 色臀网站 | 思思玖玖玖在线精品视频 | 国产免费又粗又猛又爽视频国产 | 人人爱操| 天天草b| 欧美式禁忌 | 久久精品动漫99精品动漫 | 午夜国产福利视频一区 | 女人与zzzooooxxx| 国产悠悠视频在线播放 | 99re视频精品全部免费 | 99视频在线免费观看 | 91porny.首页 | 调教禽兽| 91在线视频国产 | 亚洲欧洲日产国码天堂 | haodiaose在线精品免费观看 | 91粉色视频在线导航 | 蜜桃视频在线观看官网 | 男人的影院 | 久久性综合亚洲精品电影网 | tube69中国露脸 | 四虎网站在线 | 精品福利一区 | 欧美操大逼视频 | 免费片在线观看 | 亚洲国产在线午夜视频无 | 欧美xxx000喷水 | 国产精品嫩草影院在线 | 日本伊人色综合网 | 亚洲aⅴ天堂 | 欧美日韩高清不卡一区二区三区 | 岛国不卡 | 99久久精品国语对白 | yellow高清视频日本动漫 |