馬斯克口中的“地球最聰明AI”來了!
北京時間2月18日,埃隆?馬斯克旗下xAI公司正式發布最新一代大模型Grok 3。“Grok 3具有極強推理能力,在我們迄今為止所做的測試中,其表現優于我們所知的任何已發布產品。”馬斯克稱之為“地球最聰明的AI”,并表示“我們有信心Grok 3會比其他任何AI都強,將成為AI領域真正的顛覆者”。
根據官方公布的測試數據,Grok3和Grok3 mini在數學、科學、代碼等性能上都超過或媲美Gemini、DeepSeek和ChatGPT等對手。具備推理能力的Grok3 Reasoning Beta和Grok3 mini Reasoning則是超越了類似的推理模型,包括DeepSeek-R1和OpenAI的o3 mini等。
在現場演示過程中,xAI展示了Grok 3的推理+編程能力,其中一個問題是“生成3D動畫代碼,演示從地球發射、著陸火星,然后在下一個發射窗口返回地球的過程”。經過近兩分鐘的思考,Grok 3生成了可以直接跑起來的python代碼,3D動畫可以運行,但是否正確還有待驗證。
據悉,Grok 3是Grok的第三代版本,被視作OpenAI最新的旗艦模型o3的競品。馬斯克強調,Grok3可以減少AI幻覺,方法是通過來回檢查數據并嘗試實現邏輯一致性。他還透露,訓練Grok3所使用的算力遠多于此前的版本,并使用了大量合成數據。
不同于DeepSeek的算法優化路徑(DeepSeek-V3用2048個H800 GPU,訓練2788千小時),xAI透露,Grok3的開發得益于用8個月時間建成的Colossus超級計算機,它由10萬個英偉達的H100 GPU驅動,為訓練提供了2億個GPU小時,比Grok2多了十多倍。
xAI團隊介紹,Grok3的性能比Grok2提升了一個數量級,并引入了“思維鏈”(Chain Of Thought)推理能力,讓其能夠像人類認知過程一樣逐步處理復雜任務。不過,一切還處在早期階段,Grok 3仍在訓練中。今天發布會現場展示的只是Grok 3推理模型的一部分。
馬斯克透露,Grok計劃以聊天機器人的形態在X平臺、獨立網站以及iOS應用上與用戶見面。雖然網頁和iOS版本已準備就緒,但語音模式還需等待大約1周的時間才能正式上線。而且,為了滿足開發者的需求,Grok后續還會開放API,方便開發者將其集成到更多的應用場景中,進一步釋放Grok的潛力。
此外,記者了解到,近日xAI公司正尋求一輪約100億美元的融資,此輪融資將使公司估值達到約750億美元。包括紅杉資本、Andreessen Horowitz以及Valor Equity Partners在內的現有投資者正在洽談參與此次交易。
值得一提的是,就在xAI發布Grok3前的幾個小時,其競爭對手公司OpenAI首席執行官兼聯合創始人SamAltman于凌晨在社交平臺表示:“對于高要求的測試者來說,試用GPT-4.5的體驗,遠比我預期的要深刻得多!”業內人士預計,這說明GPT-4.5已經進入測試階段,離正式發布的時間非常近了。
