xAI發(fā)布Grok 4：10萬(wàn)H100打造，馬斯克宣稱“智力超越博士”

作者：集小微 5小時(shí)前

來(lái)源：鳳凰網(wǎng) #xAI# #Grok4#

1126

7月10日，馬斯克旗下人工智能公司xAI正式發(fā)布其最新一代大語(yǔ)言模型Grok 4，并同步推出多智能體協(xié)作版本Grok 4 Heavy。Grok 4定位為“全球最強(qiáng)大的人工智能模型”。馬斯克宣稱，Grok 4的智能水平已經(jīng)“全面超越博士智力”，尤其在學(xué)術(shù)問(wèn)題上，它能在所有學(xué)科中達(dá)到甚至超越博士級(jí)別。馬斯克更樂(lè)觀預(yù)計(jì)，Grok 4有望在今年內(nèi)為人類帶來(lái)“發(fā)現(xiàn)新技術(shù)”的突破，并可能在明年發(fā)現(xiàn)新的物理現(xiàn)象。

xAI介紹，Grok 4在訓(xùn)練計(jì)算量上實(shí)現(xiàn)了顯著飛躍，與Grok 2相比，其訓(xùn)練量增加了100倍。特別是在推理和強(qiáng)化學(xué)習(xí)（RL）方面，Grok 4投入了大量計(jì)算資源，其RL計(jì)算量是其他任何模型的10倍以上。這得益于xAI構(gòu)建的擁有10萬(wàn)塊H100 GPU的“世界超級(jí)計(jì)算機(jī)”。Grok 2在12個(gè)月前還只是一個(gè)概念，而如今的標(biāo)準(zhǔn)下，Grok 2的模型智能水平已相當(dāng)于高中生。

在多項(xiàng)嚴(yán)苛的基準(zhǔn)測(cè)試中，Grok 4展現(xiàn)出強(qiáng)大實(shí)力。在被稱為“人類最終考試”的HLI（Humanities Last Exam）基準(zhǔn)中，該模型在未使用工具的情況下解決了25%的問(wèn)題。而其多智能體版本Grok 4 Heavy，通過(guò)并行協(xié)作，進(jìn)一步將文本子集問(wèn)題的解決率提升至超過(guò)50%。此外，Grok 4還在包括PhD級(jí)別問(wèn)題集在內(nèi)的所有推理基準(zhǔn)測(cè)試中表現(xiàn)出色，甚至在編碼基準(zhǔn)和數(shù)學(xué)競(jìng)賽中取得了滿分，通常比第二名模型有顯著領(lǐng)先。

Grok 4的強(qiáng)大能力已在多個(gè)實(shí)際場(chǎng)景中得到驗(yàn)證。在模擬商業(yè)環(huán)境的“自動(dòng)售貨機(jī)基準(zhǔn)測(cè)試”中，Grok 4表現(xiàn)最佳，其創(chuàng)造的凈資產(chǎn)是第二名模型的兩倍，并能長(zhǎng)期堅(jiān)持其策略。它還能協(xié)助生物醫(yī)學(xué)研究，幫助科學(xué)家篩選數(shù)百萬(wàn)實(shí)驗(yàn)日志，快速提出最佳假設(shè)，并已應(yīng)用于CRISPR研究。在游戲開(kāi)發(fā)領(lǐng)域，Grok 4展示了4小時(shí)內(nèi)生成第一人稱射擊游戲的能力，通過(guò)自動(dòng)化資產(chǎn)采購(gòu)，大幅提升了開(kāi)發(fā)效率。它甚至能基于X平臺(tái)數(shù)據(jù)分析并預(yù)測(cè)世界杯賠率、查找特定內(nèi)容或生成復(fù)雜的時(shí)間線，并能生成大致正確的雙黑洞碰撞可視化。

目前，Grok 4及其多智能體版本Grok 4 Heavy已通過(guò)訂閱服務(wù)開(kāi)放使用。開(kāi)發(fā)者也可通過(guò)API接口訪問(wèn)，其上下文長(zhǎng)度高達(dá)256K。xAI同時(shí)公布了Grok語(yǔ)音模式的顯著提升，端到端延遲降低一半，并引入了多款更自然、富有情感的新聲音，例如具有史詩(shī)般低沉聲線的Sal和能表達(dá)豐富情感的英倫女聲Eve。

盡管Grok 4在多模態(tài)理解（特別是圖像理解和生成）方面仍存在“部分盲點(diǎn)”，但xAI表示，其基礎(chǔ)模型的第七個(gè)版本（計(jì)劃在幾周內(nèi)完成訓(xùn)練）將解決這一弱點(diǎn)，未來(lái)模型將能夠像人類一樣“聽(tīng)到和看到世界”。xAI正加速推進(jìn)視頻生成模型的訓(xùn)練，預(yù)計(jì)今年將出現(xiàn)首部可觀看的AI生成電視節(jié)目片段，明年有望出現(xiàn)首部AI電影。

公司強(qiáng)調(diào)，未來(lái)將專注于開(kāi)發(fā)既“快速又智能”的模型，尤其是在編程領(lǐng)域。xAI認(rèn)為，人類正處于一個(gè)“巨大的智能爆發(fā)的開(kāi)端”，并預(yù)期AI將驅(qū)動(dòng)經(jīng)濟(jì)規(guī)模達(dá)到當(dāng)前數(shù)千甚至數(shù)百萬(wàn)倍。同時(shí)，xAI也強(qiáng)調(diào)AI安全的重要性，認(rèn)為AI最重要的是要“最大限度地追求真相”，如同培養(yǎng)一個(gè)有正確價(jià)值觀的“超級(jí)天才兒童”。

未來(lái)，xAI設(shè)想Grok與特斯拉Optimus類人形機(jī)器人結(jié)合，通過(guò)與現(xiàn)實(shí)世界的互動(dòng)，將能更深層次地驗(yàn)證假設(shè)，推動(dòng)AI能力的最終飛躍。