7月10日,馬斯克旗下人工智能公司xAI正式發(fā)布其最新一代大語(yǔ)言模型Grok 4,并同步推出多智能體協(xié)作版本Grok 4 Heavy。Grok 4定位為“全球最強(qiáng)大的人工智能模型”。馬斯克宣稱,Grok 4的智能水平已經(jīng)“全面超越博士智力”,尤其在學(xué)術(shù)問(wèn)題上,它能在所有學(xué)科中達(dá)到甚至超越博士級(jí)別。馬斯克更樂(lè)觀預(yù)計(jì),Grok 4有望在今年內(nèi)為人類帶來(lái)“發(fā)現(xiàn)新技術(shù)”的突破,并可能在明年發(fā)現(xiàn)新的物理現(xiàn)象。
xAI介紹,Grok 4在訓(xùn)練計(jì)算量上實(shí)現(xiàn)了顯著飛躍,與Grok 2相比,其訓(xùn)練量增加了100倍。特別是在推理和強(qiáng)化學(xué)習(xí)(RL)方面,Grok 4投入了大量計(jì)算資源,其RL計(jì)算量是其他任何模型的10倍以上。這得益于xAI構(gòu)建的擁有10萬(wàn)塊H100 GPU的“世界超級(jí)計(jì)算機(jī)”。Grok 2在12個(gè)月前還只是一個(gè)概念,而如今的標(biāo)準(zhǔn)下,Grok 2的模型智能水平已相當(dāng)于高中生。
在多項(xiàng)嚴(yán)苛的基準(zhǔn)測(cè)試中,Grok 4展現(xiàn)出強(qiáng)大實(shí)力。在被稱為“人類最終考試”的HLI(Humanities Last Exam)基準(zhǔn)中,該模型在未使用工具的情況下解決了25%的問(wèn)題。而其多智能體版本Grok 4 Heavy,通過(guò)并行協(xié)作,進(jìn)一步將文本子集問(wèn)題的解決率提升至超過(guò)50%。此外,Grok 4還在包括PhD級(jí)別問(wèn)題集在內(nèi)的所有推理基準(zhǔn)測(cè)試中表現(xiàn)出色,甚至在編碼基準(zhǔn)和數(shù)學(xué)競(jìng)賽中取得了滿分,通常比第二名模型有顯著領(lǐng)先。
Grok 4的強(qiáng)大能力已在多個(gè)實(shí)際場(chǎng)景中得到驗(yàn)證。在模擬商業(yè)環(huán)境的“自動(dòng)售貨機(jī)基準(zhǔn)測(cè)試”中,Grok 4表現(xiàn)最佳,其創(chuàng)造的凈資產(chǎn)是第二名模型的兩倍,并能長(zhǎng)期堅(jiān)持其策略。它還能協(xié)助生物醫(yī)學(xué)研究,幫助科學(xué)家篩選數(shù)百萬(wàn)實(shí)驗(yàn)日志,快速提出最佳假設(shè),并已應(yīng)用于CRISPR研究。在游戲開(kāi)發(fā)領(lǐng)域,Grok 4展示了4小時(shí)內(nèi)生成第一人稱射擊游戲的能力,通過(guò)自動(dòng)化資產(chǎn)采購(gòu),大幅提升了開(kāi)發(fā)效率。它甚至能基于X平臺(tái)數(shù)據(jù)分析并預(yù)測(cè)世界杯賠率、查找特定內(nèi)容或生成復(fù)雜的時(shí)間線,并能生成大致正確的雙黑洞碰撞可視化。
目前,Grok 4及其多智能體版本Grok 4 Heavy已通過(guò)訂閱服務(wù)開(kāi)放使用。開(kāi)發(fā)者也可通過(guò)API接口訪問(wèn),其上下文長(zhǎng)度高達(dá)256K。xAI同時(shí)公布了Grok語(yǔ)音模式的顯著提升,端到端延遲降低一半,并引入了多款更自然、富有情感的新聲音,例如具有史詩(shī)般低沉聲線的Sal和能表達(dá)豐富情感的英倫女聲Eve。
盡管Grok 4在多模態(tài)理解(特別是圖像理解和生成)方面仍存在“部分盲點(diǎn)”,但xAI表示,其基礎(chǔ)模型的第七個(gè)版本(計(jì)劃在幾周內(nèi)完成訓(xùn)練)將解決這一弱點(diǎn),未來(lái)模型將能夠像人類一樣“聽(tīng)到和看到世界”。xAI正加速推進(jìn)視頻生成模型的訓(xùn)練,預(yù)計(jì)今年將出現(xiàn)首部可觀看的AI生成電視節(jié)目片段,明年有望出現(xiàn)首部AI電影。
公司強(qiáng)調(diào),未來(lái)將專注于開(kāi)發(fā)既“快速又智能”的模型,尤其是在編程領(lǐng)域。xAI認(rèn)為,人類正處于一個(gè)“巨大的智能爆發(fā)的開(kāi)端”,并預(yù)期AI將驅(qū)動(dòng)經(jīng)濟(jì)規(guī)模達(dá)到當(dāng)前數(shù)千甚至數(shù)百萬(wàn)倍。同時(shí),xAI也強(qiáng)調(diào)AI安全的重要性,認(rèn)為AI最重要的是要“最大限度地追求真相”,如同培養(yǎng)一個(gè)有正確價(jià)值觀的“超級(jí)天才兒童”。
未來(lái),xAI設(shè)想Grok與特斯拉Optimus類人形機(jī)器人結(jié)合,通過(guò)與現(xiàn)實(shí)世界的互動(dòng),將能更深層次地驗(yàn)證假設(shè),推動(dòng)AI能力的最終飛躍。