根據(jù)美媒《The Information》周五 (4 日) 援引知情人是消息報(bào)導(dǎo),Meta Platforms(META-US)計(jì)劃于本月發(fā)布其最新的語言模型 Llama 4,盡管該模型已經(jīng)至少兩次推遲。這是 Meta 為在人工智慧 (AI) 競(jìng)賽中爭(zhēng)奪領(lǐng)先地位所作的努力之一,但報(bào)導(dǎo)指出,Meta 可能會(huì)再次推遲 Llama 4 的發(fā)布。
隨著 OpenAI 的 ChatGPT 大獲成功,改變了科技領(lǐng)域的格局并推動(dòng)機(jī)器學(xué)習(xí)的投資,全球大型科技公司在 AI 基礎(chǔ)設(shè)施上積極投入。盡管如此,Llama 4 的開發(fā)并不一帆風(fēng)順。報(bào)導(dǎo)指出,Llama 4 在開發(fā)過程中未能達(dá)到 Meta 的技術(shù)基準(zhǔn),特別是在推理和數(shù)學(xué)任務(wù)上表現(xiàn)不佳。
此外,Meta 也擔(dān)心 Llama 4 在進(jìn)行類人語音對(duì)話方面的能力不及 OpenAI 的模型,這也是推遲的原因之一。該報(bào)導(dǎo)提到,Meta 正積極考慮如何提升 Llama 4 的能力,以便在 AI 競(jìng)爭(zhēng)中不落人后。
在投資人的壓力下,Meta 計(jì)劃今年投入高達(dá) 650 億美元擴(kuò)展其 AI 基礎(chǔ)設(shè)施,這一舉措也是為了讓大型科技公司能夠顯示其投資回報(bào)。而來自中國科技公司 DeepSeek 的低成本 AI 模型的崛起,也挑戰(zhàn)了“開發(fā)最佳 AI 模型必須花費(fèi)數(shù)十億美元”的觀念。
報(bào)導(dǎo)稱,Llama 4 將會(huì)借鑒中國新創(chuàng)公司深度求索 (DeepSeek) 的一些技術(shù),至少有一個(gè)版本預(yù)估會(huì)采用“專家混合”(Mixture of Experts)技術(shù),這是一種讓模型的不同部分專注于特定任務(wù)的機(jī)器學(xué)習(xí)方法,從而使這些部分在特定領(lǐng)域內(nèi)成為專家。
此外,Meta 也考慮過先透過 Meta AI 發(fā)布 Llama 4,然后再將其作為開放原始碼軟體推出。去年的 Llama 3 模型可以說是 Meta 的一次突破,該模型不僅能夠進(jìn)行八種語言的對(duì)話,還能夠編寫更高品質(zhì)的電腦程式并解決比以往更復(fù)雜的數(shù)學(xué)問題。