傳Meta新AI模型Llama 4將于本月發(fā)布但可能再延后

作者：愛集微 4小時(shí)前

來源：鉅亨網(wǎng) #Meta#

1616

根據(jù)美媒《The Information》周五 (4 日) 援引知情人是消息報(bào)導(dǎo)，Meta Platforms(META-US)計(jì)劃于本月發(fā)布其最新的語言模型 Llama 4，盡管該模型已經(jīng)至少兩次推遲。這是 Meta 為在人工智慧 (AI) 競(jìng)賽中爭(zhēng)奪領(lǐng)先地位所作的努力之一，但報(bào)導(dǎo)指出，Meta 可能會(huì)再次推遲 Llama 4 的發(fā)布。

隨著 OpenAI 的 ChatGPT 大獲成功，改變了科技領(lǐng)域的格局并推動(dòng)機(jī)器學(xué)習(xí)的投資，全球大型科技公司在 AI 基礎(chǔ)設(shè)施上積極投入。盡管如此，Llama 4 的開發(fā)并不一帆風(fēng)順。報(bào)導(dǎo)指出，Llama 4 在開發(fā)過程中未能達(dá)到 Meta 的技術(shù)基準(zhǔn)，特別是在推理和數(shù)學(xué)任務(wù)上表現(xiàn)不佳。

此外，Meta 也擔(dān)心 Llama 4 在進(jìn)行類人語音對(duì)話方面的能力不及 OpenAI 的模型，這也是推遲的原因之一。該報(bào)導(dǎo)提到，Meta 正積極考慮如何提升 Llama 4 的能力，以便在 AI 競(jìng)爭(zhēng)中不落人后。

在投資人的壓力下，Meta 計(jì)劃今年投入高達(dá) 650 億美元擴(kuò)展其 AI 基礎(chǔ)設(shè)施，這一舉措也是為了讓大型科技公司能夠顯示其投資回報(bào)。而來自中國科技公司 DeepSeek 的低成本 AI 模型的崛起，也挑戰(zhàn)了“開發(fā)最佳 AI 模型必須花費(fèi)數(shù)十億美元”的觀念。

報(bào)導(dǎo)稱，Llama 4 將會(huì)借鑒中國新創(chuàng)公司深度求索 (DeepSeek) 的一些技術(shù)，至少有一個(gè)版本預(yù)估會(huì)采用“專家混合”(Mixture of Experts)技術(shù)，這是一種讓模型的不同部分專注于特定任務(wù)的機(jī)器學(xué)習(xí)方法，從而使這些部分在特定領(lǐng)域內(nèi)成為專家。

此外，Meta 也考慮過先透過 Meta AI 發(fā)布 Llama 4，然后再將其作為開放原始碼軟體推出。去年的 Llama 3 模型可以說是 Meta 的一次突破，該模型不僅能夠進(jìn)行八種語言的對(duì)話，還能夠編寫更高品質(zhì)的電腦程式并解決比以往更復(fù)雜的數(shù)學(xué)問題。