光速光合成員企業(yè)智譜攜基座大模型GLM-4-Plus亮相KDD

作者：愛集微 2024-09-03

來源：光速光合 #光速光合# #智譜#

2.6w

在 KDD 國際數(shù)據(jù)挖掘與知識發(fā)現(xiàn)大會上，智譜 GLM 團隊介紹了新一代基座大模型GLM-4-Plus。GLM-4-Plus 是智譜全自研 GLM 大模型的最新版本，它標(biāo)志著智譜繼續(xù)瞄準(zhǔn)通用人工智能，持續(xù)推進(jìn)大模型技術(shù)的獨立自主創(chuàng)新。

主要更新：

語言基座模型 GLM-4-Plus：在語言理解、指令遵循、長文本處理等方面性能得到全面提升，保持了國際領(lǐng)先水平。
文生圖模型 CogView-3-Plus：具備與當(dāng)前最優(yōu)的 MJ-V6 和 FLUX 等模型接近的性能。
圖像/視頻理解模型 GLM-4V-Plus：具備卓越的圖像理解能力，并具備基于時間感知的視頻理解能力。該模型將上線開放平臺（ bigmodel.cn ），并成為國內(nèi)首個通用視頻理解模型 API 。
視頻生成模型 CogVideoX：在發(fā)布并開源 2B 版本后，5B 版本也正式開源，其性能進(jìn)一步增強，是當(dāng)前開源視頻生成模型中的最佳選擇。
智譜開源模型累計下載量已突破 2000 萬次，為開源社區(qū)的發(fā)展做出了重要貢獻(xiàn)。

最新基座大模型 GLM-4-Plus上線

GLM-4-Plus 使用了大量模型輔助構(gòu)造高質(zhì)量合成數(shù)據(jù)以提升模型性能；利用 PPO 有效提升模型推理（數(shù)學(xué)、代碼算法題等）表現(xiàn)，更好反應(yīng)人類偏好。

下面是 benchmark 對比：

語言文本能力方面，GLM-4-Plus 和 GPT-4o 及 405B 參數(shù)量的 Llama3.1 相當(dāng)。

Language capabilities

LCB: LiveCodeBench

NCB: NaturalCodeBench

* represents reproduced results

長文本能力比肩國際先進(jìn)水平。通過更精準(zhǔn)的長短文本數(shù)據(jù)混合策略，取得了更強的長文本的推理效果。

Long Context evaluation

GLM-4V-Plus 在圖像和視頻理解能力方面位居前列。GLM-4V-Plus 還可以理解網(wǎng)頁內(nèi)容，并將其轉(zhuǎn)換為 html 代碼。

Vision capabilities

GLM-4V-Plus 能夠理解并分析復(fù)雜的視頻內(nèi)容，同時具備時間感知能力。上線開放平臺后，將提供國內(nèi)首個通用視頻理解模型 API 。

Video analysis

文生圖模型迎來最新版本CogView-3-Plus，其效果接近目前最佳的 MJ-V6 及 FLUX 等模型，并支持圖片編輯功能。

圖片示例：

GLM-4-Plus 現(xiàn)已在智譜大模型開放平臺 bigmodel.cn 部署，開發(fā)者即日起就能通過 API 方式調(diào)用這一智譜最新基座大模型。

清言 app 迎來重要更新

全新的“視頻通話”功能來了！

智譜很高興宣布清言 app 迎來“視頻通話”功能，這也是國內(nèi)首個面向 C 端開放的視頻通話功能。

清言作為第一批 C 端上線的大模型產(chǎn)品，過去的一年，常常以文字和語音的形式和大家交流。但從今天起，清言也有了眼睛，解鎖了 AI 新體驗。

清言視頻通話跨越了文本模態(tài)、音頻模態(tài)和視頻模態(tài)，并具備實時推理的能力?，F(xiàn)在，用戶撥打清言的視頻通話窗口，即可與它進(jìn)行流暢通話，即便頻繁打斷它也能迅速反應(yīng)。只要打開攝像頭，我們看到的畫面，清言也可以看到，同時可以聽懂指令并準(zhǔn)確執(zhí)行。這樣的體驗就如同和真人視頻通話一樣。

清言 app 視頻通話功能于8 月 30 日上線，首批面向清言部分用戶開放，同時開放外部申請。我們會持續(xù)迭代并逐步放開規(guī)模，盡快讓全員都可以使用。

“視頻通話”功能 demo：

隨著視頻通話功能的加入，清言 app 成為首個可以通過文本、音頻、視頻和圖像來進(jìn)行多模態(tài)互動的 AI 助手。

掃描下方二維碼申請，體驗清言 app “視頻通話”功能～

CogVideoX-5B 開源

GLM-4-Flash 免費

智譜一如既往推動 AI 普惠。

繼 CogVideoX 2B 版本開源后，5B 版本也于近日正式開源，性能更強，推理顯存需求最低僅為 11.4 GB。同時 CogVideoX-2B 的開源協(xié)議調(diào)整為更加開放的 Apache 2.0 協(xié)議，任何企業(yè)與個人均可自由使用。隨著 CogVideoX-5B 的開源，智譜不僅在開源模型數(shù)量上領(lǐng)先，累計下載量也突破 2000 萬次，智譜以實際行動為國際開源社區(qū)做出自己應(yīng)有貢獻(xiàn)。

隨著技術(shù)進(jìn)步、效率提升和成本優(yōu)化，智譜很高興宣布大模型開放平臺 bigmodel.cn 最具性價比的大模型，GLM-4-Flash 現(xiàn)已完全免費，用戶可以通過調(diào)用 GLM-4-Flash 快速、免費地構(gòu)建你的專屬模型和應(yīng)用。這也是智譜開放平臺首個完全免費的大模型 API。

專注于大模型的中國創(chuàng)新

最新推出的基座大模型，和此前發(fā)布的 CogVideoX 等模型一道，完善了智譜自主原創(chuàng)的全棧大模型譜系，推動智譜實現(xiàn)面向世界先進(jìn)水平的全面對標(biāo)。

視頻通話功能是清言 app 繼 7 月上線生成視頻功能清影 Ying 后又一重大更新。通過小步快走持續(xù)迭代，智譜努力讓大模型技術(shù)更好賦能更多用戶。

隨著開源模型和開放平臺模型的廣受歡迎，智譜也將繼續(xù)推動 AI 力量惠及更多人群。通過大模型鏈接物理世界億級用戶，智譜致力于為千行百業(yè)帶來持續(xù)創(chuàng)新與變革，加速邁向通用人工智能時代。