智譜發(fā)布首個具備深度研究和操作能力的AI Agent

作者：愛集微 03-31 15:26

來源：智譜 #沉思# #智譜# #AI Agent#

4869

3月31日，智譜在中關村論壇上正式發(fā)布AutoGLM沉思，這一全新智能體不僅具備深度研究能力（Deep Research），還能實現(xiàn)實際操作（Operator），真正推動AI Agent進入“邊想邊干”的階段。

AutoGLM沉思的技術演進路徑包括：GLM-4基座模型 → GLM-Z1推理模型 → GLM-Z1-Rumination沉思模型 → AutoGLM模型。其中核心鏈路的模型和技術，我們將于4月14日正式開源，以推動行業(yè)生態(tài)發(fā)展。

“讓機器像人一樣思考”，智譜始終專注于AGI的基座模型研發(fā)，目前已經(jīng)探索到L3-Agentic LLM階段。在行業(yè)生態(tài)方面，智譜堅持和行業(yè)伙伴共創(chuàng)，用其在大模型研發(fā)上的積累幫助行業(yè)伙伴成功，合力做出成功的大模型應用。智譜也積極推動中國原創(chuàng)大模型及解決方案出海，幫助“一帶一路”國家構建自主、可控、無幻覺的國家級/區(qū)域級自主大模型。

AutoGLM沉思

在AI Agent的發(fā)展過程中，智譜始終在不斷探索和創(chuàng)新。從最早推出具備Function Call能力的智譜清言（2023.10），到率先上線支持智能體編排的GLMs（2024.1），再到推出全球首個設備操控智能體AutoGLM（2024.10），智譜一直引領AI Agent 上界的探索。

今天，智譜推出全新的AutoGLM沉思模型，全球首個集深度研究與實際操作能力于一體的Agent。這是自主智能體技術的一次重要進步，也是設備操控智能體的進一步升級。

AutoGLM沉思體現(xiàn)了智譜對AI Agent的核心理解：讓機器不僅能夠思考，還能主動行動，實現(xiàn)“邊想邊干”的目標。

這一能力的實現(xiàn)依賴于三個關鍵特性：

深度思考：能夠模擬人類在面對復雜問題時的推理與決策過程。
感知世界：能夠像人一樣獲取并理解環(huán)境信息。
工具使用：能夠像人一樣調用和操作工具，完成復雜任務。

AutoGLM沉思融合了以上三大能力。與OpenAI 的 Deep Research不同，它不僅能深入研究，還能真正執(zhí)行任務，推動AI Agent從單純的思考者，進化為能交付結果的智能執(zhí)行者。

官網(wǎng)點擊此處

AutoGLM 沉思背后的模型，是我們全新推出的Agent大腦——沉思模型，即通過強化學習，讓模型學會自我批評、反思、甚至沉思，實現(xiàn)長程推理和任務執(zhí)行。

目前，AutoGLM沉思在智譜清言PC客戶端上線，用戶可免費體驗其研究能力和操作能力。此次發(fā)布的為 preview版本，核心支持 research 場景；在未來兩周，我們將進一步擴展更多智能體執(zhí)行能力。包括推出“虛擬機”版本，進一步增強AI Agent的實際落地能力。

沉思功能，目前已經(jīng)正式上線智譜清言網(wǎng)頁端、PC端和手機 App，免費、不限量地開放給大家。這也是國內首個正式開放的Deep Research功能。

GLM系列模型

「AutoGLM沉思」模型的背后，是智譜自主研發(fā)的全棧大模型技術，融合了GLM-4的通用能力、GLM-Z1的反思能力、GLM-Z1-Rumination的沉思能力，以及AutoGLM的自動執(zhí)行能力。

1、新版基座模型

基于最新的技術積累，我們重新訓練了一個320億參數(shù)的基座模型 GLM-4-Air-0414，在預訓練階段加入了更多的代碼類、推理類數(shù)據(jù)，并在對齊階段針對智能體能力進行了優(yōu)化，模型在工具調用、聯(lián)網(wǎng)搜索、代碼等智能體任務上的能力得到大大加強。

GLM-4-Air-0414 以 32B 參數(shù)量比肩更大參數(shù)量的國內外主流模型，這使得模型在適配智能體任務方面特別有效。這是因為智能體任務往往涉及多輪復雜交互，32B的參數(shù)量使得 GLM-4-Air-0414 能快速執(zhí)行復雜任務，為AI智能體的真正大規(guī)模落地應用提供了堅實基礎。

2、新版推理模型

基于 GLM-4-Air-0414，智譜引入了更多推理類數(shù)據(jù)，并在對齊階段深度優(yōu)化了通用能力，推出了全新的深度思考模型 GLM-Z1-Air。

在性能表現(xiàn)上，可以與DeepSeek-R1（671B，激活37B）媲美。我們在 AIME 24/25、LiveCodeBench、GPQA 等基準測試中對 GLM-Z1-Air 進行了評估，評估結果顯示 GLM-Z1-Air 展現(xiàn)了較為強大的數(shù)理推理能力，為更多復雜任務的解決提供了支持：

在推理速度上，GLM-Z1-Air相比 R1 提升了8倍，成本可以降低至1/30，實現(xiàn)高性能與高性價比的雙重突破。

此外，GLM-Z1-Air可在消費級顯卡上運行。為了更進一步解放開發(fā)者在硬件方面的限制。

我們也在MAAS平臺上將免費模型 GLM-4-Flash 的基座版本更新至 GLM-4-Flash-0414，并推出了對應的推理版本 GLM-Z1-Flash，在保留大部分效果的情況下更輕量級、更高速，完全免費調用，以適用于更廣泛的應用場景。

3、沉思模型

基于GLM-Z1，我們通過擴展強化學習訓練，提升了模型結合工具使用完成長程推理能力，訓練出沉思模型GLM-Z1-Rumination。

該模型突破了傳統(tǒng)AI單純依賴內部知識推理的局限，創(chuàng)新性地結合實時聯(lián)網(wǎng)搜索、動態(tài)工具調用、深度分析和自我驗證，形成完整的自主研究流程：

實時搜索：主動獲取最新信息，突破信息孤島。
深度分析：進行多角度邏輯推理，避免單一思維路徑。
動態(tài)驗證：不斷修正假設，提高研究的準確性與邏輯性。

GLM-Z1-Rumination 能夠主動理解用戶需求，在復雜任務中不斷優(yōu)化推理、反復驗證與修正假設，使研究成果更具可靠性與實用性。相比于傳統(tǒng)的推理模型，我們期待沉思模型引領AI助手進入一個“高智商”到“高智商+高自主”的階段，能夠自主完成更復雜、更深入的研究任務。

4、AutoGLM

智譜的AutoGLM系列再次取得重要進展。

在斯坦福大模型中心《AI指數(shù)2024》選定的智能體基準評測AgentBench上，AutoGLM系列模型在5個測試環(huán)境中也取得了 SOTA的成績。其中，在Phone Use基準（AndroidLab & AndroidWorld）中，AutoGLM-Phone的任務成功率較此前最佳成績提升超過20%；在Browser Use基準上，AutoGLM-Web也全面超越OpenAI GPT-4o和Anthropic Claude-3.5-Sonnet，展現(xiàn)了在網(wǎng)頁交互場景中的領先能力。

在GUI智能體領域，智譜自研模型GLM-PC（CogAgent）在多個權威評測榜單上取得SOTA 成績。憑借僅9B的參數(shù)，CogAgent超越了包括GPT-4o + UGround、Claude Computer Use等更大規(guī)模的同類模型或商用API。

上述模型將于4月14日開源。并將在未來兩周內陸續(xù)上線MaaS平臺（bigmodel.cn）。

合作與成功

2025年無疑是AI Agent的爆發(fā)之年，智譜將戰(zhàn)略聚焦Agentic GLM的研發(fā)，以推動智能體技術的快速發(fā)展。

在技術方面，智譜將依托原創(chuàng)自主大模型技術，持續(xù)推動具備邏輯推理和深度思考能力的Agent基座模型與通用基座模型的研發(fā)，再到智能體框架與Agent應用，朝著讓機器像人一樣思考和行動的目標不斷前進。

智譜還將搭建Agentic LLM平臺，助力生態(tài)合作伙伴利用智譜模型與智能體的強大能力，構建行業(yè)、地域與場景深度融合的智能體應用。

在行業(yè)生態(tài)方面，智譜將作為模型廠商，始終致力于幫助應用合作伙伴在GLM模型上實現(xiàn)成功的大模型應用。目前，我們已攜手金融、教育、醫(yī)療、政務、企服等領域的合作伙伴，共同推進Agentic LLM的落地應用。

與此同時，智譜也相繼與北京、杭州、上海、成都、珠海等城市達成合作，與當?shù)佚堫^企業(yè)攜手推動當?shù)卮竽Ｐ蛻蒙鷳B(tài)的建設。

作為一家朝向 AGI 的公司，智譜不僅致力于推動國產(chǎn)大模型技術的發(fā)展，也希望能為世界貢獻中國AI力量。我們在積極推動中國原創(chuàng)大模型及解決方案出海，幫助“一帶一路”國家構建自主、可控、無幻覺的國家級/區(qū)域級的自主大模型。由智譜主導，來自東盟十國及“一帶一路”沿線的10個國家共同發(fā)起了“自主大模型國際共建聯(lián)盟”正式成立，幫助“一帶一路”國家建立自主AI，構建可控的國家級AI基礎設施。