圖 / Manus 宣傳視頻
(文/姜羽桐)9天前的晚10點,隨著ID為“hidecloud”的用戶在B站按下發(fā)布鍵,由中國團隊開發(fā)的全球首款通用型AI Agent產(chǎn)品Manus突然上線。令人意外的是,這家名為“蝴蝶效應”的初創(chuàng)公司只是輕扇翅膀,卻在大洋兩岸掀起了AI巨浪。
但與DeekSeek的廣泛贊譽不同,Manus口碑迅速陷入了兩極分化的爭議中,以至于創(chuàng)始團隊不得不數(shù)次出面澄清或回應。擁躉視為AI Agent產(chǎn)品的“DeekSeek時刻”,外媒稱贊“AI新星”;而質(zhì)疑者指其“技術(shù)門檻不高”且存在“套殼炒作”之嫌,體驗差強人意?,F(xiàn)實中,當慕名而來的嘗鮮者試圖進入Manus,卻發(fā)現(xiàn)內(nèi)測邀請碼早已成為一樁生意,一度炒到5萬元人民幣,各大社交平臺爭相分享申請攻略……
Manus的獨特價值在哪里?是相信大模型的力量,還是AI Agent找到了新路徑?
一碼難求的“超級整合者”
與DeekSeek不同,Manus出場方式非?!癎PT”。采用OpenAI新品發(fā)布類似的方式,季逸超(Peak)以Manus聯(lián)合創(chuàng)始人兼首席科學家的身份在一段4分17秒時長的視頻里詳細介紹了這款AI Agent的功能。他表示:“這(Manus)不僅僅是另一個聊天機器人或工作流,它是一個真正的主體,彌合概念和執(zhí)行之間的差距?!?/p>
圖 / Manus基準測試
宣傳視頻中,Manus展示了3個應用案例,其功能不限于提供解決方案,還能自主完成用戶下達的復雜指令,如生成報告、分析財經(jīng)數(shù)據(jù)等。而在基準測試中,其在GAIA(通用AI助手評估)基準測試中,得分超越OpenAI的Deep Research功能,取得SOTA的成績,即模型或算法的性能達到當前最好的水平。
為獲得真實體驗,被吸引來的用戶紛紛開始搜索Manus。但由于Manus采用邀請體驗機制,目前只能通過官網(wǎng)預約、社交媒體活動或合作伙伴渠道獲取邀請碼,可謂吊足胃口。而最夸張的情況下,一個Manus內(nèi)測邀請碼在二手交易平臺上被炒到數(shù)萬元人民幣,甚至有賬號標價“70萬”!
圖 / “高價”內(nèi)測邀請碼
跨境電商從業(yè)者孫蕓(化名)向集微網(wǎng)分享了自己獲得內(nèi)測邀請碼的經(jīng)歷。3月6日晚間,她向Manus發(fā)送了20余字的申請,并在8日獲得內(nèi)測邀請碼。在實際使用中,Manus給她的感受是“比想象中要慢”,制作一份跨境電商上架頁面內(nèi)容用了半個小時。但她表示:“從結(jié)果看,與某些大模型相比,給出的內(nèi)容的確屬于再進階一個版本,變得更人性化,上傳的22張圖片處理得非常細致,甚至還在文檔中提供了運營優(yōu)化建議?!?/strong>而孫蕓的最新使用體驗是,Manus的反饋時間變得更慢了……
獲得內(nèi)測邀請碼似乎成為一種“玄學”,使得Manus飽受批評,人們認為透過自媒體鋪天蓋地的宣傳、限制性發(fā)放邀請碼等方式去造勢,并不恰當。而針對“饑餓營銷”的質(zhì)疑,Manus合伙人張濤澄清“從未投入任何市場推廣預算”,邀請碼機制是“服務(wù)器容量有限不得已而為之”。3月12日,集微網(wǎng)以體驗的名義發(fā)去郵件,截至發(fā)稿日未收到邀請碼。
據(jù)悉,Manus采用的多智能體(Multiple Agent)架構(gòu),其完全運行在獨立虛擬機中,同時可以在虛擬環(huán)境中調(diào)用各類工具。在該架構(gòu)中,每個智能體基于獨立的語言模型或強化學習模型。
云知聲云知學院總經(jīng)理劉露婕向集微網(wǎng)介紹:“多智能體協(xié)同架構(gòu),像是模仿人類團隊成員的分工,通過規(guī)劃Agent拆解任務(wù)、執(zhí)行Agent調(diào)用工具、驗證Agent交叉審核,然后用可視化的方式絲滑呈現(xiàn),以虛擬界面‘Manus的電腦’展示任務(wù)執(zhí)行過程,提升用戶信任感與參與感,而人類是可以在過程中插手接管的,通過一系列的垂直場景深度優(yōu)化,已經(jīng)超越以往RPA工具的能力邊界。”
“從技術(shù)的角度看,Manus的亮點集中于工程化創(chuàng)新而非底層算法。它將大模型的推理能力與各種組件深度融合,動態(tài)調(diào)用多種專業(yè)工具協(xié)同工作,實現(xiàn)跨平臺任務(wù)的自動化流水線作業(yè)?!眲⒙舵颊f。簡單理解,Manus更像是一個“超級整合者”。
是“巨人”托舉還是復刻套殼
扇動風暴的Manus,其核心創(chuàng)始團隊有3人,分別是90后創(chuàng)始人肖弘、聯(lián)合創(chuàng)始人兼首席科學家季逸超,以及80后的合伙人張濤。這是一支非常年輕的隊伍,也因此在Manus推出的過程中受到業(yè)界諸多質(zhì)疑。
Manus爆紅不足3日,隸屬于國內(nèi)AI Agent初創(chuàng)公司DeepWisdom(深度賦智)的MetaGPT 團隊,就進行了產(chǎn)品復刻,并將Open Manus上傳至開源社區(qū)。據(jù)了解,該團隊完成這一項目僅僅用了3個小時。
但并不足以支撐“Manus技術(shù)門檻不高”的論述。事實上,Manus的技術(shù)突破在于完成端到端任務(wù)閉環(huán)的設(shè)計落地,其技術(shù)門檻體現(xiàn)在復雜場景的工程化整合能力,例如多智能體協(xié)作架構(gòu),“規(guī)劃-執(zhí)行-驗證”三層代理系統(tǒng),而非單一算法突破。
劉露婕指出,開源社區(qū)復刻的“Manus平替?zhèn)儭彪m然能實現(xiàn)部分功能,如調(diào)用API生成報告,但缺乏Manus的系統(tǒng)性工程優(yōu)化,例如異步分布式處理框架、沙盒安全隔離機制以及多模態(tài)協(xié)同能力。并且,Manus團隊正在開發(fā)的“透明執(zhí)行艙”功能,也在持續(xù)解決客戶痛點,讓每個決策節(jié)點都可追溯審計,通過工程創(chuàng)新、人機協(xié)作的方式解決“大模型幻覺”的老大難問題。
此外,“套殼”之問也是Manus無法回避的。3月10日,季逸超在社交平臺確認,Manus產(chǎn)品使用了不同的基于阿里千問大模型(Qwen)的微調(diào)模型。季逸超此番表述,為Manus的技術(shù)背景增添了更多細節(jié),但也引發(fā)另一個問題:沒有自研,而是依托市場上的大模型進行研發(fā),這種做法是否可???
云天勵飛大模型負責人余曉填博士指出,隨著AI Agent產(chǎn)業(yè)的不斷成熟,分工將逐步清晰。例如,會出現(xiàn)專注于基礎(chǔ)模型的企業(yè)、專注于行業(yè)模型的企業(yè),以及專注于開發(fā)Agent產(chǎn)品或行業(yè)專屬Agent產(chǎn)品的企業(yè)。對于產(chǎn)品型企業(yè)而言,他們只需選擇成熟且適配的大模型,專注于自身產(chǎn)品的開發(fā)即可。在整個產(chǎn)業(yè)鏈中,無論是底層的基礎(chǔ)技術(shù),還是上層的產(chǎn)品應用,都具有不可替代的價值。
圖 / Manus應用案例
“要理解技術(shù)創(chuàng)新與生態(tài)協(xié)作的平衡,有顛覆式創(chuàng)新,也有漸進式創(chuàng)新,這都是值得鼓掌的進步,Manus的實踐恰恰證明垂直整合現(xiàn)有技術(shù)的能力是可行的,”在劉露婕看來,Manus的做法是大模型應用層創(chuàng)新的合理選擇。行業(yè)里有做智能體的,也有做基座模型的,就像有人種植小麥,有人加工成面粉,有人烹飪面包,有人全做,有人只做一部分。作為行業(yè)命運共同體,需要有人解決行業(yè)需求的“最后一公里”。所有AI Agent均基于現(xiàn)有基座大模型進行工程和產(chǎn)品層面的創(chuàng)新,大模型基座是誰家的沒有那么重要。Manus整合了Claude和通義千問戰(zhàn)略合作,都是為了提升任務(wù)完成率,應當重點關(guān)注如何微調(diào)多模型協(xié)同。
“AI Agent商業(yè)化元年”加速到來
就哲學范疇而言,蝴蝶效應(The Butterfly Effect)指在一個動態(tài)系統(tǒng)中,初始條件的微小變化,將能帶動整個系統(tǒng)長期且巨大的鏈式反應。當下,這家名為“蝴蝶效應”的初創(chuàng)公司似乎形成了同樣的影響。
3月6日早盤,互聯(lián)網(wǎng)、軟件、計算機、ERP概念、AI智能體等板塊集體爆發(fā)。其中,ERP概念大漲超7%,早盤資金凈流入近36億元,AI智能體大漲5.6%,資金凈流入超48億元。這或許因為,AI從“提供答案”向“自主執(zhí)行任務(wù)”的升級過于驚喜,也更說明用戶對AI Agent的期待已從基礎(chǔ)功能轉(zhuǎn)向個性化與場景化服務(wù),市場呼喚真正可用的產(chǎn)品。
因此,盡管輿論樂于將DeepSeek與Manus進行比較,但它們顯然并不是同一類產(chǎn)品,后者誕生之初就在著重解決“具體如何做”的命題,而將“通用AI Agent”視為最大賣點。
圖 / Manus 宣傳視頻
劉露婕向集微網(wǎng)表示,AI Agent就像是一個非常聰明的打工人,用戶發(fā)布整理100份簡歷的指令,它不僅用文字回復,還有著一系列自主規(guī)劃、實際執(zhí)行的中間動作,例如自動解壓壓縮包、閱讀簡歷生成排名表、生成評估標準和候選人報告,最終按需求輸出Excel表格,這是經(jīng)過一系列中間動作產(chǎn)生的“生產(chǎn)資料”的成果物,Manus之所以稱之為通用AI Agent,是因為它現(xiàn)在比較像一個很聰明的實習生,而隨著不斷加強專業(yè)數(shù)據(jù)和更多行業(yè)業(yè)務(wù)標準程序被提煉,AI Agent會很快進化到專業(yè)工種人才。據(jù)悉,云知聲自研的山海大模型就涵蓋了醫(yī)療、交通等垂類大模型基座,并基于其之上進一步開發(fā)行業(yè)AI Agent“獸牙智能體管理平臺”,已取得較快發(fā)展。
另有分析指出,Manus在B端場景成熟度較高,有望率先替代金融、電商等領(lǐng)域的初級崗位。此外,伴隨著國內(nèi)大模型企業(yè)的持續(xù)反復運算,C端也將出現(xiàn)殺手級應用。事實上,自2024年開始,國內(nèi)外各大科技公司紛紛加速探索AI智能體領(lǐng)域——去年12月,谷歌發(fā)布最新版大模型Gemini2.0,并展示多個智能體應用;微軟也有多款面向銷售、運營等多個商業(yè)場景的智能體;而字節(jié)跳動、百度、騰訊和阿里等大廠也相繼加強對智能體技術(shù)的研究與應用。
過去3年,AI用戶們眼見著一眾大廠打了“百模大戰(zhàn)”,搞了“應用之爭”,大模型不斷卷出新高度,對產(chǎn)品解決實際問題的能力的心理閾值被急速拉高。大模型不能只是“你問我答”,需要更加智能更加思考,而AI Agent就成了最具誘惑的路線選擇。根據(jù)麥肯錫等多份權(quán)威報告,在多元化需求驅(qū)動下,智能體市場呈爆發(fā)式增長態(tài)勢,2024年全球智能體市場規(guī)模約為51億美元,預計2030年將飆升至471億美元,復合年增長率高達44.8%。相當多的研報預測,2025年將成為“AI Agent商業(yè)化元年”。
“雖然目前AI行業(yè)看著非常熱鬧,但還是需要清醒認識到,AI產(chǎn)業(yè)整體仍處于發(fā)展的早期階段,而Agent技術(shù)更是剛剛萌芽。盡管Agent被視為未來AI產(chǎn)品的重要方向,但它將以何種形態(tài)賦能用戶,目前業(yè)內(nèi)并無定論,仍需時間探索?!庇鄷蕴畈┦繌娬{(diào)。
“蝴蝶效應”,正為AI Agent提供另一種路徑啟示。