實(shí)測(cè)智譜新智能體AutoGLM沉思:跨平臺(tái)“邊想邊干”破信息壁壘,免費(fèi)不限量開(kāi)放
圖片來(lái)源:視覺(jué)中國(guó)
藍(lán)鯨新聞3月31日訊(記者 朱俊熹)3月31日,大模型獨(dú)角獸智譜AI在中關(guān)村論壇上正式發(fā)布全新智能體“AutoGLM沉思”。據(jù)智譜介紹,該智能體具備深度研究能力(Deep Research),同時(shí)還能實(shí)現(xiàn)實(shí)際操作(Operator),推動(dòng)AI Agent進(jìn)入“邊想邊干”的階段。
智能體一直是國(guó)內(nèi)外AI公司競(jìng)相押注的方向。本月初,中國(guó)初創(chuàng)企業(yè)Monica發(fā)布智能體產(chǎn)品Manus,稱其為“全球首款通用Agent”,引發(fā)科技行業(yè)熱議。OpenAI也于2月推出deep research(深度研究)功能,通過(guò)智能體對(duì)復(fù)雜任務(wù)進(jìn)行多步驟研究,在數(shù)十分鐘內(nèi)做到人類需要數(shù)小時(shí)才能完成的工作。
智譜CEO張鵬在中關(guān)村論壇的演講中表示,“智譜很早在布局AI Agent,甚至早過(guò)海外的OpenAI和Anthropic。”自去年10月起,智譜陸續(xù)推出能模擬人類操作手機(jī)、計(jì)算機(jī)等電子設(shè)備的智能體,支持跨應(yīng)用操作,一句話讓AI幫忙發(fā)微信紅包或下單采購(gòu)?fù)赓u。
據(jù)智譜介紹,最新的AutoGLM沉思是國(guó)內(nèi)首個(gè)正式開(kāi)放給所有用戶的deep research類智能體功能。除deep research能力外,AutoGLM沉思還具備實(shí)際操作能力,能夠主動(dòng)行動(dòng)。智譜稱,這一能力的實(shí)現(xiàn)依賴于三個(gè)關(guān)鍵特性:一是深度思考,模擬人類在面對(duì)復(fù)雜問(wèn)題時(shí)的推理與決策過(guò)程;二是感知世界,像人一樣獲取并理解環(huán)境信息;三是工具使用,像人一樣調(diào)用和操作工具,完成復(fù)雜任務(wù)。
“此次發(fā)布的是preview版本,核心是以research類場(chǎng)景為主。在未來(lái)的兩周時(shí)間之內(nèi),我們將進(jìn)一步擴(kuò)展更多的agent場(chǎng)景和執(zhí)行的能力。”張鵬介紹稱。
在實(shí)測(cè)中,藍(lán)鯨新聞向AutoGLM沉思測(cè)試版提出這樣的Prompt:我最近在研究AI Coding(AI編程)領(lǐng)域,幫我整理一份行業(yè)報(bào)告,要包含國(guó)內(nèi)外主流的AI Coding工具。
AutoGLM沉思會(huì)先對(duì)用戶的請(qǐng)求進(jìn)行拆解,再逐步執(zhí)行研究計(jì)劃。該智能體的操作過(guò)程貼近人類的行為方式,會(huì)跳轉(zhuǎn)打開(kāi)Cursor、Windsurf等AI編程工具的官網(wǎng)。瀏覽網(wǎng)頁(yè)并收集相關(guān)信息,整合到最終生成的研究報(bào)告中。
圖片來(lái)源:AutoGLM沉思實(shí)測(cè)
藍(lán)鯨新聞發(fā)現(xiàn),AutoGLM沉思通過(guò)瀏覽器插件的方式實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)的調(diào)用。如果用戶此前未登陸相關(guān)官網(wǎng),智能體在執(zhí)行任務(wù)時(shí)會(huì)受阻,需要用戶介入,等待手動(dòng)確認(rèn)。或者它也會(huì)主動(dòng)調(diào)整搜索策略,轉(zhuǎn)向其他信源來(lái)獲取詳細(xì)信息。
圖片來(lái)源:AutoGLM沉思實(shí)測(cè)
相較而言,當(dāng)通過(guò)Manus執(zhí)行同一任務(wù)時(shí),雖然Manus也會(huì)主動(dòng)瀏覽不同AI編程工具的官網(wǎng),但僅體現(xiàn)在對(duì)步驟的簡(jiǎn)要描述中,不會(huì)像AutoGLM沉思一樣彈出瀏覽器頁(yè)面。
圖片來(lái)源:Manus截圖
通過(guò)模擬人類瀏覽網(wǎng)頁(yè)的方式,智譜的智能體AutoGLM沉思能夠突破各平臺(tái)間的“信息壁壘”。以制定一項(xiàng)旅游計(jì)劃的任務(wù)為例,Manus等產(chǎn)品參考的是互聯(lián)網(wǎng)上能被抓取到的公開(kāi)信息,而AutoGLM沉思可以觸達(dá)更多相對(duì)封閉的內(nèi)容生態(tài),包括小紅書(shū)筆記、知乎、嗶哩嗶哩視頻等,提供更優(yōu)質(zhì)的信息來(lái)源。
圖片來(lái)源:AutoGLM沉思實(shí)測(cè)
從用戶體驗(yàn)來(lái)看,Manus運(yùn)行在獨(dú)立虛擬機(jī)中,執(zhí)行任務(wù)時(shí)可以關(guān)閉其頁(yè)面,不影響它在后臺(tái)繼續(xù)保持工作。當(dāng)用戶提出任務(wù)請(qǐng)求后,Manus會(huì)補(bǔ)充提問(wèn)以進(jìn)一步確認(rèn)需求細(xì)節(jié)。用戶也可以隨時(shí)發(fā)送信息,對(duì)任務(wù)進(jìn)行修改、補(bǔ)充或要求停止。
圖片來(lái)源:Manus截圖
而智譜的AutoGLM沉思在任務(wù)進(jìn)行過(guò)程中,不支持對(duì)任務(wù)進(jìn)行修改或開(kāi)啟新對(duì)話,否則會(huì)直接終止任務(wù)進(jìn)程。AutoGLM沉思跳轉(zhuǎn)打開(kāi)的瀏覽器頁(yè)面雖然可以小窗化,但必須全程保持在線,且用戶難以直觀判斷任務(wù)的進(jìn)度條。智譜表示,之后計(jì)劃推出“虛擬機(jī)”版本,進(jìn)一步增強(qiáng)AI Agent的實(shí)際落地能力。
圖片來(lái)源:Manus任務(wù)進(jìn)度
智譜稱,AutoGLM沉思向用戶免費(fèi)、不限量地開(kāi)放體驗(yàn)。OpenAI的deep research功能需要用戶每月至少付費(fèi)20美元。Manus也在3月28日公布了其收費(fèi)方案:Manus Starter每月收費(fèi)39美元,獲得3900積分;Manus Pro每月收費(fèi)199美元,獲得19900積分。
積分是Manus使用的標(biāo)準(zhǔn)計(jì)量單位,任務(wù)越復(fù)雜或越耗時(shí),所需積分越多。以藍(lán)鯨新聞實(shí)測(cè)的任務(wù)為例,生成一份關(guān)于AI編程的行業(yè)報(bào)告需要花費(fèi)23分鐘,消耗456積分。而生成旅游計(jì)劃需要17分鐘,消耗197積分。
智譜表示,AutoGLM沉思的背后,融合了新版基座模型GLM-4-Air-0414的通用能力、全新深度思考模型 GLM-Z1-Air的反思能力、沉思模型GLM-Z1-Rumination,以及AutoGLM的自動(dòng)執(zhí)行能力。其中核心鏈路的模型和技術(shù),預(yù)計(jì)將于4月14日正式開(kāi)源。
新版GLM-Z1-Air在性能表現(xiàn)上可媲美DeepSeek-R1。其推理速度相比R1提升了8倍,成本可以降低至1/30。基于GLM-Z1訓(xùn)練出的沉思模型GLM-Z1-Rumination,能通過(guò)更長(zhǎng)的深度思考時(shí)間來(lái)?yè)Q取更優(yōu)的效果,突破了實(shí)時(shí)聯(lián)網(wǎng)搜索、動(dòng)態(tài)工具調(diào)用、深度分析和自我驗(yàn)證。
“相比于傳統(tǒng)的推理模型,我們期待沉思模型引領(lǐng)AI助手進(jìn)入一個(gè)‘高智商’到‘高智商+高自主’的階段。”智譜稱。