文 | 新眸,作者|李小東
當(dāng) 2024 年全球科技峰會的話題從 " 大模型參數(shù)競賽 " 轉(zhuǎn)向 " 智能體落地場景 " 時,行業(yè)似乎完成了一次集體認知躍遷。人們意識到,AI 的價值不再是參數(shù)量的天文數(shù)字,而在于能否像水一樣滲入真實世界的縫隙。
過去兩年,隨著混合專家架構(gòu)(MoE)、神經(jīng)符號系統(tǒng)等技術(shù)范式的迭代:智能體不再依賴 " 暴力訓(xùn)練 ",而是通過知識注入與邏輯推理的結(jié)合,逐步逼近人類專業(yè)能力。全球科技巨頭與初創(chuàng)公司紛紛將資源投向 AI Agent,人們甚至開始產(chǎn)生一種錯覺——智能體很快會進入成熟期。
這種感覺的背后,源于行業(yè)對 " 智能體 " 定義的微妙重構(gòu)。相比馬文 · 明斯基時代的 " 自主生命體 " 理想,在大模型取得突破性進展的當(dāng)下,留給 AI 應(yīng)用落地窗口期愈發(fā)緊迫,對智能體的界定,雖然同樣具備能夠 " 自主感知并采取相應(yīng)行動 " 的特征,但更多是把它視作 AI 應(yīng)用落地最重要的一種產(chǎn)品形態(tài)。
從 Anthropic、Google DeepMind 到 OpenAI,從字節(jié)、百度等頭部大廠,到 kimi、智譜等 AI 新勢力,各家公司都在探討如何利用這項技術(shù)去顛覆現(xiàn)有的行業(yè)格局,讓智能體真正成為打通 AI 從實驗室到實際場景落地的利器。
然而看似繁榮的落地案例,大多僅是技術(shù)長跑中的零星里程碑:特斯拉 Optimus 機器人能分揀零件,但面對傳送帶突發(fā)卡頓仍需要人類救場;Anthropic 的 Computer Use 讓用戶可以指揮 Claude 操作電腦,但面對復(fù)雜流程,也只有 15% 的操作成功率。
這些情況并非個例。當(dāng)前大多數(shù)智能體集中在高度結(jié)構(gòu)化的環(huán)境中運行,而人類世界的復(fù)雜性遠超實驗室預(yù)設(shè)的邊界。站在 2025 年的節(jié)點,這個被賦予 " 顛覆生產(chǎn)力 " 使命的技術(shù),仍處于爆發(fā)前夜。
篤信行業(yè)的人會認為,當(dāng)大模型完成技術(shù)啟蒙,算力基建逐步完善,智能體正在打開一個比移動互聯(lián)網(wǎng)更龐大的市場——結(jié)合麥肯錫與 Gartner 研究預(yù)測,到 2027 年,智能體將滲透至大部分的企業(yè)工作流,釋放萬億美元經(jīng)濟價值。我們看到的不是技術(shù)天花板,而是一個領(lǐng)域新的起跑線,技術(shù)、商業(yè)與社會的碰撞剛剛開始,真正的變革將在混沌中重塑規(guī)則。
01 智能體爆發(fā)前夜
在很多人的印象里,AI 智能體能夠?qū)崿F(xiàn)工作流程的自動化,其實早在多年以前,就有企業(yè)已經(jīng)開始嘗試使用基于規(guī)則的系統(tǒng)來處理簡單任務(wù),比如一些系統(tǒng)可以根據(jù)預(yù)設(shè)的知識庫,自動回答客戶的基本問題。
最接近智能體形態(tài)的產(chǎn)品是 IBM Watson 這類規(guī)則引擎驅(qū)動的專家系統(tǒng)和 Siri 等單點交互工具,但這些依靠預(yù)設(shè)規(guī)則和簡單決策樹運行的相對初級的程序,局限性非常明顯:當(dāng)面對復(fù)雜業(yè)務(wù)場景時,系統(tǒng)需要工程師編寫數(shù)以萬計的 if-then 規(guī)則,任何業(yè)務(wù)規(guī)則的細微調(diào)整都可能引發(fā)蝴蝶效應(yīng),導(dǎo)致整個系統(tǒng)需要推倒重來。
真正革命性的突破發(fā)生在 2015 年前后。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,AI 開始具備自主學(xué)習(xí)和環(huán)境適應(yīng)能力。谷歌 DeepMind 團隊的 AlphaGo 就是典型的例子,在 2016 年擊敗圍棋世界冠軍,標志著人工智能從 " 機械執(zhí)行者 " 向 " 策略制定者 " 的蛻變。
彼時的智能體,作為基于計算機程序和算法構(gòu)建的智能實體,也逐漸具備了基于數(shù)據(jù)自我迭代的能力,但由于 " 算法泛化能力不足 " 與 " 場景理解碎片化 " 的技術(shù)局限性,還沒有達到完全自主決策的程度。AlphaGo 雖然在圍棋領(lǐng)域超越人類,卻無法將這種能力遷移至其他場景。這種專家系統(tǒng)式的智能,本質(zhì)上仍是戴著鐐銬跳舞。
直到大模型的出現(xiàn)。
2020 年 GPT-3 橫空出世,智能體進入了一個新的認知革命,體現(xiàn)在兩個方面:AI 認知的泛化,千億參數(shù)構(gòu)建的大模型能理解跨行業(yè)的術(shù)語與業(yè)務(wù)邏輯;人機交互方式的改變,人們可以通過對話來生成結(jié)果。
2022 年底,ChatGPT 破圈,驗證了大模型作為 " 通用認知引擎 " 的可能性,次年多模態(tài)大模型爆發(fā),被視為智能體的 " 成人禮 ",GPT-4、Gemini 等模型展現(xiàn)的跨模態(tài)能力,讓智能體初步具備人類的多感官協(xié)同。
在這樣的背景下,具備持續(xù)學(xué)習(xí)能力的 AI Agent,在一定程度上有望突破工具屬性,成為具備商業(yè)思維的 " 數(shù)字員工 ",也就是大家現(xiàn)在所理解的 " 企業(yè)智能助手 " 的雛形。
與此同時,大模型 API 調(diào)用成本從 GPT-3 的每千 tokens 0.06 美元,降至 GPT-4 Turbo 的 0.01 美元,意味著中小企業(yè)也能負擔(dān)智能體部署。包括麥肯錫在內(nèi)的多家研究機構(gòu)測算并得出結(jié)論,大模型推動智能體部署成本下降 60-80%。
智能低門檻、高適配、強進化的應(yīng)用特征,讓不少為了擺脫商業(yè)化困境的 AI 玩家,將智能體當(dāng)作新的突破口。
而人們對智能體的終極期待,是構(gòu)建一套 " 企業(yè)認知中樞 " ——它不僅是執(zhí)行命令的工具,更是沉淀知識、優(yōu)化流程、預(yù)測風(fēng)險的核心引擎。這一愿景在過往受限于技術(shù)碎片化與成本壁壘,而如今,大模型的泛化能力、多模態(tài)融合與成本下降,終于讓商業(yè)社會看到了破壁的機會。
02 行業(yè)現(xiàn)狀冰火兩重天
Anthropic CEO Dario Amodei 曾斷言,未來 2~3 年內(nèi),AI 可能在幾乎所有任務(wù)上超越人類,五年內(nèi)智能體將滲透 90% 的企業(yè)工作流。智能體之所以成為風(fēng)口,本質(zhì)是市場對 " 第二代數(shù)字化轉(zhuǎn)型 " 的豪賭,如果說 2000-2020 年實現(xiàn)了業(yè)務(wù)流程數(shù)字化,當(dāng)下正進入 " 用智能體重構(gòu)業(yè)務(wù)本質(zhì) " 的新階段。
根據(jù) CB Insights,2023 年,全球 AI 初創(chuàng)公司融資總額達到 425 億美元。而伽馬數(shù)據(jù)則顯示,過去的一年里,全球 AI 產(chǎn)業(yè)融資金額超 4000 億元,同比增長超 77%,其中智能體相關(guān)的初創(chuàng)企業(yè)融資占比尤其顯著。
但資本市場的狂熱與產(chǎn)業(yè)實踐的謹慎形成微妙張力。綜合各類機構(gòu)調(diào)研,2024 年全球僅小部分智能體部署項目實現(xiàn)盈利,多數(shù)企業(yè)仍在為 " 如何讓 AI 理解業(yè)務(wù)邏輯 " 焦頭爛額。這種矛盾映射出一個現(xiàn)實:智能體從技術(shù)演示到商業(yè)閉環(huán)之間仍有巨大鴻溝。
從技術(shù)布局看,頭部公司的探索方向已現(xiàn)分野。
例如 OpenAI 的 Sam Altman 押注 " 通用智能體 ",試圖通過 GPT 構(gòu)建可適應(yīng)任意場景的認知引擎,剛剛正式發(fā)布的 "Operator" 能讓智能體接管用戶電腦操作,例如自動編寫代碼并調(diào)試運行,但是否能避免此前 Anthropic computer use 所暴露的控制能力脆弱性,還需要進一步驗證;
而微軟 CEO 納德拉選擇深度嵌入路線,將 Copilot 植入 Office、Teams 等產(chǎn)品矩陣,試圖把智能體變成企業(yè)工作流的 " 隱形中樞 ",但在供應(yīng)鏈管理等復(fù)雜場景中,其智能體因缺乏行業(yè)知識庫支持,也曾引發(fā)過合規(guī)危機。
具體到智能體的商業(yè)化路徑,不同類型的公司也呈現(xiàn)出不同的思路:以 OpenAI、谷歌和字節(jié)跳動為首的平臺基建型玩家,和以 Anthropic 為代表的垂直深耕型選手。平臺型與垂直型智能體公司的分野,本質(zhì)上映射出技術(shù)普惠與深度價值的兩條進化路徑。
OpenAI 的 GPTs 上線三個月即吸引超 300 萬開發(fā)者,用戶通過自然語言指令創(chuàng)建各種智能體,這種 " 對話即開發(fā) " 的模式將生態(tài)擴張速度提升 10 倍,但繁榮背后暗藏隱憂——據(jù) SimilarWeb 監(jiān)測,GPTs 商店中近 70% 的智能體生命周期不足 30 天,同質(zhì)化工具泛濫導(dǎo)致用戶付費意愿持續(xù)走低。
用生態(tài)化的平臺來聚攏開發(fā)者,這種玩法在互聯(lián)網(wǎng)早期就已顯現(xiàn),本質(zhì)上是科技巨頭之間的軍備競賽。然而,平臺型玩家雖占據(jù)流量與開發(fā)者優(yōu)勢,卻難免廣度稀釋精度的悖論——當(dāng)微軟 Copilot 企業(yè)版用戶抱怨其生成的財務(wù)報告頻繁出現(xiàn)會計準則誤用時,OpenAI 工程師坦言 " 通用模型在專業(yè)場景的知識深度,不足人類專家的 1/10"。
垂直型路徑則選擇向產(chǎn)業(yè)縱深處掘金,為了和 OpenAI 等公司差異化競爭,Anthropic 在發(fā)布 Computer Use 之外,Anthropic 把目光鎖定在金融、醫(yī)療等對合規(guī)審查、風(fēng)險評估的要求極高的領(lǐng)域,以滿足這些剛需場景為切入點,提供 " 憲法 AI" 約束,用 Claude API 滿足客戶的私有化部署。
不同于 OpenAI 的 " 通用模型 + 生態(tài)擴張 ",Anthropic 采用 " 可控性 + 行業(yè)適配 " 方案,這么做的原因并非通過平臺的形式來賣鏟子,而是在自身技術(shù)優(yōu)勢的基礎(chǔ)上,滿足行業(yè)在 AI 時代對安全、精準、定制化服務(wù)日益增長的需求。
聚焦細分領(lǐng)域且能快速落地的方案,對于科創(chuàng)型公司來說更具實踐意義,國外 AI 科技公司 LangChain 調(diào)查了從工程師、產(chǎn)品經(jīng)理到商業(yè)領(lǐng)袖和高管共計 1300 多企業(yè)人士,調(diào)研的企業(yè)里,超過一半用 Agent 來進行研究和總結(jié)的工作,其他依次為個人生產(chǎn)力工具、客戶服務(wù)、代碼生成等方面。
在過去的兩年里,各類 AI 智能體產(chǎn)品,在全球各行各業(yè)釋放出極大的潛力。主打金融、法律文檔智能分析的 Hebbia.ai、為企業(yè)客戶定制 AI 客服的 Sierra,以及職業(yè)教育領(lǐng)域的 Sana Labs 等,都有不錯的增長。
資本的瘋狂涌入,推動這些新玩家們的融資規(guī)模與估值雙雙飆升。但與此同時,市場卷起的巨大泡沫,一些智能體初創(chuàng)公司的 PS Ratio(市銷率)甚至超過 50 倍,遠超此前 SaaS 行業(yè)平均水平。拿 Sierra 來說,這家成立不到兩年的公司,估值已經(jīng)達到 45 億美金,成為智能體初創(chuàng)企業(yè)中最火熱的投資標的之一。
垂直化也意味著規(guī)模天花板,Gartner 數(shù)據(jù)顯示,專注金融合規(guī)的智能體公司年均營收增速僅為平臺型企業(yè)的 1/3,且客戶獲取成本持續(xù)攀升,部分賽道已出現(xiàn)用 80% 資源爭奪 20% 頭部客戶的殘酷內(nèi)卷。
從平臺型到垂直型,兩種路徑的角力實則指向產(chǎn)業(yè)根本矛盾:通用智能體的開放生態(tài)能快速鋪量卻難挖深井,垂直解決方案雖能創(chuàng)造高毛利但復(fù)制成本陡增。
于是在這種情況下,一些公司已悄然調(diào)整戰(zhàn)略,Anthropic 在 Claude API 中開放 " 憲法規(guī)則自定義 " 接口,允許企業(yè)將內(nèi)部合規(guī)條款植入模型,這種 " 可拆卸的垂直化 " 或許預(yù)示著未來智能體市場的終局形態(tài):平臺提供基礎(chǔ)認知引擎,垂直模塊則像 App Store 中的專業(yè)應(yīng)用般自由組合,最終在開放與封閉、普惠與深度的平衡中重塑商業(yè)。
但這些,還僅僅是一種預(yù)測。
03 智能體還在起跑線
回到智能體本身,行業(yè)領(lǐng)袖的反應(yīng)更為冷靜。Meta 的扎克伯格坦言:" 我們高估了短期進展,低估了長期挑戰(zhàn)——讓智能體真正理解人類意圖,可能還需要十年。" 英偉達黃仁勛則預(yù)測," 只有當(dāng)智能體開始改造企業(yè)利潤表時,真正的革命才剛開始。"
兩者觀點看似矛盾,前者警示短期高估,后者強調(diào)長期革命性,但這些判斷的背后,其實都是對當(dāng)下智能體技術(shù)瓶頸和商業(yè)化局限下的認知。
當(dāng)前智能體的自然語言交互能力雖已突破語法層面,但在深層語義理解上仍存缺陷,在動態(tài)環(huán)境和跨系統(tǒng)的協(xié)作協(xié)作,智能體仍存在各式各樣的可靠性不足。在商業(yè)化層面,不少公司面臨成本和收益失衡,波士頓咨詢調(diào)研顯示,企業(yè)智能體項目中不到 20% 達到預(yù)期 ROI,多數(shù)企業(yè)仍在 " 試水 " 階段。
如果將視線放到國內(nèi),情況將會更加復(fù)雜。
事實上,國內(nèi)和國外的智能體發(fā)展,一開始差異并不明顯,但現(xiàn)在差別越來越大。具體表現(xiàn)為,國外在智能體領(lǐng)域的融資規(guī)模不斷攀升,產(chǎn)品力不斷增強,部分超級公司正在崛起;而國內(nèi)目前大多還停留在概念階段,這種情況和當(dāng)年 SaaS 行業(yè)很相似。
從中國信通院發(fā)布的《2024 年人工智能發(fā)展報告》來看,在金融、醫(yī)療、制造等領(lǐng)域的智能體公司數(shù)量龐大,但受限于高部署成本和商業(yè)化落地難度,企業(yè)級市場的盈利項目占比屈指可數(shù)。
這一差距背后,是技術(shù)路徑、產(chǎn)業(yè)生態(tài)和商業(yè)邏輯的多重差異。
目前國外大部分智能體產(chǎn)品的交付,仍沿用軟件定制開發(fā)或按時訂閱的商業(yè)路徑,主要得益于其 SaaS 化基因,有成熟的軟件生態(tài)基礎(chǔ),另一方面,智能體對傳統(tǒng)線下生產(chǎn)和運營流程的替代更加精細,可替代的人力環(huán)節(jié)更多,智能體能解決更多實際問題,因此擁有廣闊的發(fā)展空間。
商業(yè)發(fā)展的本質(zhì),是要縮短傳統(tǒng)流程,并盡可能降低成本,當(dāng)成本比原來降低更多時,新的模式就會取代舊模式。但相比之下,國產(chǎn) AI 的發(fā)展并非是因為軟件生態(tài)成熟,有了 AI 后如虎添翼;恰恰相反,國內(nèi)軟件生態(tài)原本就不夠完善:既缺乏類似 Hugging Face 的模型庫、Databricks 的數(shù)據(jù)處理平臺,行業(yè)內(nèi)的 API 標準化也表現(xiàn)不足,增加了企業(yè)的集成成本。
這種情況導(dǎo)致在 AI 領(lǐng)域,國內(nèi)還需要去彌補軟件生態(tài)方面缺失的功課。更棘手的是,企業(yè)客戶習(xí)慣為 " 功能模塊 " 付費,但拒絕為 " 決策能力 " 溢價。一些頭部廠商的智能體一旦報價超過客戶預(yù)期的范圍,客戶流失率甚至能達 90%。
所以在 2025 年的節(jié)點,清醒認識到,伴隨 AI 從玩具編程工具,但如果要把智能體從生產(chǎn)力工具變成真正的生產(chǎn)力,這場變革還未抵達交卷的程度,它不會遵循摩爾定律的節(jié)奏躍進,而是要在試錯與迭代中蹣跚前行。