鞭牛士 今日?qǐng)?bào)道
11 月 13 日消息,11 月 12 日,百度世界 2024 如期召開,百度創(chuàng)始人李彥宏發(fā)表了主題為《應(yīng)用來了》的演講。如字面意思,注重人工智能的落地應(yīng)用,而非大模型,是李彥宏對(duì)人工智能的認(rèn)知和判斷。
在去年大模型最火的時(shí)候,李彥宏就發(fā)表了 " 不要卷模型,要卷應(yīng)用 " 的觀點(diǎn)。今年的演講,則是這一觀點(diǎn)的進(jìn)一步延伸,這也符合李彥宏堅(jiān)定「應(yīng)用」的一貫態(tài)度。
當(dāng)然,觀點(diǎn)并不是空口無憑而來,而是有正在發(fā)生的數(shù)據(jù)支撐。
據(jù)介紹,截至 11 月初,百度文心大模型的日均調(diào)用量已經(jīng)超過 15 億,相較一年前首次披露的 5000 萬次,增長(zhǎng)約 30 倍。李彥宏表示 " 這個(gè)增速超出預(yù)期 ",說明 AI 是真需求。他感慨道,這條陡峭的增長(zhǎng)曲線,代表著過去兩年中國(guó)大模型應(yīng)用的爆發(fā)。
在過去這 2 年人工智能狂飆期間,國(guó)內(nèi)各廠商在路徑選擇上,大模型確實(shí)最為擁擠。然而,理想很豐滿現(xiàn)實(shí)很骨感,深陷燒錢泥潭而遲遲不能商業(yè)化落地就是現(xiàn)實(shí),以至于不少玩家倒在了黎明前的黑暗里,黯然離場(chǎng)。如今,幾乎沒有玩家會(huì)弱化「應(yīng)用」的重要性。現(xiàn)在回望,李彥宏對(duì)于人工智能的判斷,可謂是具備非常高的前瞻性。
百度押注「AI 應(yīng)用」,前瞻性源于先人一步
李彥宏對(duì)行業(yè)的精準(zhǔn)判斷源自于自身十多年來的深耕和學(xué)習(xí)。作為中國(guó) AI 的頭號(hào)玩家,李彥宏在 2012 年就寫了一封郵件,鼓勵(lì)全百度產(chǎn)品經(jīng)理了解 AI 技術(shù)最新趨勢(shì)。
2012 年,如果你在中國(guó)一線城市的大街上跟人講述人工智能,別人可能都會(huì)認(rèn)為你不是瘋子就是騙子。而在當(dāng)時(shí),百度卻已經(jīng)愿意斥下天文數(shù)字般的巨資著手布局。
同年,李彥宏計(jì)劃收購(gòu)當(dāng)時(shí)號(hào)稱 " 深度學(xué)習(xí)之父 ",全球最頂尖的的 Geoff Hinton 團(tuán)隊(duì)。盡管在競(jìng)標(biāo)中,百度叫出 4400 萬的全場(chǎng)最高價(jià),但因種種原由最終未能與百度成功合作。一位相關(guān)專業(yè)人士對(duì)此事做出評(píng)論稱,在當(dāng)時(shí)的中國(guó)互聯(lián)網(wǎng)公司中,只有百度愿意為真正的技術(shù)人才支付如此高昂的代價(jià)。
2013 年,百度成立深度學(xué)習(xí)實(shí)驗(yàn)室,李彥宏任院長(zhǎng)。至此,百度正式拉開了探索 AI 的序幕。
有 "AI 教父 " 之稱的楊立昆在出版的《科學(xué)之路》一書中評(píng)價(jià)到,百度是最早部署商業(yè)化深度學(xué)習(xí)系統(tǒng)的大型公司之一,領(lǐng)先于谷歌和微軟。有意思的是,在 2012 年的那場(chǎng)收購(gòu)競(jìng)標(biāo)中,微軟和谷歌就是百度的主要競(jìng)標(biāo)對(duì)手。
2014 年,諾貝爾獎(jiǎng)得主吳恩達(dá)加入百度并在研究院擔(dān)任首席科學(xué)家。在吳恩達(dá)加入不久后,六位頂級(jí)的人工智能專家通過郵件表達(dá)了加入百度的意向。
作為中國(guó)人工智能領(lǐng)域的開拓者和踐行者,百度如今已然成長(zhǎng)為國(guó)內(nèi)的「扛大旗者」,具備與國(guó)際巨頭同臺(tái)競(jìng)爭(zhēng)的實(shí)力。
近日,沙利文發(fā)布報(bào)告《2024 年全球 AI 生態(tài)全景概覽》,在全球 AI 生態(tài)全景中,百度與谷歌、OpenAI 位于 AI-Native Giant 同一象限。
事實(shí)證明,在任何行業(yè),站在頂峰的企業(yè)必然具備「敢為人先」的精神。從報(bào)告結(jié)果來看,百度目前已經(jīng)取得了階段性成果。
據(jù)了解,百度在布局 AI 領(lǐng)域長(zhǎng)達(dá)十余年累計(jì)投入超過 1700 億,打造了完備的 AI 生態(tài)(云、自動(dòng)駕駛、大模型),這在全球的公司里都罕見。
文心 iRAG 發(fā)布:文生圖無幻覺,更真實(shí)
" 過去 24 個(gè)月,AI 行業(yè)發(fā)生最大的變化是大模型基本消除了幻覺。" 這是李彥宏對(duì)行業(yè)變幻的第一感知。
在現(xiàn)場(chǎng),李彥宏演示了將一個(gè)開源模型生成一張北京天壇的圖片,圖中天壇生成了四層,但實(shí)際上只有三層。
這是文生圖比較典型的幻覺現(xiàn)象,這種幻覺現(xiàn)象,至今仍然很普遍。" 所以今天的多模態(tài)大模型沒有什么成規(guī)模的應(yīng)用出來,就是幻覺沒有解決,至少?zèng)]有像文生文 RAG 解決得那么好。" 李彥宏稱。
基于此,百度發(fā)布了檢索增強(qiáng)的文生圖技術(shù) iRAG,全稱 image based RAG。
據(jù)介紹,iRAG 是將百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力相結(jié)合,生成的圖片更為真實(shí),整體效果遠(yuǎn)遠(yuǎn)超過文生圖原生系統(tǒng),去掉了濃郁的 " 機(jī)器味 "。
現(xiàn)場(chǎng)還演示了一張「大眾攬巡汽車飛躍長(zhǎng)城」iRAG 生成圖。從圖能看到,車型、車標(biāo)、姿態(tài)以及背景,都比較符合預(yù)期。
據(jù)百度首席技術(shù)官王海峰對(duì) iRAG 的技術(shù)鏈路介紹:
首先,基于大模型對(duì)用戶的需求進(jìn)行分析理解,自動(dòng)規(guī)劃精確或泛化方案,比如對(duì)哪些實(shí)體進(jìn)行增強(qiáng);接著在增強(qiáng)階段,對(duì)需要增強(qiáng)的實(shí)體,檢索并選擇相應(yīng)的參考圖。
最后在生成階段,自研了多??煽厣鷪D大模型。一方面,通過局部注意力計(jì)算,在保持實(shí)體特征不變的情況下,實(shí)現(xiàn)了圖像的高泛化生成,比如根據(jù)牛頓的肖像,生成繪本風(fēng)格的牛頓;另一方面,通過整體注意力計(jì)算,進(jìn)行高精確的圖像生成,比如生成圖中的汽車跟原圖片保持完全一致。
在實(shí)際應(yīng)用中,這個(gè)方法也支持用戶上傳參考圖,應(yīng)用戶期望進(jìn)行生成。
iRAG 技術(shù)極大地提高了 AI 生成圖片的可用性。李彥宏在演講中舉例,在實(shí)際應(yīng)用場(chǎng)景中,如汽車品牌宣傳場(chǎng)景時(shí),拍攝一組海報(bào)動(dòng)輒需要一二十萬,甚至大幾十萬。使用 iRAG 后,創(chuàng)作的成本接近于 0。" 簡(jiǎn)單來說,iRAG 的商業(yè)價(jià)值體現(xiàn)在:無幻覺、超真實(shí)、沒成本,立等可取。"
無代碼工具 " 秒噠 " 發(fā)布,將迎來一個(gè) " 只靠想法就能賺錢的時(shí)代 "
大會(huì)上,百度官宣發(fā)布無代碼應(yīng)用平臺(tái) " 秒噠 ",旨在讓每個(gè)人都具備程序員的能力,會(huì)說話就能做出應(yīng)用,根本不需要看懂代碼。
官方稱之為 " 迄今為止人類歷史上最復(fù)雜的多智能體協(xié)作工具 "。
據(jù)介紹,秒噠的三大特點(diǎn)是具備無代碼編程、多智能體協(xié)作和多工具調(diào)用。一個(gè)人通過自然語言交互,就可以完成一整套系統(tǒng)的搭建。且還可以做任意場(chǎng)景下的各種應(yīng)用。
李彥宏稱,我們將迎來一個(gè)前所未有的只靠想法就能賺錢的時(shí)代。以前有個(gè)想法,你還要去執(zhí)行,把想法做出來。現(xiàn)在只要你有想法,秒噠就可以幫你做了。
據(jù)悉,該平臺(tái)預(yù)計(jì)在 2025 年一季度上線,目前可以申請(qǐng)排隊(duì)。
智能體是 AI 應(yīng)用的最主流形態(tài),即將迎來爆發(fā)點(diǎn)
" 智能體 " 這三個(gè)字是本次大會(huì)最為頻繁出現(xiàn)的詞匯之一,可見其在百度 AI 里的戰(zhàn)略地位之高。
李彥宏在最近的一次內(nèi)部講話中談及了大模型三大認(rèn)知誤區(qū),其中就指出:智能體是最重要的發(fā)展方向,但還不是業(yè)界共識(shí)。
李彥宏稱,當(dāng) AI 玩家不知道怎么從模型變成應(yīng)用時(shí),智能體能提供一個(gè)非常直接、非常高效、非常簡(jiǎn)單的方式。
當(dāng)基礎(chǔ)模型能力就緒,智能體成為 AI 應(yīng)用的方向之一。李彥宏認(rèn)為,智能體是 AI 應(yīng)用的最主流形態(tài),即將迎來它的爆發(fā)點(diǎn)。智能體可能會(huì)變成 AI 原生時(shí)代,內(nèi)容、信息和服務(wù)的新載體。
打個(gè)比方,智能體很像 PC 時(shí)代做網(wǎng)站,或者是移動(dòng)時(shí)代做自媒體賬號(hào)。不同之處是智能體更像人,更智能,更像是你的助理和客服,能夠像人一樣做各種各樣的腦力和體力勞動(dòng),各方面的工作都可以獨(dú)立完成。
同時(shí),李彥宏強(qiáng)調(diào),在模型之上構(gòu)建智能體是相當(dāng)方便的。這也是什么目前每周都有上萬個(gè)新的智能體在文心平臺(tái)上被創(chuàng)造出來。
據(jù)介紹,目前,文心智能體平臺(tái)上,已經(jīng)吸引了 15 萬家企業(yè)和 80 萬名開發(fā)者參與,覆蓋的應(yīng)用場(chǎng)景非常廣泛。文心智能體平臺(tái)的 TOP100 智能體是基于智能體的分發(fā)量、平均對(duì)話輪次、用戶喜愛度等指標(biāo)綜合遴選出來的。