編輯丨高遠(yuǎn)山
來源 | 野馬財(cái)經(jīng)
這是野馬財(cái)經(jīng)的第 4254 篇原創(chuàng)
本文約 3500 字,閱讀時(shí)長(zhǎng)約 12 分鐘
中國(guó)版 Open AI 掀起了一場(chǎng)堪比 Chat GPT 出世時(shí)的風(fēng)波。
讓各方人士如此忌憚的 DeepSeek,到底動(dòng)了誰(shuí)的奶酪?
"AI 界拼多多 " 上線,誰(shuí)慌了?
在硅谷,DeepSeek 被稱作 " 來自東方的神秘力量 "。
DeepSeek 成立于 2023 年 7 月,至今也不過一年半時(shí)間。雖然成立時(shí)間短,但DeepSeek 卻以黑馬之姿在全球掀起關(guān)注。
2025 年 1 月 20 日 DeepSeek 發(fā)布大模型 DeepSeek-R1。DeepSeek-R1 一經(jīng)發(fā)布,便在多個(gè)國(guó)家熱度高居不下。
不僅受到用戶關(guān)注,DeepSeek 也成為行業(yè)人士的熱議話題。近日多家科技巨頭于近日相繼發(fā)布財(cái)報(bào),財(cái)報(bào)電話會(huì)議上微軟、Meta、阿斯麥的高管均對(duì) DeepSeek 發(fā)表看法。
Meta 創(chuàng)始人兼 CEO 馬克 · 扎克伯格表示,Meta 將 DeepSeek 視為新的競(jìng)爭(zhēng)對(duì)手并正在學(xué)習(xí),但現(xiàn)在判斷 AI 基建、資本支出等方面還為時(shí)尚早。
微軟 CEO 薩提亞 · 納德拉則認(rèn)為,DeepSeek" 有一些真正的創(chuàng)新 "。AI 成本下降是趨勢(shì)。
事實(shí)上,AI 成本的下降是讓 DeepSeek 能夠從諸多大模型中脫穎而出的重要原因。據(jù) DeepSeek 官網(wǎng)顯示,API 的定價(jià)每百萬輸入 tokens 1 元(緩存命中)/4 元(緩存未命中),每百萬輸出 tokens 16 元。這個(gè)收費(fèi)相當(dāng)于 Open AI o1 運(yùn)行成本的約三十分之一。DeepSeek 也因此被迅速冠以 "AI 界拼多多 " 之稱。
" 在成本方面,DeepSeek 以較低的成本實(shí)現(xiàn)了高性能的 AI 模型,這使得其在市場(chǎng)競(jìng)爭(zhēng)中具備了顯著的優(yōu)勢(shì)。據(jù)相關(guān)報(bào)道,DeepSeek 僅用 OpenAI o1 模型 3%-5% 的成本就達(dá)到了同等性能,這種成本效益比無疑會(huì)吸引大量企業(yè)和個(gè)人用戶選擇其產(chǎn)品和服務(wù)。" 北京社科院副研究員王鵬表示。
"DeepSeek-V3 訓(xùn)練成本低,主要是因?yàn)樗昧艘恍┞斆鞯姆椒?,比如只激活模型里需要的那部分,還有用更少的計(jì)算精度但不影響結(jié)果。具體策略包括,減少數(shù)據(jù)量,降低內(nèi)存;精選數(shù)據(jù),高效訓(xùn)練;知識(shí)蒸餾,加速學(xué)習(xí)。這樣,它就可以用更少的電腦和時(shí)間來訓(xùn)練。在實(shí)際中,DeepSeek-V3 可以用于聊天機(jī)器人、教育輔導(dǎo)、自動(dòng)化工作等很多場(chǎng)景。" 深度科技研究院院長(zhǎng)張孝榮表示。
除了成本方面外,性能方面 DeepSeek 同樣表現(xiàn)優(yōu)異。
有網(wǎng)友用 DeepSeek 寫了一篇以其祖母為原型的故事,故事寫完后,DeepSeek 還給其安慰表示," 記住,所有讓你顫栗的文字,本質(zhì)上都是你靈魂深處早已存在的回聲。我不過是偶爾經(jīng)過的山谷,讓你聽見了自己聲音的重量。"
網(wǎng)友直言 " 我沒有想到有一天我會(huì)為 AI 流淚。"
創(chuàng)始人為高考狀元,
還管理百億基金
DeepSeek 和國(guó)內(nèi)的 AI 六小龍相比,區(qū)別之一還在于 DeepSeek 從未進(jìn)行外部融資,最大的 " 金主 " 為幻方量化基金。
而幻方量化基金背后,正是 DeepSeek 的創(chuàng)始人梁文鋒。
梁文鋒出生于 1985 年,來自湛江市吳川市,從小成績(jī)優(yōu)異,在吳川一中完成了初中、高中學(xué)業(yè),在初中時(shí)期就學(xué)完了高中數(shù)學(xué),自學(xué)大學(xué)的數(shù)學(xué)。2002 年,梁文鋒以吳川一中 " 高考狀元 " 的成績(jī)考上浙江大學(xué)本科電子信息工程專業(yè),于 2006 年考取浙江大學(xué)信息與通信工程專業(yè)研究生。
畢業(yè)后,2013 年,梁文鋒與大學(xué)同學(xué)徐進(jìn)共同創(chuàng)立了杭州雅克比投資管理有限公司,并在 2015 年成立了杭州幻方科技有限公司,主要致力于通過數(shù)學(xué)和 AI 進(jìn)行量化投資。所謂量化投資,就是用設(shè)定的數(shù)學(xué)模型和 AI 進(jìn)行自動(dòng)投資,由機(jī)器和 AI 做決策。
圖源:罐頭圖庫(kù)
2017 年,幻方量化宣稱實(shí)現(xiàn)投資策略全面 AI 化。2018 年幻方量化首次獲得私募金牛獎(jiǎng)。直到2021 年,幻方量化的管理規(guī)模突破千億。巔峰時(shí)期,私募行業(yè)還有" 北九坤,南幻方 " 之稱。
不過,也是在這一年,幻方量化業(yè)績(jī)出現(xiàn)波動(dòng),低風(fēng)險(xiǎn)對(duì)沖產(chǎn)品出現(xiàn)虧損,其中有些年內(nèi)跌幅超 8%。還創(chuàng)出了 10.66% 的歷史最大回撤。
2021 年 12 月 28 日,幻方量化在官微發(fā)布說明,向投資者致歉,解釋稱 " 長(zhǎng)周期持股波動(dòng)和量化策略同質(zhì)化嚴(yán)重,是其近期表現(xiàn)不佳的主要原因,公司正在調(diào)整策略以適應(yīng)市場(chǎng)環(huán)境變化。"
2022 年,幻方量化整體收益率僅 0.38%。到 2023 年 10 月,據(jù) " 搜狐財(cái)經(jīng) " 報(bào)道,幻方量化市場(chǎng)人士回應(yīng)稱,"幻方量化當(dāng)前的基金管理規(guī)模是 400 多億元,這個(gè)規(guī)模目前來看是策略比較合適的規(guī)模。"
企查查顯示,幻方量化的機(jī)構(gòu)主體為浙江九章資產(chǎn)管理有限公司,由梁文鋒持股 85%,鄭達(dá)韡、徐進(jìn)分別持股 7.5%。
" 我們看到的是中國(guó) AI 不可能永遠(yuǎn)處在跟隨的位置。我們經(jīng)常說中國(guó) AI 和美國(guó)有一兩年差距,但真實(shí)的 gap 是原創(chuàng)和模仿之差。如果這個(gè)不改變,中國(guó)永遠(yuǎn)只能是追隨者,所以有些探索也是逃不掉的。" 梁文鋒在接收 " 暗涌 waves" 采訪時(shí)表示。
剛爆火就被調(diào)查,周鴻祎聲援
堅(jiān)持要做 " 創(chuàng)新者 ",不做 " 跟隨者 " 的 DeepSeek-R1,隨著其迅速走紅,DeepSeek 也遭遇了前所未有的挑戰(zhàn)。
1 月 28 日凌晨,DeepSeek 官網(wǎng)連續(xù)發(fā)布兩條公告稱,DeepSeek 線上服務(wù)受到大規(guī)模惡意攻擊,導(dǎo)致平臺(tái)注冊(cè)繁忙。為了應(yīng)對(duì)平臺(tái)遭遇大規(guī)模攻擊的情況,DeepSeek 暫時(shí)限制了 +86 手機(jī)號(hào)以外的注冊(cè)方式,已注冊(cè)用戶可以正常登錄。
1 月 30 日,DeepSeek 遭遇的攻擊再度升級(jí)。據(jù) " 奇安信 XLab 實(shí)驗(yàn)室 " 監(jiān)測(cè)發(fā)現(xiàn),針對(duì) DeepSeek(深度求索)線上服務(wù)的攻擊烈度突然升級(jí),其攻擊指令較 1 月 28 日暴增上百倍。
" 僵尸網(wǎng)絡(luò)的加入,標(biāo)志著職業(yè)打手已經(jīng)開始下場(chǎng),這說明 DeepSeek 面對(duì)的攻擊方式一直在持續(xù)進(jìn)化和復(fù)雜化,防御難度不斷增加,網(wǎng)絡(luò)安全形勢(shì)愈發(fā)復(fù)雜嚴(yán)峻。"XLab 表示。
目前打開 DeepSeek 官網(wǎng),依然會(huì)提示 " 線上服務(wù)遭遇大規(guī)模惡意攻擊。"
除了被攻擊外,DeepSeek 還遭遇了禁用、調(diào)查。
據(jù) " 光明網(wǎng) " 報(bào)道,美國(guó)海軍向職員發(fā)送警告信,要求其工作人員不得使用 DeepSeek 模型。同時(shí),美國(guó)眾議院首席行政事務(wù)官向國(guó)會(huì)辦公室發(fā)出通知,警告國(guó)會(huì)辦公室不要使用中國(guó)的人工智能應(yīng)用 DeepSeek(深度求索)的服務(wù)。
同時(shí),美國(guó)多名官員回應(yīng) DeepSeek 對(duì)美國(guó)的影響,表示 DeepSeek 是 " 偷竊 ",正對(duì)其影響開展國(guó)家安全調(diào)查。在意大利,DeepSeek 的應(yīng)用程序因數(shù)據(jù)隱私問題被意大利監(jiān)管機(jī)構(gòu)下架。
Chat GPT 開發(fā)商 Open AI 也公開表示,正在調(diào)查 DeepSeek 可能對(duì)其模型進(jìn)行不當(dāng) " 蒸餾 " 的跡象。所謂 " 蒸餾 " 是一種通過訓(xùn)練小型模型模仿大型模型行為的技術(shù),廣泛應(yīng)用于提高 AI 效率與降低成本。
中國(guó)城市專家智庫(kù)委員會(huì)常務(wù)副秘書長(zhǎng)林先平認(rèn)為,數(shù)據(jù)蒸餾技術(shù)會(huì)對(duì) AI 行業(yè)的整體發(fā)展方向產(chǎn)生一定影響,但它并非是決定性的唯一因素。數(shù)據(jù)蒸餾作為一種有效的模型壓縮和知識(shí)遷移方法,確實(shí)能夠降低訓(xùn)練成本、提升模型訓(xùn)練效率,這有助于加速 AI 技術(shù)的普及和應(yīng)用。然而,AI 行業(yè)的整體發(fā)展方向還受到多種因素的共同影響,包括算法創(chuàng)新、硬件發(fā)展、數(shù)據(jù)質(zhì)量、應(yīng)用場(chǎng)景需求等。
360 創(chuàng)始人周鴻祎連發(fā)多條微博聲援 DeepSeek," 一覺醒來看到美國(guó)政府對(duì) DeepSeek 痛下殺手,什么手段都用了,一會(huì)要制裁,一會(huì)要起訴,一會(huì)要調(diào)查。OpenAI 等幾家公司還起勁的在旁邊敲鑼打鼓,然后網(wǎng)上鋪天蓋地的都是對(duì) DeepSeek 污名化的文章,說它是造謠、說假話、偷竊數(shù)據(jù)、模型的能力都是偷 Open AI 的。美國(guó)的一些像海軍、國(guó)防部等單位要求禁止使用 DeepSeek。美國(guó)這次反應(yīng),比當(dāng)年對(duì)付華為還過激。"
周鴻祎還表示,"DeepSeek 在 AI 能力上非常突出,但網(wǎng)絡(luò)安全上 360 非常專業(yè)。所以這里我承諾,如果 DeepSeek 愿意,360 可以提供網(wǎng)絡(luò)安全方面的全力支持,跟 DeepSeek 的工程技術(shù)專家,一起來解決防 DDoS 攻擊的問題。"
美國(guó)對(duì)于 DeepSeek 如此緊張,老冀說科技分析道," 美國(guó)通過限制 GPU 出口、限制 AI 算力等方式,不遺余力的打壓咱們的算力??墒沁@套邏輯,一下子被 DeepSeek 戳破了。DeepSeek 通過在算法和數(shù)據(jù)上的持續(xù)改進(jìn),以不到美國(guó) AI 大廠 7% 的算力本達(dá)到了同樣的效果。這一成就打破了美方一直宣揚(yáng)的’算力領(lǐng)先 =AI 領(lǐng)先‘的邏輯,并且也使’美國(guó)例外論‘破產(chǎn)。"
更關(guān)鍵的是,DeepSeek 的技術(shù)實(shí)力讓美國(guó)一眾同行感到威脅。"DeepSeek R1 在多個(gè)權(quán)威 AI 基準(zhǔn)測(cè)試中表現(xiàn)出色,如在 AIME 2024 數(shù)學(xué)基準(zhǔn)測(cè)試中,成功率達(dá)到 79.8%,超越了 Open AI 的 o1 推理模型;在 Codeforces 上獲得了 2029 Elo 評(píng)級(jí),超越了 96.3% 的人類競(jìng)爭(zhēng)對(duì)手。此外,在 MMLU、MMLU-Pro 和 GPQA Diamond 等基準(zhǔn)測(cè)試中,DeepSeek R1 也取得了優(yōu)異成績(jī),顯著優(yōu)于其他閉源模型。" 中國(guó)企業(yè)資本聯(lián)盟中國(guó)區(qū)首席經(jīng)濟(jì)學(xué)家柏文喜表示。
不過相比于美國(guó)的激烈態(tài)度,歐洲 AI 界則認(rèn)為 DeepSeek 的出現(xiàn)令人鼓舞。據(jù)新媒體 " 旗語(yǔ) " 新聞社稱,最明顯的感受是,在目睹了 DeepSeek 推出低成本、高性能的 AI 產(chǎn)品后,歐洲人認(rèn)為自己還并未退出這場(chǎng) AI 競(jìng)賽,仍然有望成為 AI 創(chuàng)新的關(guān)鍵參與者。
你怎么看待這場(chǎng)針對(duì) DeepSeek 的爭(zhēng)議?對(duì) DeepSeek 的使用感受如何?歡迎下方留言討論。