Nebius(NASDAQ: NBIS)是總部位于荷蘭阿姆斯特丹的全棧 AI 原生云平臺(tái)領(lǐng)導(dǎo)者,提供大規(guī)模 GPU 集群和專為 AI 與機(jī)器學(xué)習(xí)高強(qiáng)度工作負(fù)載優(yōu)化的基礎(chǔ)設(shè)施。2024 年 12 月,公司完成了由 Nvidia 和 Accel 領(lǐng)投的高達(dá) 7 億美元戰(zhàn)略股權(quán)融資,并獲得超額認(rèn)購。
在 GenAI Assembling 算力主題活動(dòng)的第二場爐邊對(duì)話中,Nebius 聯(lián)合創(chuàng)始人兼 CBO Roman Chernin 來到現(xiàn)場,與觀眾分享了他對(duì)于 GPU 市場策略、基礎(chǔ)設(shè)施如何適應(yīng)后預(yù)訓(xùn)練時(shí)代、以及 Nebius 未來布局的關(guān)鍵看法。
隨著近期 DeepSeek 等高效模型的出現(xiàn),業(yè)界對(duì)算力需求的爭論愈發(fā)激烈。 Nebius 作為這一背景下的核心參與者,其視角也讓這場討論顯得尤為重要。
對(duì)話人:
Thomas Luo|Co-founder and CEO, GenAI Assembling
Roman Chernin | Co-founder and CBO, Nebius
Thomas Luo:今天我們要與 Nebius 的 Co-founder 兼首席商務(wù)官 Roman 對(duì)話。Roman,很高興邀請(qǐng)到你,這次美國之行感覺如何?
Roman Chernin:一如既往地緊湊。這次我?guī)缀鯖]怎么睡,部分是因?yàn)闀r(shí)差,部分是實(shí)在沒時(shí)間睡覺。自從去年 11 月底以來一切都在快速發(fā)展—比如 H100 GPU 的價(jià)格已顯著下跌。其實(shí)我在過去五天內(nèi)參加了大約 50 場會(huì)議,每場都很有意思。
Thomas Luo:在我們正式開始之前,能否先向觀眾介紹一下 Nebius 的背景?當(dāng)我描述 Nebius 時(shí)覺得有點(diǎn)難,它像是一個(gè)既古老又年輕的創(chuàng)業(yè)公司,還在納斯達(dá)克上市了。你能分享一下它的故事,特別是從 Yandex 轉(zhuǎn)變的那部分嗎?
Roman Chernin:當(dāng)然。在座誰知道 Yandex?誰在今天以前聽過 Nebius?——看來后者少得多哈哈,我們在提升知名度方面還有很多工作要做。
這是一個(gè)獨(dú)特且相當(dāng)不尋常的故事。有些人可能知道,Yandex 常被稱為 " 俄羅斯的谷歌 ",但這種說法其實(shí)不全面。它其實(shí)更像是俄羅斯的谷歌、優(yōu)步、Spotify 和 Netflix 的集合體—一個(gè)與俄羅斯互聯(lián)網(wǎng)密不可分的公司。
我剛開始負(fù)責(zé)系統(tǒng)管理時(shí),Yandex 無處不在。這是一家擁有尖端技術(shù)和高質(zhì)量人才的出色公司。我在那兒工作了十多年,先后領(lǐng)導(dǎo)搜索、中小企業(yè)服務(wù)和地理服務(wù)部門。在此期間,我們一直懷揣著國際化擴(kuò)張的雄心。我們相信不論在哪兒,Yandex 都能證明偉大的事物是可以被創(chuàng)造的。
但在 2022 年 2 月危機(jī)爆發(fā)時(shí),即便是最樂觀的人也意識(shí)到局勢將發(fā)生巨變。我們中許多人對(duì)沖突深感擔(dān)憂,難以相信這實(shí)際發(fā)生了。也因此公司開始變化—首先是人員。員工和創(chuàng)始人面臨艱難抉擇:是留在原地還是另尋他處。這一過程漫長而復(fù)雜,就像 Netflix 劇集一樣。從 2022 年 2 月到 2024 年 7 月,歷時(shí)兩年半。到那時(shí),我們已完成原有資產(chǎn)的調(diào)整,讓公司全面轉(zhuǎn)型。
以前,Yandex 是一家注冊在荷蘭、估值 350 億美元的納斯達(dá)克上市公司,擁有 2 萬名員工。當(dāng)轉(zhuǎn)型最終完成時(shí),停擺兩年半的納斯達(dá)克交易得以恢復(fù)。而在此期間,持有 Yandex 股票的投資者看到他們的持股被凍結(jié)。當(dāng)我們終于在 2024 年 10 月完成分離時(shí),納斯達(dá)克在某個(gè)周三通知我們下周一將恢復(fù)交易。那時(shí)我們正在進(jìn)行融資,于是不得不告訴潛在投資者:" 抱歉,但現(xiàn)在你們是在投資一家上市公司。"
這不是首次公開募股,而是重新上市,這在公開市場歷史上從未發(fā)生過。Yandex 的股東最初投資的是一家俄羅斯互聯(lián)網(wǎng)公司,但現(xiàn)在我們是一家專注于完全不同市場的非俄羅斯、非互聯(lián)網(wǎng)公司。幸運(yùn)的是,市場反應(yīng)積極。我們在 12 月完成了融資,由 Accel Ventures 領(lǐng)投,Nvidia 作為戰(zhàn)略投資者加入。所以現(xiàn)在我們在這里。我常把我們描述為一家身穿上市公司外衣的 B 輪創(chuàng)業(yè)公司。
Thomas Luo:聽起來很不可思議。從我的角度來看,這個(gè)故事最引人注目的地方之一是,在這兩年半時(shí)間里,你們成功保留了核心工程團(tuán)隊(duì)和管理團(tuán)隊(duì),據(jù)我所知,你 relocated 到了以色列,其他人則遷往荷蘭、美國或其他地方。同時(shí),你們還在全球積極招募人才。
你們公司正在建立真正的全球化布局—你們在美國聘請(qǐng)了新的 CMO,其他產(chǎn)品和工程崗位也在歐美各地落實(shí)。感覺 Nebius 已經(jīng)在以一個(gè)完全全球化的公司模式運(yùn)營。我有兩個(gè)問題:首先,Nebius 是如何做到這一點(diǎn)的?其次,為什么你們決定將 GPU 云服務(wù)作為從 Yandex 分離并建立新身份的關(guān)鍵領(lǐng)域?
Roman Chernin:回答你的問題,在 2022 年和 2023 年,我們專注的主要項(xiàng)目不是產(chǎn)品或市場,而是 relocating 1300 個(gè)家庭。我們的首要任務(wù)是幫助他們安頓下來,重啟生活。當(dāng)我們開始這個(gè)過程時(shí),并沒有明確的公司發(fā)展計(jì)劃。但我們知道我們擁有一項(xiàng)獨(dú)特的資產(chǎn):世界級(jí)的工程人才。
這些人此前已經(jīng)建立過 hyperscaler(超大規(guī)模服務(wù)提供商),知道如何高效且有效地進(jìn)行規(guī)模化運(yùn)營。我們意識(shí)到,即使我們沒有資金、數(shù)據(jù)中心或業(yè)務(wù),這些人才是我們最寶貴的資產(chǎn)。我們知道可以圍繞這個(gè)核心建立新的事業(yè)。
然而,俄羅斯人普遍不擅長銷售。雖然我們擁有卓越的工程人才,但要將其轉(zhuǎn)化為成功的業(yè)務(wù)和優(yōu)秀的產(chǎn)品需要不同的技能組合。我們專注于通過在全球招募業(yè)務(wù)開發(fā)、銷售和產(chǎn)品管理等領(lǐng)域的最佳人才來補(bǔ)充我們的工程優(yōu)勢。
我們所在的 GPU 云服務(wù)業(yè)務(wù),其客戶和人才自然高度集中在美國。因此,建立強(qiáng)大的美國業(yè)務(wù)成為重中之重。我現(xiàn)在的職責(zé)是在這里建立一個(gè)世界級(jí)的團(tuán)隊(duì),這個(gè)團(tuán)隊(duì)既要人才出眾,又能吸引更多頂尖人才加入。我們正在全力實(shí)現(xiàn)這一目標(biāo)。
當(dāng)我們最初開始建立美國業(yè)務(wù)時(shí)并不容易。許多人持懷疑態(tài)度—為什么一群總部在荷蘭的俄羅斯人想要建立全球化業(yè)務(wù)?幸運(yùn)的是,一些具有遠(yuǎn)見的勇敢者愿意給我們機(jī)會(huì),隨著時(shí)間推移,事情變得越來越容易。每周、每月,越來越多的人理解我們是誰、在做什么?,F(xiàn)在,當(dāng)新的人才加入時(shí),他們面對(duì)的是來自不同背景的團(tuán)隊(duì)—不僅僅是像我這樣帶著濃重口音的俄羅斯人。這真正在成為一家全球化公司,這就是我們的發(fā)展方向。
Thomas Luo:很有意思。那么,為什么選擇 GPU?
Roman Chernin:這其實(shí)不僅僅關(guān)于 GPU —而是關(guān)于 AI。Yandex 一直是一家 AI 驅(qū)動(dòng)的公司。我們開發(fā)深度技術(shù)和智能驅(qū)動(dòng)的產(chǎn)品,搜索業(yè)務(wù)也一直處于機(jī)器學(xué)習(xí)和 AI 的前沿。所以當(dāng)我們創(chuàng)立 Nebius 時(shí),我們知道要圍繞 AI 來建設(shè)。
我們也很早就意識(shí)到不會(huì)成為面向消費(fèi)者的 B2C 公司。相反,我們決定為開發(fā)者創(chuàng)造產(chǎn)品。我們的想法是,在 Yandex 積累的專業(yè)知識(shí)—構(gòu)建 hyperscaler 和大規(guī)模系統(tǒng)—可以幫助我們服務(wù)其他工程師和開發(fā)者。我們將自己定位為一家 " 技術(shù)公司 " 或面向技術(shù)人員的公司。
我們的獨(dú)特之處在于擁有罕見的專業(yè)知識(shí)組合。我們有知道如何建設(shè)物理基礎(chǔ)設(shè)施的人才,比如高效的數(shù)據(jù)中心;有設(shè)計(jì)和構(gòu)建硬件的專家;還有出色的軟件工程師—大多數(shù)團(tuán)隊(duì)都有軟件背景。
當(dāng)我們看到計(jì)算能力需求的增長和 AI 的快速發(fā)展時(shí),我們意識(shí)到我們的人才和資產(chǎn)自然而然地讓我們適合進(jìn)入這個(gè)市場。我們別無選擇—這是最合理的前進(jìn)方向。
但提供 GPU 算力并不是我們的全部長期愿景。我們的使命是為那些創(chuàng)造突破性 AI 產(chǎn)品的開發(fā)者和研究人員構(gòu)建卓越的 AI 基礎(chǔ)設(shè)施。這是我們的核心焦點(diǎn)。
Thomas Luo:你很好地指出了前 Yandex 團(tuán)隊(duì)—現(xiàn)在的 Nebius 團(tuán)隊(duì)—在業(yè)務(wù)擴(kuò)展方面的專長。這就像你們在俄羅斯是全能型選手。你們的核心優(yōu)勢之一似乎是擴(kuò)展業(yè)務(wù)和運(yùn)營。正如你提到的,你們的使命是支持 AI 從業(yè)者、研究人員和開發(fā)者構(gòu)建和擴(kuò)展他們的 AI 產(chǎn)品。你是否認(rèn)為加速這些產(chǎn)品的擴(kuò)展過程也是你們使命的一部分?
Roman Chernin:是的,但這不是關(guān)于一般意義上的業(yè)務(wù)擴(kuò)展—不同業(yè)務(wù)有不同需求。我們專注于構(gòu)建可擴(kuò)展的技術(shù)平臺(tái)。這是關(guān)于創(chuàng)建能夠高效運(yùn)營并有效服務(wù)客戶的基礎(chǔ)設(shè)施。這是我們正在建設(shè)的核心。
Thomas Luo:好的,詳細(xì)說說你們在美國市場的策略。
Roman Chernin:我們專注美國的主要原因是市場在這里。我們跟隨需求。我們在美國做的是擴(kuò)展基礎(chǔ)設(shè)施。我們已經(jīng)啟動(dòng)了第一個(gè)數(shù)據(jù)中心,很快就會(huì)啟動(dòng)第二個(gè)和第三個(gè)。今年我們的大部分部署都集中在美國。
首要任務(wù)是擴(kuò)展基礎(chǔ)設(shè)施。其次是直接與客戶合作—不僅是銷售,還包括建立客戶成功和服務(wù)團(tuán)隊(duì),確保客戶成功。另一個(gè)我們正在解決的挑戰(zhàn)是知名度不足。幾個(gè)月前,沒人聽說過我們。但現(xiàn)在,GPU 云業(yè)務(wù)的專業(yè)人士開始認(rèn)識(shí)我們,客戶群體中的認(rèn)知度也在提升。這是一個(gè)漸進(jìn)的過程,但這里的團(tuán)隊(duì)做得很出色。我相信我們正在正確的軌道上,將在這個(gè)市場上變得更加顯眼并站穩(wěn)腳跟。
Thomas Luo:但你們?nèi)绾闻c CoreWeave 等這個(gè)領(lǐng)域的老牌企業(yè)競爭?他們也得到了 Nvidia 的支持。有 Nvidia 作為投資者并不代表一定能保證成功,對(duì)嗎?
Roman Chernin:當(dāng)然不能。在以色列,我們稱之為 "kosher stamp" —這只是一個(gè)認(rèn)可的標(biāo)志,而非成功的保證。要 " 真正成功 " 需要建立業(yè)務(wù)。
在我們?nèi)谫Y路演時(shí),我們強(qiáng)調(diào)了三個(gè)核心信念:
首先,計(jì)算需求會(huì)持續(xù)增長。對(duì)此有兩種理論:一種將計(jì)算比作早期互聯(lián)網(wǎng)時(shí)代的光纖—基礎(chǔ)設(shè)施最終會(huì)達(dá)到平穩(wěn);另一種將計(jì)算比作能源—在人類歷史的每個(gè)階段,人們都會(huì)消耗所能生產(chǎn)的所有能源。我們贊同后者。計(jì)算能力越多,我們創(chuàng)造的產(chǎn)品就越先進(jìn),導(dǎo)致更廣泛的應(yīng)用和持續(xù)增長的計(jì)算需求。
其次,我們相信市場將長期保持競爭性。雖然谷歌、微軟和 OpenAI 等大玩家擁有近乎無限的資源優(yōu)勢,但開源的力量和新玩家在細(xì)分領(lǐng)域的涌現(xiàn)讓我們相信競爭會(huì)持續(xù)。競爭市場不僅有利于商業(yè),也有利于人類。如果 AI 領(lǐng)域被壟斷,將對(duì)創(chuàng)新和整個(gè)社會(huì)構(gòu)成重大風(fēng)險(xiǎn)。
第三,在這些條件下,我們問自己:作為 Nebius,我們是否有權(quán)利成功并成為重要玩家?我們的答案是肯定的。我們相信我們獨(dú)特的資產(chǎn)和能力組合讓我們具備優(yōu)勢。
為什么?因?yàn)榻⒊晒Φ幕A(chǔ)設(shè)施需要技術(shù)和資本的結(jié)合。這是一個(gè)高度資本密集型業(yè)務(wù)—部署新基礎(chǔ)設(shè)施需要數(shù)十億資金。得益于我們的轉(zhuǎn)型過程和現(xiàn)在是上市公司的事實(shí),我們很幸運(yùn)擁有充足的財(cái)務(wù)資源。我們還擁有有價(jià)值的資產(chǎn),比如在 Peakhouse 的重要股份,我們認(rèn)為它具有巨大潛力。
除了資本,你還需要技術(shù)。這不是一個(gè)簡單地購買硬件、部署它就能開始賺錢的業(yè)務(wù)。它要復(fù)雜得多。例如,計(jì)算價(jià)格下降實(shí)際上對(duì)我們有利,因?yàn)槲覀冇行判哪鼙仁袌錾显S多玩家運(yùn)營得更有效率。
我們的優(yōu)勢在于資本、人才和技術(shù)專長的結(jié)合。與其他新興云服務(wù)提供商不同,我們大量投資軟件開發(fā),構(gòu)建強(qiáng)大的平臺(tái)而不是僅提供物理基礎(chǔ)設(shè)施。這種方法使我們與眾不同,并為長期成功奠定基礎(chǔ)。
Thomas Luo:有種觀點(diǎn)認(rèn)為在預(yù)訓(xùn)練后時(shí)代,GPU 變得不那么重要了。這也是價(jià)格下跌的原因之一。你同意這個(gè)觀點(diǎn)嗎?
Roman Chernin:我不這么認(rèn)為。我認(rèn)為價(jià)格下跌更多是因?yàn)?Nvidia 解決了供應(yīng)鏈問題。此外,這種下降是由市場動(dòng)態(tài)驅(qū)動(dòng)的—客戶對(duì)承諾變得更謹(jǐn)慎和理性,許多人避開舊一代 GPU 轉(zhuǎn)而選擇新一代。這是一種經(jīng)濟(jì)趨勢,而不是需求減少的反映。
從在建數(shù)據(jù)中心的規(guī)模來看,計(jì)算需求顯然沒有放緩。實(shí)際上,我認(rèn)為我們正在進(jìn)入一個(gè)令人著迷的階段,重點(diǎn)從產(chǎn)品開發(fā)轉(zhuǎn)向產(chǎn)品應(yīng)用。
訓(xùn)練是關(guān)于創(chuàng)造產(chǎn)品,但真正的成功來自于人們開始使用它—這就是推理變得關(guān)鍵的地方。舉個(gè)例子,我們與開發(fā)視頻模型的 Luma Labs 合作。在去年夏天他們?nèi)〉镁薮蟪晒Φ陌l(fā)布之前,大約 90% 的算力用于訓(xùn)練,只有 10% 用于推理,因?yàn)樗麄內(nèi)栽跇?gòu)建模型,使用量很小。但在他們推出廣受歡迎的 "Dream Machine" 版本后,兩周內(nèi)總計(jì)算需求增加了 5-7 倍,推理占用了 80% 的算力。這種轉(zhuǎn)變發(fā)生是因?yàn)樗麄兊漠a(chǎn)品從開發(fā)階段轉(zhuǎn)向了實(shí)際應(yīng)用。
我們?nèi)蕴幱?AI 產(chǎn)品應(yīng)用的早期階段,但隨著使用量增長,我們將看到計(jì)算需求的大幅增加。使用將推動(dòng)對(duì)更多 GPU 的需求—不是為了訓(xùn)練,而是為了推理。場景正在演變,我們將看到更全面的系統(tǒng)融入商業(yè)、日常生活等領(lǐng)域。關(guān)于市場對(duì)算力的需求我并不擔(dān)心。
Thomas Luo:讓我們談?wù)劧藗?cè) AI。在之前的討論中,提到了計(jì)算能力從云端向端側(cè)的轉(zhuǎn)移。你如何看待這一趨勢對(duì) GPU 云服務(wù)的當(dāng)前基礎(chǔ)設(shè)施、定價(jià)模式或商業(yè)模式的影響?從歷史上看,GPU 服務(wù)提供商—有時(shí)被稱為 GPU 農(nóng)場—建立大型集群并直接向開發(fā)者提供算力。這種模式會(huì)演變嗎?
Roman Chernin:我認(rèn)為這種演變很自然。即使在 GPU 時(shí)代之前,我們就看到移動(dòng)設(shè)備變得越來越先進(jìn),計(jì)算能力越來越強(qiáng)。但盡管如此,云計(jì)算需求仍在增長,因?yàn)殡S著設(shè)備能力的提升,應(yīng)用的復(fù)雜性也在提高。
我相信端側(cè) AI 也會(huì)出現(xiàn)類似模式。確實(shí)許多應(yīng)用會(huì)在設(shè)備上運(yùn)行,但這不會(huì)完全取代云計(jì)算。相反,我們需要一種新型基礎(chǔ)設(shè)施—我稱之為邊緣云。可以將其視為 CDN(內(nèi)容分發(fā)網(wǎng)絡(luò))之后的下一步。
我們需要高度分布式的計(jì)算基礎(chǔ)設(shè)施來處理低延遲場景,確保資源靠近終端用戶。實(shí)時(shí)視頻、交互式游戲和其他對(duì)延遲敏感的應(yīng)用將需要靠近客戶的基礎(chǔ)設(shè)施。然而,這并不意味著端側(cè)會(huì)取代云;更多是關(guān)于用例的日益復(fù)雜和多樣化。每種場景都需要其量身定制的基礎(chǔ)設(shè)施,邊緣和云將共存以支持這種復(fù)雜性。
Thomas Luo:現(xiàn)在想提問前最后一個(gè)問題。從更長遠(yuǎn)來看,你如何看待模型性能和計(jì)算需求之間關(guān)系的演變?這包括大語言模型、小型模型和更復(fù)雜的 AI 應(yīng)用或代理。這種演變可能如何影響 GPU 服務(wù)市場?
Roman Chernin:我認(rèn)為在未來五年左右,我們將看到專門針對(duì)特定用例設(shè)計(jì)的專用硬件取得重大進(jìn)展。模型將變得更加多樣化—不僅是規(guī)模,還包括類型和功能。
目前,許多工作負(fù)載在現(xiàn)有硬件上的優(yōu)化都很差。我們依賴少數(shù)標(biāo)準(zhǔn)芯片設(shè)計(jì),這與日益增長的工作負(fù)載種類并不完全匹配。未來,我預(yù)計(jì)會(huì)看到硬件更專業(yè)化,這將導(dǎo)致生態(tài)系統(tǒng)不同層面的競爭加劇。
云基礎(chǔ)設(shè)施日益增加的復(fù)雜性將需要供應(yīng)商之間更多的協(xié)作,以及采用更多樣化的解決方案。這是我們?nèi)绱藞?jiān)信投資平臺(tái)的原因之一。如果市場保持像今天這樣簡單—標(biāo)準(zhǔn) GPU 和參考設(shè)計(jì)集群— Nvidia 可以通過構(gòu)建所有必要的軟件輕松主導(dǎo)。但如果未來涉及更復(fù)雜和多樣化的生態(tài)系統(tǒng),產(chǎn)品和用例差異顯著,那么靈活、強(qiáng)大的平臺(tái)的價(jià)值將不容否認(rèn)。
這就是為什么我們專注于創(chuàng)建一個(gè)能適應(yīng)這種復(fù)雜性的平臺(tái),為客戶提供在更具競爭性和專業(yè)化環(huán)境中蓬勃發(fā)展所需的工具和效率。