国产一级黄片视频_精品无码免费成a人片_久久婷婷国产综合尤物精品_日韩精品亚洲精品无码专区

關(guān)于ZAKER 合作
手機中國 7分鐘前

DeepSeek 研究員稱 R1 訓(xùn)練僅用幾周 接下來還有大招

【CNMO 科技消息】近期,科技界最為熱議的詞匯非 "DeepSeek" 莫屬。據(jù)悉,DeepSeek-R1 在數(shù)學(xué)、代碼自然語言推理等領(lǐng)域的表現(xiàn),已經(jīng)能夠與 OpenAI 的 GPT-1 正式版相媲美,其火爆程度席卷全球。而最近,DeepSeek 的研究員在線透露了一個消息:R1 的訓(xùn)練過程僅僅耗時兩到三周,研究員們在春節(jié)期間也未停歇,繼續(xù)全力推進研究,接下來還有大招。

幾天前,Daya Guo 發(fā)布了一條推文,分享了他春節(jié)期間最為興奮的事情——親眼目睹了 R1-Zero 模型性能曲線的 " 持續(xù)增長 ",并深切感受到了強化學(xué)習(xí)(RL)的強大力量。在回復(fù)網(wǎng)友關(guān)于 DeepSeek R1 的問題及公司后續(xù)計劃時,Daya Guo 透露,DeepSeek 的 R1 只是一個開始,內(nèi)部研究正在快速推進。他強調(diào),研究員們在春節(jié)期間一直在加班加點地推進研究。

對于網(wǎng)友提問的 " 如果不是秘密的話,這次 RL 訓(xùn)練跑了多久?"Daya Guo 回應(yīng)稱,660B 參數(shù)的 R1-Zero 和 R1 是在 V3 版本發(fā)布后才開始訓(xùn)練的,整個過程大約花費了 2-3 周的時間。此外,他還透露團隊正在嘗試將 R1 應(yīng)用于形式化證明環(huán)境,并希望盡快向社區(qū)發(fā)布更加優(yōu)秀的模型。從 Daya Guo 的言辭中不難看出,他們在這方面已經(jīng)取得了進展,未來或?qū)⒂懈嘀亓考壍哪P蛦柺?,令人充滿期待。

相關(guān)閱讀

最新評論

沒有更多評論了