亚洲系列日本系列精品,中文字幕自拍偷拍精品无码

在開源上我們站在了歷史的錯(cuò)誤一方。

這是 Sam Altman 對 DeepSeek 沖擊做出的最新回應(yīng)。

OpenAI 從來都是主動出擊，這一次因 DeepSeek 而被動調(diào)整了它自己的節(jié)奏，甚至第一次在開源權(quán)重的問題上，有了動搖。

一切都發(fā)生的太快了。

o3-mini 全線開放，免費(fèi)用，可聯(lián)網(wǎng)

在 DeepSeek 壓力之下， OpenAI 今天凌晨突然宣布，其最新推理模型o3-mini 全面上線。

而且居然一改往日藏著掖著的調(diào)性，一次性向所有人開放了 o3-mini 在 ChatGPT 和 API 中的使用權(quán)限，包括免費(fèi)用戶。

不僅支持聯(lián)網(wǎng)，也終于舍得展示思考過程了。

o3-mini 于去年底的技術(shù)直播中首次亮相，是 OpenAI 推理系列中最新、最具性價(jià)比的小型 AI 模型，在科學(xué)、數(shù)學(xué)和編程領(lǐng)域表現(xiàn)出色，同時(shí)兼具低成本和低延遲優(yōu)勢。

強(qiáng)度模式上，o3-mini 提供了低、中、高三種選擇，用戶可根據(jù)需求在快速響應(yīng)和深度思考之間靈活調(diào)整。只是 o3-mini 尚不支持視覺任務(wù)，需要進(jìn)行視覺推理時(shí)仍要調(diào)用 o1。

此次發(fā)布，ChatGPT Pro 用戶可無限制訪問 o3-mini；Plus 和 Team 用戶每日消息限制從 o1-mini 的 50 條提升至 150 條；免費(fèi)用戶也可通過選擇 "Reason" 模式或重新生成回復(fù)來體驗(yàn)新模型（具體消息限制未說明）。所有付費(fèi)用戶還可在模型選擇器中選擇 "o3-mini-high"，以獲得需要更長時(shí)間響應(yīng)的更高智能版本。

此前曾被社區(qū)貼臉對比 DeepSeek 有而 OpenAI 沒有的深度思考 + 聯(lián)網(wǎng)功能，這次也高亮加入：所有用戶均可選擇 "Search + Reason" 組合，利用搜索功能查找?guī)в邢嚓P(guān)網(wǎng)絡(luò)資源鏈接的最新答案。

來到開發(fā)者這邊。即日起，API 使用等級 3-5 的開發(fā)者可在 Chat Completions API、Assistants API 和 Batch API 中調(diào)用 o3-mini。OpenAI 稱它是自己首款支持函數(shù)調(diào)用、結(jié)構(gòu)化輸出和開發(fā)者消息的小型推理模型，可直接用于生產(chǎn)環(huán)境。

變快變便宜，但仍不如 DeepSeek 實(shí)惠

速度與效率方面，o3-mini 相較于 o1 具備更快的響應(yīng)速度和更高的計(jì)算效率。測試結(jié)果顯示，o3-mini 推理速度比 o1-mini 快 24%，將平均響應(yīng)時(shí)間從 10.16 秒縮短至 7.7 秒。此外，o3-mini 的首個(gè) token 生成時(shí)間也比 o1-mini 快 2500 毫秒，為用戶提供更加流暢的交互體驗(yàn)。

而面對 " 模型界拼多多 "DeepSeek，OpenAI 也不得不加入了價(jià)格戰(zhàn)。官方表示，自 GPT-4 推出以來，OpenAI 已將每 token 價(jià)格下調(diào) 95%。

最新的定價(jià)方案中，o3-mini 輸入每百萬 tokens 收費(fèi) $1.10，輸出每百萬 tokens 收費(fèi) $4.40，在使用緩存輸入的情況下，費(fèi)用可以減半至每百萬 tokens $0.55。

這個(gè)價(jià)格相比之前有了顯著下降，比 o1-mini 低 63%，比完整版 o1 更是降低了 93%。然而即便如此，與 DeepSeek R1 輸入和輸出費(fèi)用分別為每百萬 tokens $0.14 和 $0.55 相比，仍然明顯偏高。

性能超 o1，采用 " 審慎對齊 " 技術(shù)

OpenAI 在官方博客中展示了 o3-mini 在多個(gè)領(lǐng)域相比 o1 和 o1-mini 的性能提升。

數(shù)學(xué)推理方面，o3-mini 于 AIME 2024 數(shù)學(xué)競賽中表現(xiàn)優(yōu)異。使用高推理強(qiáng)度時(shí)，其準(zhǔn)確率達(dá)到 87.3%，全面超越 o1。即便在低推理強(qiáng)度模式下，其表現(xiàn)也能與 o1-mini 比肩。

在科學(xué)領(lǐng)域評測中，o3-mini 的高推理強(qiáng)度模式在 PhD 級科學(xué)問題（GPQA Diamond）上達(dá)到 79.7% 的準(zhǔn)確率，顯著優(yōu)于前代模型。在生物、化學(xué)和物理等高難度學(xué)科問題上，其高推理強(qiáng)度模式的表現(xiàn)與 o1 相當(dāng)。

編程能力方面，o3-mini 這次展現(xiàn)出了肉眼可見的顯著優(yōu)勢。在 Codeforces 編程競賽中，其高推理強(qiáng)度模式獲得 2130 的 Elo 評分，遠(yuǎn)超前代模型，即使最低推理強(qiáng)度也與 o1 持平。在 SWEbench-verified 軟件工程測試中，高推理強(qiáng)度模式達(dá)到 49.3% 的準(zhǔn)確率。在 LiveBench 編程任務(wù)中，中等推理強(qiáng)度已超越 o1-high，高推理強(qiáng)度模式則更是大幅領(lǐng)先。

在一般知識評估中，o3-mini 全面超越 o1-mini。同時(shí)，人類偏好測試顯示，56% 的專家更傾向于選擇 o3-mini 的回答，認(rèn)為其更準(zhǔn)確且邏輯性更強(qiáng)。此外，o3-mini 在處理現(xiàn)實(shí)世界高難度問題時(shí)，主要錯(cuò)誤率下降了 39%，凸顯了其在復(fù)雜任務(wù)中的可靠性。

安全性方面，OpenAI 表示在 o3-mini 的安全性工作上取得了重要進(jìn)展。最顯著的是采用了他們開發(fā)的審慎對齊 "（deliberative alignment）技術(shù)，讓 o3-mini 能在回答用戶問題前，主動對安全規(guī)范進(jìn)行推理思考。這種方法使其在應(yīng)對各種安全挑戰(zhàn)和越獄測試時(shí)的表現(xiàn)明顯優(yōu)于 GPT-4o。

為確保安全性，o3-mini 采用了與 o1 同樣嚴(yán)格的流程，包括準(zhǔn)備度評估、外部紅隊(duì)測試等多個(gè)環(huán)節(jié)。評估結(jié)果顯示，o3-mini 的總體風(fēng)險(xiǎn)等級被評為 " 中等 "，其中在說服力、危險(xiǎn)物質(zhì)、模型自主性等方面風(fēng)險(xiǎn)為中等，而在網(wǎng)絡(luò)安全領(lǐng)域的風(fēng)險(xiǎn)則為低。通過強(qiáng)化 " 思維鏈 " 推理能力，o3-mini 在處理潛在風(fēng)險(xiǎn)場景（如非法建議和偏見回應(yīng)）時(shí)達(dá)到了目前的最高安全水平。

值得注意的是，隨著模型能力的不斷提升，OpenAI 也意識到了潛在風(fēng)險(xiǎn)的增加。為此他們建立了完善的安全評估和防護(hù)體系，確保只有經(jīng)過安全處理且風(fēng)險(xiǎn)達(dá)到中等或更低的模型才會被部署。

奧特曼領(lǐng)銜，OpenAI 團(tuán)隊(duì)上陣 Reddit 開版答疑

o3-mini 發(fā)布后，OpenAI CEO Sam Altman 帶領(lǐng)首席研究員 Mark Chen、首席產(chǎn)品官 Kevin Weil、工程副總裁 Srinivas Narayanan、API 研究主管 Michelle Pokrass，和 o3-mini 團(tuán)隊(duì)研究主管 Hongyu Ren，上陣 Reddit 和網(wǎng)友們來了場互動 Q&A。

下面是幾個(gè)點(diǎn)贊排名靠前的問題：

問題 1：我們能看到所有的思維 tokens 嗎？

回答（Sam Altman）：是的，我們將很快展示一個(gè)更有幫助和詳細(xì)的版本。感謝 r1 提醒我們。

問題 2：你們會考慮發(fā)布一些模型權(quán)重和發(fā)表一些研究嗎？

回答（Sam Altman）：這個(gè)還在討論中。我個(gè)人認(rèn)為在這個(gè)問題上我們站在了歷史的錯(cuò)誤一方，需要找出一個(gè)不同的開源策略。不過不是所有 OpenAI 的人都同意這個(gè)觀點(diǎn)，而且目前這也不是我們最高優(yōu)先級。

問題 3：完整版 o3 什么時(shí)候發(fā)布？

回答（Sam Altman）：我估計(jì)超過幾周，少于幾個(gè)月。

問題 4：語音模式會更新嗎？這是 GPT-5o 的一個(gè)重點(diǎn)嗎？GPT-5o 的大致時(shí)間表是什么？

回答（Sam Altman）：語音模式更新即將到來！我想我們會直接叫它 GPT-5 而不是 GPT-5o。目前還沒有時(shí)間表。

問題 5：你們會推出基于 4o 的圖像生成器嗎？

回答（Kevin Weil）：是的！我們正在開發(fā)。而且我認(rèn)為這值得等待。

問題 6：你們計(jì)劃在未來推理模型中會添加文件附件功能嗎？

回答（Srinivas Narayanan）：正在開發(fā)中。推理模型未來將能夠使用包括檢索在內(nèi)的不同工具。

補(bǔ)充回答（Kevin Weil）：我只想說，我迫不及待想看到帶工具使用的推理模型了 : )

問題 7：Stargate 的成功對 OpenAI 的未來有多重要？

回答（Kevin Weil）：非常重要。我們看到的一切都表明，計(jì)算能力越多，我們就能建立更好的模型，并制造更有價(jià)值的產(chǎn)品。我們現(xiàn)在同時(shí)在兩個(gè)維度上擴(kuò)展模型——更大的預(yù)訓(xùn)練和更多的強(qiáng)化學(xué)習(xí) /strawberry 訓(xùn)練，這兩者都需要計(jì)算資源。為數(shù)億用戶提供服務(wù)，并且隨著我們轉(zhuǎn)向更多為您持續(xù)工作的智能產(chǎn)品，這些也都需要計(jì)算資源。因此可以將 Stargate 視為我們的工廠，將算力 /GPU 轉(zhuǎn)化為令人驚嘆的產(chǎn)品。

目前，大部分評論區(qū)群眾表示喜聞樂見，" 打起來了，愛看，多發(fā)！"

編程軟件 Cursor 算是手快的，最新兩條推文相繼宣布 DeepSeek 模型和 o3-mini 都已經(jīng)整合進(jìn)來，但對平臺的開發(fā)人員們?nèi)匀蛔類?Claude Sonnet" 表示很驚訝 "。

當(dāng)然也有人表示，既然 DeepSeek 已經(jīng)免費(fèi)提供這些尖端 AI 技術(shù)了，為什么要花錢升級 GPT 呢？

就像 Lex Fridman 說的，"OpenAI o3-mini 是一個(gè)很好的模型，但 DeepSeek R1 的性能相似還更便宜，并且展示推理過程（目前大家反映 o3-mini 并沒像奧特曼說的那樣看到思維鏈顯示）。

盡管更好的模型將會出現(xiàn)（迫不及待地想看 o3pro），但「DeepSeek 時(shí)刻」是真實(shí)存在的。我認(rèn)為 5 年后它仍將作為科技史上的關(guān)鍵事件被人們銘記。"

国产一级黄片视频_精品无码免费成a人片_久久婷婷国产综合尤物精品_日韩精品亚洲精品无码专区

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業(yè)峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節(jié)目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業(yè)展廳解決方案

元宇宙藝術(shù)展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫稿助手

AI口語陪練

我的訂閱

Altman 因 DeepSeek “認(rèn)錯(cuò)”：在開源上 OpenAI 站在了歷史的錯(cuò)誤一方

宙世代

一起剪

相關(guān)閱讀

iPhone、RTX 50都要漲價(jià)！臺積電欲轉(zhuǎn)嫁關(guān)稅成本 半導(dǎo)體價(jià)格恐上漲15%

DeepSeek凸顯美國科技制裁失?。旱诙€(gè)華為

2024年中國電視盒子線上銷量TOP10：小米第3

新疆阿克蘇地區(qū)庫車市發(fā)生5.0級地震：多地震感強(qiáng)烈

聯(lián)合創(chuàng)新推出新款43.8寸顯示器：4K 120Hz屏首發(fā)9999元

我敢打賭，今年一定會有人買錯(cuò)電腦型號。。。

僅980g！華碩新款Zenbook A14筆記本上市：全陶瓷鋁材質(zhì)

三星超越Intel登頂全球最大半導(dǎo)體廠商！NVIDIA躍居成第三

當(dāng)AI遇見XR，2025年技術(shù)如何重塑我們的現(xiàn)實(shí)世界？

2.5萬元買的RTX 5090D升級驅(qū)動后變磚！GPU核心可能燒了

超DeepSeek V3！阿里云Qwen2.5-Max闖入全球盲測榜單前十

RTX 5090太缺貨！黃牛3倍價(jià)格倒賣

股價(jià)異動，每日互動：未持有深度求索和幻方科技的股權(quán)

最新評論

硅星人

熱門推薦

iPhone、RTX 50都要漲價(jià)！臺積電欲轉(zhuǎn)嫁關(guān)稅成本半導(dǎo)體價(jià)格恐上漲15%

DeepSeek凸顯美國科技制裁失?。旱诙€(gè)華為

我敢打賭，今年一定會有人買錯(cuò)電腦型號。。。

三星超越Intel登頂全球最大半導(dǎo)體廠商！NVIDIA躍居成第三

當(dāng)AI遇見XR，2025年技術(shù)如何重塑我們的現(xiàn)實(shí)世界？

2.5萬元買的RTX 5090D升級驅(qū)動后變磚！GPU核心可能燒了

超DeepSeek V3！阿里云Qwen2.5-Max闖入全球盲測榜單前十