終于,GPT-5發(fā)布了,也被噴慘了
劃重點(diǎn):
1、期盼2年的GPT-5終于在如期而至,超過(guò)那些全球最聰明的大模型,達(dá)到博士水平。
2、GPT-5目前已面向普通用戶提供免費(fèi)、plus和Pro三種模式;同時(shí)在API平臺(tái)上,推出了GPT-5、GPT-5 nano、GPT-5 mini三種模型選擇。
3、OpenAI直播期間出現(xiàn)重大失誤,播出的性能圖表被網(wǎng)友怒噴。
作者 常遠(yuǎn)
編輯 重點(diǎn)君
GPT-5,終于在深夜出爐。
以為很震驚,以為很驚艷???確實(shí)有。
但先來(lái)看一張圖:
OpenAI到底是如何做到在全球直播的場(chǎng)合展示Benchmark,竟然能把52.8顯示得比69.1都高,甚至這個(gè)69.1能跟30.8平齊的???
其它的不談,單就這一點(diǎn),開(kāi)場(chǎng)直接號(hào)稱“博士水平”的AI,就這么水靈靈地“按需縮放”坐標(biāo)系,也是引得網(wǎng)友怒噴不已。
甚至Altman都趕忙出來(lái)轉(zhuǎn)移話題,稱技術(shù)博客上是正確的……
確實(shí),技術(shù)博客確實(shí)是有所更正。
但如此失誤,著實(shí)不應(yīng)該,畢竟大家都等了2年!
博士水平的AI,來(lái)了
不過(guò)有一說(shuō)一,除了這個(gè)被大眾詬病的致命失誤之外,GPT-5在現(xiàn)場(chǎng)的表現(xiàn)還算是可圈可點(diǎn)。
在技術(shù)博客中,OpenAI開(kāi)場(chǎng)直接一句:“迄今為止,這是我們最智能、最快速、最實(shí)用的模型,內(nèi)置的思考能力讓每個(gè)人都能擁有專家級(jí)智能。”
這次發(fā)布的GPT-5擁有四個(gè)版本:
GPT-5:在不同領(lǐng)域中進(jìn)行Coding和執(zhí)行任務(wù)的標(biāo)準(zhǔn)模式;
GPT-5 mini:輕量版版本,適用于對(duì)明確界定的任務(wù)和場(chǎng)景;
GPT-5 nano:強(qiáng)調(diào)運(yùn)行速度和性價(jià)比;
GPT-5 Chat:ChatGPT中使用的版本。
GPT-5目前已面向普通用戶提供免費(fèi)、plus和Pro三種模式。
同時(shí)在API平臺(tái)上,推出了GPT-5、GPT-5 nano、GPT-5 mini三種模型選擇。
不僅如此,承接昨天時(shí)隔6年的開(kāi)源,OpenAI表示這次GPT-5面向所有人,免費(fèi)!并且是博士水平的那種。
我們先來(lái)看下Benchmark。
最讓人吸睛的,還是GPT-5在AIME 2025的表現(xiàn),直接拿下滿分的成績(jī)。
其次就是編程能力,相較于o3和4o,GPT-5在思考模式加持之下,達(dá)到了74.9%的水平。
除此之外,這個(gè)模型在多種多模態(tài)評(píng)測(cè)中表現(xiàn)出色,覆蓋了圖像、視頻、空間理解和科學(xué)推理等方面。
更強(qiáng)的多模態(tài)能力,意味著ChatGPT在處理圖片和其他非文字信息時(shí)更聰明了——比如看懂圖表、總結(jié)一張演示照片的內(nèi)容,或者回答關(guān)于圖示的問(wèn)題。
而且比較罕見(jiàn)的是,第三方的大模型競(jìng)技場(chǎng)(Imarena.ai)也是及時(shí)跟進(jìn),直接發(fā)聲表明:“全方面第一”。
具體而言,競(jìng)技場(chǎng)涉及的內(nèi)容包括:文本、Web開(kāi)發(fā)、視覺(jué)、編程、數(shù)學(xué)、創(chuàng)造力、長(zhǎng)查詢等。
由此可見(jiàn),GPT-5從目前評(píng)測(cè)標(biāo)準(zhǔn)來(lái)看,確實(shí)是AI大模型的衛(wèi)冕之王。
再看效果
成績(jī)是一方面,但實(shí)際效果才是硬道理。
深諳此理的Sam Altman在自己的X賬號(hào)上也是立馬跟進(jìn),發(fā)布了由GPT-5生成的效果:
并且Altman還表示,有GPT-5權(quán)限的用戶,只需發(fā)送“use beatbot to make a sick beat to celebrate gpt-5”即可體驗(yàn)。
不多不說(shuō),營(yíng)銷(xiāo)這塊,Altman還是非常手拿把掐的。
不過(guò)在直播的現(xiàn)場(chǎng)演示過(guò)程中,GPT-5還是有不少驚艷的表現(xiàn)在身上的。
例如讓GPT-5生成一個(gè)學(xué)語(yǔ)法的APP,效果是這樣的:
不要以為是簡(jiǎn)單的網(wǎng)站,除了可以完成市面上AI的交互之外,它在里面還可以內(nèi)嵌一個(gè)小游戲(點(diǎn)擊“Mouse&Cheese”):
并且若是想改變APP里面的內(nèi)容,只要一句話,瞬間(現(xiàn)場(chǎng)實(shí)測(cè))就可以改變布局:
對(duì)于更加龐大且復(fù)雜的項(xiàng)目,例如現(xiàn)場(chǎng)OpenAI展示了用GPT-5先編程出來(lái)的代碼:
在運(yùn)行之后,便得到了一個(gè)3D效果的“世界”:
總而言之,從現(xiàn)場(chǎng)效果來(lái)看,GPT-5也是擔(dān)得起“最聰明、最強(qiáng)編程”的大模型。
“觀眾”們買(mǎi)單嗎?
從目前X上“觀眾”的反饋來(lái)看,討論最激烈的就是前面我們提到的圖表bug。
甚至有網(wǎng)友做了一張簡(jiǎn)單粗暴的Excel表格來(lái)諷刺這次的失誤:
不過(guò)另一方面,老東家微軟CEO火速出面站臺(tái),并配有一個(gè)“愛(ài)心”圖片以表支持:
再如開(kāi)發(fā)者們常用的VS Code,官方也是Day 0無(wú)縫銜接GPT-5:
不過(guò)對(duì)于普羅大眾來(lái)說(shuō),反饋聲音最大的莫過(guò)于:“說(shuō)好的免費(fèi),我的ChatGPT咋沒(méi)有呢?”
總而言之,用戶到底買(mǎi)不買(mǎi)單,實(shí)測(cè)效果到底有沒(méi)有那么神,需要讓子彈再飛一會(huì)了。
參考鏈接:
原文標(biāo)題 : 終于,GPT-5發(fā)布了,也被噴慘了

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-
機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-
存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-
長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-
豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-
字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
-
員工持股爆雷?廣汽埃安緊急回應(yīng)
-
中國(guó)“智造”背后的「關(guān)鍵力量」
-
小米汽車(chē)研發(fā)中心重磅落地,寶馬家門(mén)口“搶人”
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國(guó)際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開(kāi)發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 2 人形機(jī)器人,正狂奔在批量交付的曠野
- 3 宇樹(shù)機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 5 AI版“四萬(wàn)億刺激”計(jì)劃來(lái)了
- 6 2025年8月人工智能投融資觀察
- 7 8 a16z最新AI百?gòu)?qiáng)榜:硅谷頂級(jí)VC帶你讀懂全球生成式AI賽道最新趨勢(shì)
- 9 Manus跑路,大廠掉線,只能靠DeepSeek了
- 10 地平線的野心:1000萬(wàn)套HSD上車(chē)