123,123,123

當(dāng)前位置： OFweek 人工智能網(wǎng) > 自然語言處理 > 正文

終于，GPT-5發(fā)布了，也被噴慘了

2025-08-08 15:51

劃重點KeyPoints

劃重點：

1、期盼2年的GPT-5終于在如期而至，超過那些全球最聰明的大模型，達到博士水平。

2、GPT-5目前已面向普通用戶提供免費、plus和Pro三種模式；同時在API平臺上，推出了GPT-5、GPT-5 nano、GPT-5 mini三種模型選擇。

3、OpenAI直播期間出現(xiàn)重大失誤，播出的性能圖表被網(wǎng)友怒噴。

作者常遠(yuǎn)

編輯重點君

GPT-5，終于在深夜出爐。

以為很震驚，以為很驚艷？？？確實有。

但先來看一張圖：

OpenAI到底是如何做到在全球直播的場合展示Benchmark，竟然能把52.8顯示得比69.1都高，甚至這個69.1能跟30.8平齊的？？？

其它的不談，單就這一點，開場直接號稱“博士水平”的AI，就這么水靈靈地“按需縮放”坐標(biāo)系，也是引得網(wǎng)友怒噴不已。

甚至Altman都趕忙出來轉(zhuǎn)移話題，稱技術(shù)博客上是正確的……

確實，技術(shù)博客確實是有所更正。

但如此失誤，著實不應(yīng)該，畢竟大家都等了2年��！

博士水平的AI，來了

不過有一說一，除了這個被大眾詬病的致命失誤之外，GPT-5在現(xiàn)場的表現(xiàn)還算是可圈可點。

在技術(shù)博客中，OpenAI開場直接一句：“迄今為止，這是我們最智能、最快速、最實用的模型，內(nèi)置的思考能力讓每個人都能擁有專家級智能。”

這次發(fā)布的GPT-5擁有四個版本：

GPT-5：在不同領(lǐng)域中進行Coding和執(zhí)行任務(wù)的標(biāo)準(zhǔn)模式；

GPT-5 mini：輕量版版本，適用于對明確界定的任務(wù)和場景；

GPT-5 nano：強調(diào)運行速度和性價比；

GPT-5 Chat：ChatGPT中使用的版本。

GPT-5目前已面向普通用戶提供免費、plus和Pro三種模式。

同時在API平臺上，推出了GPT-5、GPT-5 nano、GPT-5 mini三種模型選擇。

不僅如此，承接昨天時隔6年的開源，OpenAI表示這次GPT-5面向所有人，免費！并且是博士水平的那種。

我們先來看下Benchmark。

最讓人吸睛的，還是GPT-5在AIME 2025的表現(xiàn)，直接拿下滿分的成績。

其次就是編程能力，相較于o3和4o，GPT-5在思考模式加持之下，達到了74.9%的水平。

除此之外，這個模型在多種多模態(tài)評測中表現(xiàn)出色，覆蓋了圖像、視頻、空間理解和科學(xué)推理等方面。

更強的多模態(tài)能力，意味著ChatGPT在處理圖片和其他非文字信息時更聰明了——比如看懂圖表、總結(jié)一張演示照片的內(nèi)容，或者回答關(guān)于圖示的問題。

而且比較罕見的是，第三方的大模型競技場（Imarena.ai）也是及時跟進，直接發(fā)聲表明：“全方面第一”。

具體而言，競技場涉及的內(nèi)容包括：文本、Web開發(fā)、視覺、編程、數(shù)學(xué)、創(chuàng)造力、長查詢等。

由此可見，GPT-5從目前評測標(biāo)準(zhǔn)來看，確實是AI大模型的衛(wèi)冕之王。

再看效果

成績是一方面，但實際效果才是硬道理。

深諳此理的Sam Altman在自己的X賬號上也是立馬跟進，發(fā)布了由GPT-5生成的效果：

并且Altman還表示，有GPT-5權(quán)限的用戶，只需發(fā)送“use beatbot to make a sick beat to celebrate gpt-5”即可體驗。

不多不說，營銷這塊，Altman還是非常手拿把掐的。

不過在直播的現(xiàn)場演示過程中，GPT-5還是有不少驚艷的表現(xiàn)在身上的。

例如讓GPT-5生成一個學(xué)語法的APP，效果是這樣的：

不要以為是簡單的網(wǎng)站，除了可以完成市面上AI的交互之外，它在里面還可以內(nèi)嵌一個小游戲（點擊“Mouse&Cheese”）：

并且若是想改變APP里面的內(nèi)容，只要一句話，瞬間（現(xiàn)場實測）就可以改變布局：

對于更加龐大且復(fù)雜的項目，例如現(xiàn)場OpenAI展示了用GPT-5先編程出來的代碼：

在運行之后，便得到了一個3D效果的“世界”：

總而言之，從現(xiàn)場效果來看，GPT-5也是擔(dān)得起“最聰明、最強編程”的大模型。

“觀眾”們買單嗎？

從目前X上“觀眾”的反饋來看，討論最激烈的就是前面我們提到的圖表bug。

甚至有網(wǎng)友做了一張簡單粗暴的Excel表格來諷刺這次的失誤：

不過另一方面，老東家微軟CEO火速出面站臺，并配有一個“愛心”圖片以表支持：

再如開發(fā)者們常用的VS Code，官方也是Day 0無縫銜接GPT-5：

不過對于普羅大眾來說，反饋聲音最大的莫過于：“說好的免費，我的ChatGPT咋沒有呢？”

總而言之，用戶到底買不買單，實測效果到底有沒有那么神，需要讓子彈再飛一會了。

參考鏈接：

原文標(biāo)題 : 終于，GPT-5發(fā)布了，也被噴慘了

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權(quán)或其他問題，請聯(lián)系舉報。

發(fā)表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

暫無評論

暫無評論

圖片新聞

最新發(fā)布

最新活動更多

一周熱點月點擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報告

人工智能獵頭職位更多

高級軟件工程師廣東省/深圳市
自動化高級工程師廣東省/深圳市
光器件研發(fā)工程師福建省/福州市
銷售總監(jiān)（光器件）北京市/海淀區(qū)
激光器高級銷售經(jīng)理上海市/虹口區(qū)
光器件物理工程師北京市/海淀區(qū)
激光研發(fā)工程師北京市/昌平區(qū)
技術(shù)專家廣東省/江門市
封裝工程師北京市/海淀區(qū)
結(jié)構(gòu)工程師廣東省/深圳市

掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯

x

_*文字標(biāo)題：

_*糾錯內(nèi)容：

聯(lián)系郵箱：

_*驗證碼：

看不清，點擊換一張

粵公網(wǎng)安備 44030502002758號