訂閱
糾錯(cuò)
加入自媒體

OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測(cè):中文穩(wěn)、細(xì)節(jié)炸,設(shè)計(jì)師慌了

2026-04-22 10:41
雷科技
關(guān)注

這下設(shè)計(jì)師和畫師真的被威脅到了。

還在熬夜做圖的設(shè)計(jì)師們,這下真的有些尷尬了:在幾乎沒(méi)有預(yù)告的情況下,OpenAI 于北京時(shí)間 2026 年 4 月 22 日凌晨發(fā)布了 ChatGPT Images 2.0 模型(下文簡(jiǎn)稱 Images 2.0)。

和 ChatGPT 原本的生圖模型相比,Images 2.0 在圖片精度、語(yǔ)言支持、分辨率支持和交互方式上都有著相當(dāng)顯著的提升。值得一提的是,這次發(fā)布的 Images 2.0 甚至還擁有了思考的能力。

截屏2026-04-22 03.00.53.png

圖片來(lái)源:OpenAI

簡(jiǎn)單來(lái)說(shuō),Images 2.0(現(xiàn)已在 ChatGPT、API 中使用)其實(shí)包含兩個(gè)模型(分支):

1. 快速模型(Instant Model)可以處理絕大多數(shù)日常任務(wù),比如制作 Logo、多語(yǔ)言海報(bào)甚至是文章配圖;

2. 思考模型(Thinking Model、需手動(dòng)切換)可以通過(guò)網(wǎng)絡(luò)查找相關(guān)信息,并在生圖前先對(duì)內(nèi)容進(jìn)行推理,并在一組輸出中保證畫面內(nèi)容連貫。

接下來(lái)我們直接用圖片來(lái)舉例。

下面這張照片是雷科技 AWE26 報(bào)道團(tuán)出發(fā)前拍的合照,我們直接把這張圖丟給 ChatGPT、輸出我們的需求:

微信圖片_2026-04-22_034130_396.jpg

圖片來(lái)源:雷科技

做一本《雷科技》科技雜志的封面,封面是圖片里這幾個(gè)人。

不到一分鐘,ChatGPT 就把封面做好了?梢钥吹饺碌 Images 2.0,不僅不會(huì)把基礎(chǔ)圖片重繪(這是大多數(shù)生圖 AI 的通。踔吝B中文的部分都能正確繪制。

ChatGPT Image 2026年4月22日 05_07_35.png

圖片來(lái)源:雷科技

但這還沒(méi)完,在提出「日期改成 2026 年 3月」「人的姿勢(shì)可以變一下,這樣太死板了」等模糊的提示詞后,ChatGPT 依舊能順利完成任務(wù)。

ChatGPT Image 2026年4月22日 05_08_17.png

圖片來(lái)源:雷科技

同樣的,只要「喂」給 Images 2.0 一張手機(jī)外觀,ChatGPt 也能直接完成手機(jī)使用場(chǎng)景照。

ChatGPT Image 2026年4月22日 03_58_03.png

圖片來(lái)源:雷科技

而在全新的圖片查看界面,ChatGPT 還加入了兩項(xiàng)全新的功能——我們可以直接選擇圖片需要修改的區(qū)域,要求 ChatGPT 做出修改,還可以直接在長(zhǎng)寬比選單中選擇需要輸出的圖片比例,自媒體配圖變得更方便了。

截屏2026-04-22 04.02.33.png

除了基于圖片生成新的圖片,Images 2.0 基于文字做圖的能力也有所提升。雷科技只給出了「電車通馬上要出發(fā)報(bào)道 2026 北京車展」的信息,Images 2.0 就能自己找齊相關(guān)信息,并正確輸出海報(bào)。

ChatGPT Image 2026年4月22日 04_17_32.png

圖片來(lái)源:雷科技

較為可惜的是,盡管在 OpenAI 的直播中,Images 2.0 可以正確處理二維碼信息,但雷科技經(jīng)過(guò)多次嘗試,仍無(wú)法在圖片中嵌入可以被識(shí)別的二維碼。

截屏2026-04-22 03.11.53.png

圖片來(lái)源:雷科技

其實(shí)從效果來(lái)看,Images 2.0 的多語(yǔ)言支持已經(jīng)非常出色了。但為了拉開能力差距,雷科技決定給 Images 2.0 上點(diǎn)強(qiáng)度:

生成一個(gè)照片風(fēng)格圖片:一幅毛筆書法作品在博物館展出,上書: 北國(guó)風(fēng)光,千里冰封,萬(wàn)里雪飄。望長(zhǎng)城內(nèi)外,惟余莽莽;大河上下,頓失滔滔。山舞銀蛇,原馳蠟象,欲與天公試比高。須晴日,看紅裝素裹,分外妖嬈。 江山如此多嬌,引無(wú)數(shù)英雄競(jìng)折腰。惜秦皇漢武,略輸文采;唐宗宋祖,稍遜風(fēng)騷。一代天驕,成吉思汗,只識(shí)彎弓射大雕。俱往矣,數(shù)風(fēng)流人物,還看今朝。

盡管文本內(nèi)容更長(zhǎng),不過(guò) ChatGPT 仍在一分鐘之內(nèi)就輸出了結(jié)果?梢钥闯,Images 2.0 的中文支持確實(shí)不錯(cuò),字體字形基本沒(méi)有問(wèn)題,但書法的「質(zhì)感」仍有欠缺,怎么看都像是「印刷品」。

ChatGPT Image 2026年4月22日 05_09_34.png

圖片來(lái)源:雷科技

說(shuō)完 Instant Model,我們?cè)賮?lái)看看思考模式的能力。這次雷科技直接給 Images 2.0 準(zhǔn)備了一道大題:

以上圖里的形象為漫畫主角,生成一部摩托車為主題的短篇漫畫,篇幅至少要 8 頁(yè),封面和封底為彩色,其余為黑白,畫風(fēng)參考石森章太郎。

接到需求后,Images 2.0 會(huì)有一個(gè)明顯的思考推理步驟;點(diǎn)開推理詳情,我們甚至能看到 Images 2.0 編寫對(duì)話的過(guò)程。這其實(shí)越正常,畢竟我并沒(méi)有給出任何關(guān)于劇情的提示詞,全權(quán)交給 Images 2.0 自由發(fā)布。

在耗時(shí) 11 分鐘后,Images 2.0 成功輸出了一組 8 張圖。值得注意的是,Images 2.0 不僅在 8 張圖中做到了畫風(fēng)和細(xì)節(jié)的統(tǒng)一(除了時(shí)有時(shí)無(wú)的頭盔),甚至連劇情都能保持上下文連貫。這種超長(zhǎng)連續(xù)推理能力,即使是 Nano Banana 也難以做到。

ChatGPT Image 2026年4月22日 05_12_48 (1).png

ChatGPT Image 2026年4月22日 05_13_42.png

ChatGPT Image 2026年4月22日 05_13_45.png

ChatGPT Image 2026年4月22日 05_13_48.png

ChatGPT Image 2026年4月22日 05_13_51.png

ChatGPT Image 2026年4月22日 05_13_54.png

ChatGPT Image 2026年4月22日 05_13_57.png

ChatGPT Image 2026年4月22日 05_14_00.png

也正因如此,雷科技認(rèn)為,Images 2.0 的表現(xiàn),完全可以用一騎絕塵來(lái)形容。

因?yàn)橛|發(fā)了 ChatGPT Plus 用戶的公平使用限額機(jī)制,雷科技的 Images 2.0 體驗(yàn)到這里就暫告一段落了。但就雷科技的體驗(yàn)來(lái)說(shuō),Images 2.0 的能力上限遠(yuǎn)不僅如此:

除了支持中文(及印地語(yǔ)、日語(yǔ)等多種亞洲語(yǔ)言)、連續(xù)推理等能力外,在直播中,OpenAI 還提到了 Images 2.0 能在米粒上寫字的超精細(xì)制圖能力,以及生成 360 度全景照片的能力。

截屏2026-04-22 03.18.39.png

圖片來(lái)源:OpenAI

截屏2026-04-22 03.19.03.png

圖片來(lái)源:OpenAI

也正因 Images 2.0 制圖效果如此出色,雷科技認(rèn)為 Images 2.0 的登場(chǎng),也標(biāo)志著 AI 生圖正式告別了那個(gè)靠玄學(xué)提示詞「抽卡」的蠻荒時(shí)代。

如果大家有玩過(guò) Stable Diffusion 等早期文生圖 AI,應(yīng)該對(duì)文生圖的「蠻荒時(shí)代」有印象:你可能第一次嘗試就做出了自己想要的圖片,也可能來(lái)來(lái)回回調(diào)整提示詞,用兩個(gè)小時(shí)生成了幾百 GB 的廢片,體驗(yàn)甚至比二次元「抽卡手游」還要差——二游至少有保底機(jī)制。

在當(dāng)時(shí),我們?nèi)绻胍WC圖片「有較大概率符合要求」,就必須用 ComfyUI;而 ComfyUI 復(fù)雜的節(jié)點(diǎn)設(shè)計(jì),從某種意義上也違背了 AI 生圖「偷懶」的目標(biāo)。

但 Images 2.0 引入「思考模型」后,AI 第一次具備了長(zhǎng)文本邏輯解析與時(shí)空一致性的推理能力。

以剛剛提到的畫漫畫工作流為例,Images 2.0 可以先理解場(chǎng)景、構(gòu)思劇情、布局文字,最后再落筆。這種從底層邏輯出發(fā)的進(jìn)化,直接解決了 AI 繪畫中「文字崩壞」與「畫風(fēng)不統(tǒng)一」這兩大問(wèn)題,極大地拓寬了 AI 的生產(chǎn)力邊界。

截屏2026-04-22 03.01.31.png

圖片來(lái)源:OpenAI

可以肯定的是,Images 2.0 的出現(xiàn),對(duì)于繪畫、攝影行業(yè)的沖擊極為「慘烈」;而從 AI 發(fā)展的角度看,OpenAI 也再次證明了單純的分辨率并不能從根本提升 AI 的工作效率,推理能力才是 AI 圖像的核心競(jìng)爭(zhēng)力領(lǐng)域。

在 AI 圖像時(shí)代,OpenAI 已經(jīng)為我們開了一個(gè)好頭。接下來(lái),就得看 Google 和國(guó)內(nèi) AI 巨頭們?cè)撊绾螒?yīng)對(duì)了。

AIOpenAIChatGPT

來(lái)源:雷科技

本文圖片來(lái)自:123RF 正版圖庫(kù)       

       原文標(biāo)題 : OpenAI深夜王炸!ChatGPT Images 2.0實(shí)測(cè):中文穩(wěn)、細(xì)節(jié)炸,設(shè)計(jì)師慌了

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)