123,123

OpenAI深夜王炸！ChatGPT Images 2.0實(shí)測(cè)：中文穩(wěn)、細(xì)節(jié)炸，設(shè)計(jì)師慌了

2026-04-22 10:41

這下設(shè)計(jì)師和畫師真的被威脅到了。

還在熬夜做圖的設(shè)計(jì)師們，這下真的有些尷尬了：在幾乎沒(méi)有預(yù)告的情況下，OpenAI 于北京時(shí)間 2026 年 4 月 22 日凌晨發(fā)布了 ChatGPT Images 2.0 模型（下文簡(jiǎn)稱 Images 2.0）。

和 ChatGPT 原本的生圖模型相比，Images 2.0 在圖片精度、語(yǔ)言支持、分辨率支持和交互方式上都有著相當(dāng)顯著的提升。值得一提的是，這次發(fā)布的 Images 2.0 甚至還擁有了思考的能力。

截屏2026-04-22 03.00.53.png

圖片來(lái)源：OpenAI

簡(jiǎn)單來(lái)說(shuō)，Images 2.0（現(xiàn)已在 ChatGPT、API 中使用）其實(shí)包含兩個(gè)模型（分支）：

1. 快速模型（Instant Model）可以處理絕大多數(shù)日常任務(wù)，比如制作 Logo、多語(yǔ)言海報(bào)甚至是文章配圖；

2. 思考模型（Thinking Model、需手動(dòng)切換）可以通過(guò)網(wǎng)絡(luò)查找相關(guān)信息，并在生圖前先對(duì)內(nèi)容進(jìn)行推理，并在一組輸出中保證畫面內(nèi)容連貫。

接下來(lái)我們直接用圖片來(lái)舉例。

下面這張照片是雷科技 AWE26 報(bào)道團(tuán)出發(fā)前拍的合照，我們直接把這張圖丟給 ChatGPT、輸出我們的需求：

微信圖片_2026-04-22_034130_396.jpg

圖片來(lái)源：雷科技

做一本《雷科技》科技雜志的封面，封面是圖片里這幾個(gè)人。

不到一分鐘，ChatGPT 就把封面做好了�？梢钥吹饺碌� Images 2.0，不僅不會(huì)把基礎(chǔ)圖片重繪（這是大多數(shù)生圖 AI 的通�。踔吝B中文的部分都能正確繪制。

ChatGPT Image 2026年4月22日 05_07_35.png

圖片來(lái)源：雷科技

但這還沒(méi)完，在提出「日期改成 2026 年 3月」「人的姿勢(shì)可以變一下，這樣太死板了」等模糊的提示詞后，ChatGPT 依舊能順利完成任務(wù)。

ChatGPT Image 2026年4月22日 05_08_17.png

圖片來(lái)源：雷科技

同樣的，只要「喂」給 Images 2.0 一張手機(jī)外觀，ChatGPt 也能直接完成手機(jī)使用場(chǎng)景照。

ChatGPT Image 2026年4月22日 03_58_03.png

圖片來(lái)源：雷科技

而在全新的圖片查看界面，ChatGPT 還加入了兩項(xiàng)全新的功能——我們可以直接選擇圖片需要修改的區(qū)域，要求 ChatGPT 做出修改，還可以直接在長(zhǎng)寬比選單中選擇需要輸出的圖片比例，自媒體配圖變得更方便了。

截屏2026-04-22 04.02.33.png

除了基于圖片生成新的圖片，Images 2.0 基于文字做圖的能力也有所提升。雷科技只給出了「電車通馬上要出發(fā)報(bào)道 2026 北京車展」的信息，Images 2.0 就能自己找齊相關(guān)信息，并正確輸出海報(bào)。

ChatGPT Image 2026年4月22日 04_17_32.png

圖片來(lái)源：雷科技

較為可惜的是，盡管在 OpenAI 的直播中，Images 2.0 可以正確處理二維碼信息，但雷科技經(jīng)過(guò)多次嘗試，仍無(wú)法在圖片中嵌入可以被識(shí)別的二維碼。

截屏2026-04-22 03.11.53.png

圖片來(lái)源：雷科技

其實(shí)從效果來(lái)看，Images 2.0 的多語(yǔ)言支持已經(jīng)非常出色了。但為了拉開能力差距，雷科技決定給 Images 2.0 上點(diǎn)強(qiáng)度：

生成一個(gè)照片風(fēng)格圖片：一幅毛筆書法作品在博物館展出，上書：北國(guó)風(fēng)光，千里冰封，萬(wàn)里雪飄。望長(zhǎng)城內(nèi)外，惟余莽莽；大河上下，頓失滔滔。山舞銀蛇，原馳蠟象，欲與天公試比高。須晴日，看紅裝素裹，分外妖嬈。江山如此多嬌，引無(wú)數(shù)英雄競(jìng)折腰。惜秦皇漢武，略輸文采；唐宗宋祖，稍遜風(fēng)騷。一代天驕，成吉思汗，只識(shí)彎弓射大雕。俱往矣，數(shù)風(fēng)流人物，還看今朝。

盡管文本內(nèi)容更長(zhǎng)，不過(guò) ChatGPT 仍在一分鐘之內(nèi)就輸出了結(jié)果�？梢钥闯�，Images 2.0 的中文支持確實(shí)不錯(cuò)，字體字形基本沒(méi)有問(wèn)題，但書法的「質(zhì)感」仍有欠缺，怎么看都像是「印刷品」。

ChatGPT Image 2026年4月22日 05_09_34.png

圖片來(lái)源：雷科技

說(shuō)完 Instant Model，我們?cè)賮?lái)看看思考模式的能力。這次雷科技直接給 Images 2.0 準(zhǔn)備了一道大題：

以上圖里的形象為漫畫主角，生成一部摩托車為主題的短篇漫畫，篇幅至少要 8 頁(yè)，封面和封底為彩色，其余為黑白，畫風(fēng)參考石森章太郎。

接到需求后，Images 2.0 會(huì)有一個(gè)明顯的思考推理步驟；點(diǎn)開推理詳情，我們甚至能看到 Images 2.0 編寫對(duì)話的過(guò)程。這其實(shí)越正常，畢竟我并沒(méi)有給出任何關(guān)于劇情的提示詞，全權(quán)交給 Images 2.0 自由發(fā)布。

在耗時(shí) 11 分鐘后，Images 2.0 成功輸出了一組 8 張圖。值得注意的是，Images 2.0 不僅在 8 張圖中做到了畫風(fēng)和細(xì)節(jié)的統(tǒng)一（除了時(shí)有時(shí)無(wú)的頭盔），甚至連劇情都能保持上下文連貫。這種超長(zhǎng)連續(xù)推理能力，即使是 Nano Banana 也難以做到。

ChatGPT Image 2026年4月22日 05_12_48 (1).png

ChatGPT Image 2026年4月22日 05_13_42.png

ChatGPT Image 2026年4月22日 05_13_45.png

ChatGPT Image 2026年4月22日 05_13_48.png

ChatGPT Image 2026年4月22日 05_13_51.png

ChatGPT Image 2026年4月22日 05_13_54.png

ChatGPT Image 2026年4月22日 05_13_57.png

ChatGPT Image 2026年4月22日 05_14_00.png

也正因如此，雷科技認(rèn)為，Images 2.0 的表現(xiàn)，完全可以用一騎絕塵來(lái)形容。

因?yàn)橛|發(fā)了 ChatGPT Plus 用戶的公平使用限額機(jī)制，雷科技的 Images 2.0 體驗(yàn)到這里就暫告一段落了。但就雷科技的體驗(yàn)來(lái)說(shuō)，Images 2.0 的能力上限遠(yuǎn)不僅如此：

除了支持中文（及印地語(yǔ)、日語(yǔ)等多種亞洲語(yǔ)言）、連續(xù)推理等能力外，在直播中，OpenAI 還提到了 Images 2.0 能在米粒上寫字的超精細(xì)制圖能力，以及生成 360 度全景照片的能力。

截屏2026-04-22 03.18.39.png

圖片來(lái)源：OpenAI

截屏2026-04-22 03.19.03.png

圖片來(lái)源：OpenAI

也正因 Images 2.0 制圖效果如此出色，雷科技認(rèn)為 Images 2.0 的登場(chǎng)，也標(biāo)志著 AI 生圖正式告別了那個(gè)靠玄學(xué)提示詞「抽卡」的蠻荒時(shí)代。

如果大家有玩過(guò) Stable Diffusion 等早期文生圖 AI，應(yīng)該對(duì)文生圖的「蠻荒時(shí)代」有印象：你可能第一次嘗試就做出了自己想要的圖片，也可能來(lái)來(lái)回回調(diào)整提示詞，用兩個(gè)小時(shí)生成了幾百 GB 的廢片，體驗(yàn)甚至比二次元「抽卡手游」還要差——二游至少有保底機(jī)制。

在當(dāng)時(shí)，我們?nèi)绻胍ＷC圖片「有較大概率符合要求」，就必須用 ComfyUI；而 ComfyUI 復(fù)雜的節(jié)點(diǎn)設(shè)計(jì)，從某種意義上也違背了 AI 生圖「偷懶」的目標(biāo)。

但 Images 2.0 引入「思考模型」后，AI 第一次具備了長(zhǎng)文本邏輯解析與時(shí)空一致性的推理能力。

以剛剛提到的畫漫畫工作流為例，Images 2.0 可以先理解場(chǎng)景、構(gòu)思劇情、布局文字，最后再落筆。這種從底層邏輯出發(fā)的進(jìn)化，直接解決了 AI 繪畫中「文字崩壞」與「畫風(fēng)不統(tǒng)一」這兩大問(wèn)題，極大地拓寬了 AI 的生產(chǎn)力邊界。

截屏2026-04-22 03.01.31.png

圖片來(lái)源：OpenAI

可以肯定的是，Images 2.0 的出現(xiàn)，對(duì)于繪畫、攝影行業(yè)的沖擊極為「慘烈」；而從 AI 發(fā)展的角度看，OpenAI 也再次證明了單純的分辨率并不能從根本提升 AI 的工作效率，推理能力才是 AI 圖像的核心競(jìng)爭(zhēng)力領(lǐng)域。

在 AI 圖像時(shí)代，OpenAI 已經(jīng)為我們開了一個(gè)好頭。接下來(lái)，就得看 Google 和國(guó)內(nèi) AI 巨頭們?cè)撊绾螒?yīng)對(duì)了。

AIOpenAIChatGPT

來(lái)源：雷科技

本文圖片來(lái)自：123RF 正版圖庫(kù)

原文標(biāo)題 : OpenAI深夜王炸！ChatGPT Images 2.0實(shí)測(cè)：中文穩(wěn)、細(xì)節(jié)炸，設(shè)計(jì)師慌了