123,123

視覺AR逆襲！177M效果媲美675M最新SOTA擴(kuò)散模型，僅需一個(gè)“即插即用”的正則化reAR

作者：Qiyuan He等解讀：AI生成未來亮點(diǎn)直擊將生成器和分詞器之間的不一致性，即分詞器無法解碼生成的 token 序列，確定為視覺自回歸生成的瓶頸； reAR，一種即插即用的訓(xùn)練正則化方法

2026-03-19 14:10 評論

騰訊「龍蝦」QClaw體驗(yàn)：AI能連微信干活了，但整體還很粗糙

騰訊把龍蝦放了出來，還能回去？ 3 月 18 日，騰訊終于把 QClaw（騰訊龍蝦）放了出來。不是一場發(fā)布會，也沒有太多預(yù)熱，只是以「邀請制測試」的方式，在一定范圍內(nèi)開放體驗(yàn)。但很快，它就在 AI

2026-03-19 10:29 評論

炸裂！單卡實(shí)時(shí)生成分鐘級長視頻，北大&字節(jié)聯(lián)合推出14B大模型Helios，速度碾壓1.3B

作者：Shenghai Yuan等解讀：AI生成未來亮點(diǎn)直擊長視頻防漂移的魯棒性：Helios 能夠在不依賴常見的防漂移啟發(fā)式方法（如自強(qiáng)制、錯(cuò)誤庫或關(guān)鍵幀采樣）的情況下，生成具有強(qiáng)時(shí)間連貫性的

2026-03-17 16:31 評論

真“六邊形戰(zhàn)士”！Capybara把圖像視頻全打通：一個(gè)模型搞定T2I、T2V、I2V！

作者：Capybara 團(tuán)隊(duì) 解讀：AI生成未來亮點(diǎn)直擊統(tǒng)一的視覺創(chuàng)作模型 Capybara：針對當(dāng)前視覺內(nèi)容創(chuàng)作領(lǐng)域高度碎片化（單一模態(tài)、功能割裂、接口不兼容）的問題，本文提出了Capybar

2026-03-16 16:20 評論

大廠“龍蝦”vs開源“澳龍”，2026 claw橫評

2026年3月，一只紅色的“龍蝦”爬上了開源世界的王座。OpenClaw憑借27.3萬的GitHub星標(biāo)，超越了Linux——英偉達(dá)CEO黃仁勛更是將其譽(yù)為“我們這個(gè)時(shí)代最重要的軟件發(fā)布”。它標(biāo)志著

2026-03-16 10:41 評論

4B參數(shù)干翻14B！國產(chǎn)統(tǒng)一多模態(tài)“全能戰(zhàn)士” InternVL-U開源：理解、生成與編輯迎新高度

作者：Changyao Tian等解讀：AI生成未來 InternVL-U生成和圖像編輯效果亮點(diǎn)直擊 InternVL-U 架構(gòu)：構(gòu)建了一個(gè)僅有 4B 參數(shù)的輕量級、高效統(tǒng)一多模態(tài)模型（UMM），

2026-03-13 14:33 評論

圖像生成迎來“思考-研究-創(chuàng)造”新范式！Mind-Brush:統(tǒng)一意圖分析、多模態(tài)搜索和知識推理

作者：Jun He，Junyan Ye等解讀：AI生成未來亮點(diǎn)直擊 Mind-Brush，一個(gè)新穎的智能體框架，該框架統(tǒng)一了意圖分析、多模態(tài)搜索和知識推理，以實(shí)現(xiàn)圖像生成的“思考-研究-創(chuàng)造”范式

2026-03-12 13:56 評論

Openclaw部署實(shí)錄：安裝易翻車、本地模型弱，本地「龍蝦」不適合普通人

有的錢可不是那么好省的。這段時(shí)間，如果你關(guān)注AI圈子，一定會被一個(gè)名字給刷屏——Openclaw。（圖源：百度）上到GITHUB這個(gè)最大的開源社區(qū)，中到各種媒體爭相轉(zhuǎn)發(fā)，下到各個(gè)up主甚至普通人

2026-03-10 15:58 評論

ICLR 2026 | DragFlow 讓DiT也能“指哪打哪”：基于區(qū)域監(jiān)督的拖拽式圖像編輯新SOTA

作者：Zihan Zhou，Shilin Lu等解讀：AI生成未來亮點(diǎn)直擊首個(gè)基于 Diffusion Transformer（DiT）架構(gòu)量身打造的圖像精確區(qū)域編輯框架。研究團(tuán)隊(duì)摒棄了傳統(tǒng)的

2026-03-09 17:19 評論

CVPR 2026｜“像素級對齊大師” VA-π: 25分鐘微調(diào)FID暴降50%

作者：Xinyao Liao*, Qiyuan He*, Kai Xu, Xiaoye Qu, Yicong Li, Wei Wei, Angela Yao 作者單位：華中科技大學(xué)，新加坡國立大學(xué)解讀

2026-03-03 17:13 評論

CVPR 2026｜“全能AI海報(bào)設(shè)計(jì)師”PosterOmni開源: 6大任務(wù)笑傲開源社區(qū)，媲美閉源商用

作者：Sixiang Chen等解讀：AI生成未來很多AI 海報(bào)生成默認(rèn)從一句 prompt 出發(fā)（Text-to-Poster）。但在真實(shí)設(shè)計(jì)流程里，更常見的起點(diǎn)其實(shí)是一張參考圖/舊海報(bào)/產(chǎn)品主

2026-02-26 15:04 評論

NeurIPS`25 | 清華提出模型驅(qū)動(dòng)的生成式探索機(jī)制MoGE，助力強(qiáng)化學(xué)習(xí)算法突破性能上限

作者：Likun Wang等解讀：AI生成未來本文介紹清華大學(xué)李升波教授課題組（iDLab）在NeurIPS 2025發(fā)表的《Off-policy Reinforcement Learning w

2026-02-25 16:32 評論

顛覆性突破！何愷明團(tuán)隊(duì)重磅工作「Drifting Models」革新生成范式：一步推理直接創(chuàng)紀(jì)錄

作者：Mingyang Deng等解讀：AI生成未來亮點(diǎn)直擊全新的生成范式：提出了“漂移模型” (Drifting Models)，這一范式不再依賴于推理時(shí)的迭代過程，而是將分布演化的過程轉(zhuǎn)移到

2026-02-10 16:19 評論

一張圖生成游戲？谷歌Genie體驗(yàn)：萬物皆可玩，但離“殺死游戲公司”還遠(yuǎn)

一張圖生成游戲，真的假的？在開始之前，我想先問大家一個(gè)簡單的問題：你們還在苦苦等待《GTA 6》的發(fā)售嗎？我是不清楚大家的想法啦，但小雷真的非常期待它的到來。要知道《GTA 5》發(fā)布至今已經(jīng)過去

2026-02-09 10:24 評論

視頻理解大模型覺醒！Video-o3發(fā)布：像偵探一樣主動(dòng)搜尋關(guān)鍵幀，登頂Video-Holmes！

作者：Xiangyu Zeng等解讀：AI生成未來亮點(diǎn)直擊 Video-o3，一個(gè)創(chuàng)新的框架，它通過迭代地發(fā)現(xiàn)顯著的視覺線索、對關(guān)鍵片段進(jìn)行細(xì)致檢查以及在收集到足夠證據(jù)時(shí)自適應(yīng)終止搜索過程，解決了

2026-02-05 14:53 評論

Google“AI奧運(yùn)會”：用游戲基準(zhǔn)測試模型真實(shí)能力

AI新產(chǎn)品每天接連發(fā)布，測試基準(zhǔn)和平臺也是層出不窮。不過，你是否想過，游戲也能用來測試AI？ 2026年2月初，Google和Kaggle一起想出了一個(gè)新點(diǎn)子：在Kaggle的Game Arena上

2026-02-04 10:56 評論

擴(kuò)散模型迎來“終極簡化”！何愷明團(tuán)隊(duì)新作：像素級一步生成，速度質(zhì)量雙巔峰

作者：Yiyang Lu等解讀：AI生成未來亮點(diǎn)直擊 Pixel MeanFlow (pMF)?，這是一種針對一步生成（one-step generation）的創(chuàng)新圖像生成模型。pMF 的核心突

2026-02-02 15:51 評論

擴(kuò)散模型對齊迎來“最強(qiáng)解”！HyperAlign屠榜評測：超網(wǎng)絡(luò)動(dòng)態(tài)適配，畫質(zhì)、語義雙巔峰

作者：Xin Xie等解讀：AI生成未來亮點(diǎn)直擊 HyperAlign，一種通過超網(wǎng)絡(luò)自適應(yīng)調(diào)整去噪操作的框架，能夠高效且有效地實(shí)現(xiàn)擴(kuò)散模型的測試時(shí)對齊，確保生成的圖像更好地反映用戶意圖的文本語義

2026-01-27 16:14 評論

一統(tǒng)視覺江湖！OpenVision 3發(fā)布：一個(gè)編碼器實(shí)現(xiàn)理解與生成完美統(tǒng)一，性能雙殺CLIP

作者：Letian Zhang等解讀：AI生成未來亮點(diǎn)直擊統(tǒng)一架構(gòu)：OpenVision 3是一種先進(jìn)的視覺編碼器，能夠?qū)W習(xí)單一、統(tǒng)一的視覺表示，同時(shí)服務(wù)于圖像理解和圖像生成任務(wù)。簡潔設(shè)計(jì)：核

2026-01-26 16:27 評論

告別時(shí)空崩壞，生成式游戲迎來“穩(wěn)態(tài)”時(shí)刻！南大等StableWorld：打造無限續(xù)航虛擬世界

作者：Ying Yang等解讀：AI生成未來亮點(diǎn)直擊識別了長時(shí)交互式世界建模中不穩(wěn)定性的根本原因：同一場景內(nèi)的微小漂移會不斷累積，最終導(dǎo)致整體場景崩潰。一種簡單而有效的方法?StableWor

2026-01-26 16:22 評論

資訊訂閱

最新活動(dòng) 更多 >>

精彩回顧《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書》查看回顧
精彩回顧 OFweek 2025（第十四屆）中國機(jī)器人產(chǎn)業(yè)大會查看回顧
精彩回顧 Ansys Motion薄膜卷曲卷對卷工藝仿真解決方案查看回顧
精彩回顧 STM32全球線上峰會查看回顧
精彩回顧 2024視覺感知技術(shù)在半導(dǎo)體與印刷包裝創(chuàng)新大會查看回顧
精彩回顧全數(shù)會2024中國人形機(jī)器人技術(shù)創(chuàng)新發(fā)展大會查看回顧

一周熱點(diǎn)

技術(shù)文庫 更多 >>

加密芯片筑牢工業(yè)設(shè)備防抄板防線
2025-11-14
LKT4202UGM、LKT4305GM國密芯片
2025-10-31
金融級安全加密芯片-LKT4304
2025-04-10
ATSHA204A國產(chǎn)全兼容芯片LCSHA204
2025-02-27
耗材保護(hù)芯片-LKT4304解決方案
2025-02-13
LKT4304新一代算法移植加密芯片
2025-01-16