訂閱
糾錯
加入自媒體

面向AI的SSD,徹底火出圈

圖片

當GPU算力以每季度翻番的速度狂飆,當HBM成為AI服務器的“硬通貨”,一塊被嚴重低估的核心部件——面向AI工作負載優(yōu)化的SSD,正站在產(chǎn)業(yè)矛盾的中心點。而當前市場的主流存儲方案HDD與HBM,各自存在難以突破的發(fā)展掣肘,正是這一局面的關鍵成因。

01

HBM、HDD,均不是最優(yōu)解

先看HBM,隨著GPU算力的爆發(fā)式增長,本質(zhì)上是“數(shù)據(jù)處理能力”的指數(shù)級提升。從單卡到集群,從百億參數(shù)到萬億參數(shù),GPU對數(shù)據(jù)的“吞吐需求”只會越來越苛刻:不僅要快,還要穩(wěn)定、無延遲,避免出現(xiàn)“算力空轉(zhuǎn)”。而這種需求,恰好戳中了現(xiàn)有存儲方案的痛點。其次,HBM成為“硬通貨”,是市場對“高帶寬存儲”的被動選擇。HBM的核心優(yōu)勢是“近顯存級的帶寬”,能最大程度匹配GPU的高速計算節(jié)奏,減少數(shù)據(jù)搬運的延遲——這也是它能成為AI服務器標配的關鍵。但HBM的成本邏輯與“規(guī)模化部署”相悖,過度依賴HBM會直接推高AI服務器的整體成本,讓多數(shù)企業(yè)望而卻步。

再看另一主流存儲方案HDD。作為長期占據(jù)存儲市場的“容量擔當”,HDD的優(yōu)勢是低成本、大容量,能滿足數(shù)據(jù)歸檔、冷存儲等場景的需求。但在AI算力狂飆的當下,HDD的性能短板已成為“致命缺陷”:其機械結(jié)構(gòu)決定了讀寫速度和延遲表現(xiàn),完全跟不上GPU的算力釋放節(jié)奏。AI訓練中,數(shù)據(jù)需要從存儲介質(zhì)快速加載到GPU顯存,而HDD的慢響應會導致“數(shù)據(jù)等待算力”。

由此可見,產(chǎn)業(yè)矛盾的核心已經(jīng)非常清晰:GPU的“無限算力需求”與現(xiàn)有存儲方案的“有限適配能力”形成了尖銳對立。HBM能解決“快”的問題,但解決不了“多”和“省”;HDD能解決“多”和“省”的問題,但解決不了“快”;而AI產(chǎn)業(yè)的持續(xù)發(fā)展,恰恰需要一種能同時平衡“高速響應、海量容量、合理成本”的存儲方案。

SSD的價值,正在這種矛盾中被凸顯出來。

02

AI場景SSD憑什么“火”

那么,面向AI的SSD需要解決哪些問題?

業(yè)內(nèi)人士向半導體產(chǎn)業(yè)縱橫表示,面向AI的SSD是為大模型訓練/推理量身定制的“高性能+高并發(fā)+低延遲+高耐久+大容量”的專用存儲,而大容量SSD只是“容量大”的通用存儲——容量只是SSD的必要條件,絕非充分條件。以下是該類SSD的一些核心特點:

打破CPU中轉(zhuǎn)瓶頸,讓高端GPU算力不閑置。GPU的核心價值在于算力輸出,但這份輸出能否落地,始終受限于數(shù)據(jù)傳輸與存儲的協(xié)同能力。傳統(tǒng)架構(gòu)中GPU取數(shù)需經(jīng)“SSD→CPU→內(nèi)存→GPU”多環(huán)節(jié)跳轉(zhuǎn),CPU帶寬瓶頸成為產(chǎn)業(yè)痛點。而面向AI場景的SSD的核心突破,正是在半導體架構(gòu)層面實現(xiàn)“直連協(xié)同”,通過接口技術(shù),讓GPU跳過CPU,直接與SSD建立數(shù)據(jù)通道。這一改變絕非簡單提速——數(shù)據(jù)搬運時間大幅縮短,GPU不再因等待數(shù)據(jù)“空轉(zhuǎn)”,徹底破解高端GPU算力閑置的資源浪費難題,讓核心芯片的性能優(yōu)勢真正落地。

圖片

打破GPU顯存高端壁壘。如今萬億參數(shù)模型的訓練與推理,需要TB級顯存支撐,若單純依靠HBM顯存擴容,不僅會讓GPU成本翻倍,還會受限于半導體制造工藝,讓多數(shù)企業(yè)難以承擔高端GPU集群的投入。面向AI應用的SSD被設計為介于HBM顯存與傳統(tǒng)存儲之間的“類內(nèi)存層”,本質(zhì)是半導體存儲器件與計算器件的協(xié)同創(chuàng)新,既能作為GPU的擴展顯存,又能承擔數(shù)據(jù)緩存功能。該技術(shù)并非替代HBM/DRAM,而是將存儲層從內(nèi)存擴展到SSD,形成“DRAM+HBM+SSD”的分級存儲體系,優(yōu)化整體效率。

內(nèi)置DSP/ASIC,支持近存計算。GPU既要承擔核心矩陣運算這類高端任務,還要處理數(shù)據(jù)預處理、優(yōu)化器狀態(tài)更新等簡單計算,導致寶貴的算力被浪費。而為了AI場景優(yōu)化SSD內(nèi)置DSP/ASIC計算單元,支持近存計算技術(shù),可將這些簡單計算任務從GPU卸載到SSD本地執(zhí)行,實現(xiàn)半導體器件的“分工優(yōu)化”。這種協(xié)同模式,讓GPU徹底擺脫冗余計算的束縛,專注于核心算力輸出,不僅減少了數(shù)據(jù)搬運帶來的延遲與損耗,更提升了整個半導體系統(tǒng)的算力密度。

業(yè)內(nèi)人士向半導體產(chǎn)業(yè)縱橫表示:為了AI場景優(yōu)化的SSD第一次讓存儲本質(zhì)性融入算力體系,實現(xiàn)數(shù)據(jù)直接參與AI訓練與推理,完美匹配GPU高頻并發(fā)的特點,最終提升性能、降低整體TCO(總擁有成本)。

03

被搶注的SSD,2026年迎來放量

據(jù)悉,由于AI服務器推動存儲需求爆發(fā),HDD持續(xù)大缺貨,交付期限已延長至2年以上,云廠商“緊急加單”,采購大容量企業(yè)級SSD,部分原廠2026年QLC NAND Flash產(chǎn)能也被提前搶購一空。供應鏈人士透露,各家云廠商只能排隊等待,由于HDD供應集中,并采取“依訂單生產(chǎn)”模式,缺貨持續(xù)加劇,有云廠商與供應商簽定2026年長約,提前鎖定HDD與企業(yè)級SSD供貨來源。

因此,面向AI時代的SSD已成為存儲巨頭、GPU龍頭與云廠商的必爭賽道,全球頭部存儲廠商紛紛入局,并分化出兩條差異化的技術(shù)路線。

圖片

第一條路線,是與GPU龍頭英偉達深度綁定,針對性開發(fā)適配AI/數(shù)據(jù)中心場景的SSD產(chǎn)品,核心目標是解決GPU受限于HBM容量的行業(yè)痛點,旨在應對計算負載從“計算密集型”向“數(shù)據(jù)密集型”的轉(zhuǎn)變,通過將更多數(shù)據(jù)置于計算資源附近,擴大GPU可用顯存空間,進而支持更大數(shù)據(jù)集的訪問、顯著提升GPU利用率。

在這一技術(shù)方向下,鎧俠與SK海力士已相繼公布合作進展。2026年3月,鎧俠宣布成功研發(fā)全新品類的超高IOPSSSD,這款產(chǎn)品正是基于英偉達“Storage-Next”計劃的需求打造,預計將于2026年末向特定用戶提供評估樣品。無獨有偶,SK海力士早在2025年12月便宣布與英偉達合作研發(fā)AI核心SSD,該項目在英偉達內(nèi)部沿用“StorageNext”代號,在SK海力士內(nèi)部則被命名為“AI-NP”(AINANDPerformance),隸屬于“AINFamily”產(chǎn)品線。其核心邏輯是通過重構(gòu)NAND與控制器架構(gòu),打破AI運算與存儲間的數(shù)據(jù)傳輸瓶頸,滿足大規(guī)模AI推演對數(shù)據(jù)吞吐的極致需求。據(jù)規(guī)劃,SK海力士這款產(chǎn)品將采用PCIeGen6接口,計劃于2026年底推出初期樣品,其IOPS性能可達2500萬次/秒,實現(xiàn)了8-10倍的跨越式提升。

第二條路線,則是聚焦容量提升、性能突破,打造高性能、大容量的SSD產(chǎn)品。以三星、華為、美光為代表的廠商均在此賽道加速布局。2025年10月,三星明確產(chǎn)品路線圖:256TBPCIe6.0SSD將于2026年正式推出,512TB版本則計劃在2027年落地;同時,兼容CXL3.1與PCIe6.0標準的CMM-D存儲產(chǎn)品也即將面市,性能實現(xiàn)翻倍升級。

華為則在2025年8月?lián)屜劝l(fā)布面向AI時代的高端SSD矩陣,包含高性能系列HUAWEIOceanDiskEX560、SP560,以及大容量系列HUAWEIOceanDiskLC560,其中單盤最高容量達245TB。該系列產(chǎn)品的核心價值在于打破傳統(tǒng)AI存儲器的性能與容量瓶頸,全面提升AI訓練效率與推理體驗。

同期,美光也于2025年8月在愛達荷州博伊西發(fā)布三款基于G9NAND技術(shù)的數(shù)據(jù)中心級SSD,涵蓋旗艦級9650、高密度6600ION及主流7600三大系列。憑借全球首發(fā)的PCIe6.0技術(shù)、業(yè)界領先的容量密度與超低延遲表現(xiàn),為AI算力基礎設施提供核心支撐。從落地進度來看,美光9650與7600系列已推出E3.S/E1.S形態(tài)樣品,6600ION系列122TB版本已于2025年第四季度量產(chǎn),245TB高容量版本則計劃在2026年上半年正式上市。

從上述頭部廠商的技術(shù)布局與產(chǎn)品路線圖不難看出,2026年正成為AI用SSD技術(shù)落地與商業(yè)化應用的關鍵元年。

業(yè)內(nèi)人士向半導體產(chǎn)業(yè)縱橫表示,當前AI用SSD已在三大核心AI場景中展現(xiàn)出強勁的實戰(zhàn)價值:

第一個場景,是AI推理系統(tǒng)。無論是ChatGPT這類對話機器人,還是工作中的AI功能,都需要高頻訪問KV緩存來應對百萬級并發(fā)請求。SSD的低延遲的高響應速度,讓推理更高效,而超大容量則賦予AI“長久記憶”,避免重復計算,大幅降低成本;

第二個場景,是向量數(shù)據(jù)庫實時檢索。向量數(shù)據(jù)庫是AI語義檢索、推薦系統(tǒng)的核心,對吞吐量和響應時間要求極高。該SSD的高并發(fā)、低延遲特性,讓實時檢索效率翻倍。

第三個場景,是AI數(shù)據(jù)一體機。在海量數(shù)據(jù)訓練場景中,AI數(shù)據(jù)一體機需要兼顧性能與成本。SSD通過性能優(yōu)化與TCO平衡,讓數(shù)據(jù)分層存儲更合理,既保證訓練速度,又降低硬件投入成本,成為企業(yè)部署AI訓練平臺的優(yōu)選方案。

04

面向AI應用的SSD,進入產(chǎn)業(yè)狂歡

過去長期把資源優(yōu)先投向DRAM的三星和SK海力士,如今正積極調(diào)整戰(zhàn)略布局,應對AI服務器需求激增帶來的存儲芯片市場新變化。

三星電子在2024年9月就已啟動280層V9 NAND量產(chǎn),但當時只在平澤園區(qū)部署了初期量產(chǎn)線,月產(chǎn)能僅約15000片晶圓。如今,隨著AI產(chǎn)業(yè)推動存儲需求快速上升,三星正在加速擴大V9產(chǎn)能,并將重點放在中國西安的X2產(chǎn)線。據(jù)悉,三星電子位于中國西安的NAND晶圓廠近期成功完成工藝制程升級,實現(xiàn)了236層堆疊的第八代V-NAND (V8 NAND)的量產(chǎn)。

本次制程升級始于2024年,旨在改造原有的V6 (128L) NAND,以提升產(chǎn)品性能與生產(chǎn)效率,增強產(chǎn)能競爭力。在量產(chǎn)V8 NAND后,三星西安晶圓廠的下一步瞄準了286層堆疊的V9 NAND,相關生產(chǎn)線將位于X2工廠,計劃在2026年內(nèi)完成過渡并實現(xiàn)量產(chǎn)。

SK海力士也展現(xiàn)出強勁的擴產(chǎn)勢頭。該公司計劃在今年第二季度啟動321層第9代NAND的轉(zhuǎn)換投資,目標是在清州M15實現(xiàn)月產(chǎn)約3萬片晶圓的V9產(chǎn)能。與目前約2萬片晶圓的水平相比,這次擴產(chǎn)力度相當大。

鎧俠表示,計劃通過擴大其四日市工廠和北上工廠的生產(chǎn)線,到2029財年將產(chǎn)能較2024財年提高一倍,以滿足AI數(shù)據(jù)中心對NAND閃存日益增長的需求。此外,鎧俠與閃迪正計劃聯(lián)合在美國興建NAND晶圓廠。

技術(shù)迭代的核心不僅在于架構(gòu)與標準,更在于底層存儲介質(zhì)的優(yōu)化,鎧俠CEO柳茂知表示,QLC SSD是AI行業(yè)最好的選擇。盡管從SLC到MLC,再到TLC,最終到QLC,SSD的性能一直在下降,但隨著技術(shù)的演變,2025年QLC SSD的速度已經(jīng)比2017年的TLC SSD快很多了。如今QLC SSD的順序讀寫速度可達7000MB/s左右,性能十分強大,能夠滿足AI大模型數(shù)據(jù)存儲和調(diào)用的要求。

QLC(Quad-Level Cell)顆粒之所以能成為SSD的主流選擇,正是源于其對AI場景核心訴求的精準匹配。

第一、讀取優(yōu)化特性:QLC NAND針對讀取密集型工作負載進行了優(yōu)化,而AI推理服務器主要負責分析和處理大量數(shù)據(jù),訪問模式以讀取為主,寫入頻率相對較低。

第二、高密度優(yōu)勢:QLC NAND具有更高存儲密度,每單位成本低于TLC NAND,使其成為AI服務器、云計算和大數(shù)據(jù)分析等應用的理想選擇。

第三、能效提升:Solidigm的研究表明,QLC固態(tài)硬盤的能效比TLC固態(tài)硬盤高19.5%,比混合TLC固態(tài)硬盤和機械硬盤高79.5%,這對大規(guī)模部署的AI推理服務器至關重要。

英特爾的研究進一步證實,QLC NAND固態(tài)盤會讓PCIe4.0總線的讀取能力達到飽和,而且具有接近TLC的延遲和服務質(zhì)量(QoS)。正因如此,這種固態(tài)盤的響應速度相比機械硬盤高出好幾個數(shù)量級。

       原文標題 : 面向AI的SSD,徹底火出圈

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號