《科創板日報》7月8日訊(記者 郭輝)今年生成式AI帶火了“存算一體”的概念。當下AI大模型競相“開花”,但算力的擴展速度卻被認為遠沒有跟上算法的發展。于是,業內將GPU、存算一體、量子計算等方案列為AI算力的三大解藥。在本次2023世界人工智能大會上,對算力增長的路徑探討和成果展示,成了一項關注焦點。
【資料圖】
其中,存算一體被業界認為將撐起AI算力需求下繼CPU、GPU之后的算力架構“第三極”。方正證券認為,存算一體作為一種新的計算架構,其核心是將存儲與計算完全融合,以新的高效運算架構進行二維和三維矩陣計算,具有更大算力(1000TOPS以上)、更高能效(超過10-100TOPS/W)、降本增效三大優勢,能有效克服馮·諾依曼架構瓶頸,實現計算能效的數量級提升。
《科創板日報》記者關注到,2023WAIC活動和展臺上,憶芯科技五款存算一體計算主流機型集體亮相。
憶芯科技是一家業務方向覆蓋消費級和企業級SSD主控芯片的科技企業,近年在持續投入計算存儲融合架構研發。此次展示的憶芯科技DeepSSD邊緣計算一體機,采用自研主控芯片,是集合了物聯網、人工智能、邊緣計算、存儲等服務,提供一站式存算一體化、軟硬一體化的管理分析計算平臺。
憶芯科技邊緣計算事業部副總裁孫唐在財聯社直播間接受《科創板日報》記者采訪表示,此次大會公司展臺的一大亮點,就是公司最新一代的STAR2000可計算的存儲控制器。“基于這顆控制器,我們也帶來了不同算力、不同形態、適合于不同行業應用的各類邊緣計算一體機的產品。”
據了解,面向不同應用場景,具體可分為可計算存儲機型、高性能嵌入式機型、三防機型、工控機型、高性能服務器機型五款機型,能夠應用于水利、電力、能源、鐵路、學校、加油站等場景,具備低功耗、低成本、防塵防水等物理隔離、防爆特性。
孫唐表示,上述存儲控制器本身是一顆PCIe 4.0世代上有頂級性能的存儲控制器,其芯片上的AI算力矩陣計算加速和數據庫加速應用,幫助他們在實際的智慧化業務應用中,形成了4倍乃至30倍以上功效比的提升。“我們的全國產、高可靠、高保密應用的存儲數據底座能力,也幫助我們在一些行業應用中獲取了用戶的認可。今天早上在展臺中,許多參展觀眾針對這一塊跟我們有很深入的討論。
今年AI發展迎來階躍式技術變革,產業環境急劇變化對公司成長的影響,孫唐認為,AI大模型的出現,帶來的不僅是算力需求上的急劇提升,它還在整個動態存儲應用當中,帶來了20倍以上的存儲需求。“在這一塊上,肯定對我們是一個很大的商業機會。”
AI大模型的訓練過程中,對于數據的直接存儲有著極強要求。孫唐表示:“使用SSD和GPU進行直通式的數據處理,而不需要再經過CPU的中轉,可以說是提升整個AI大模型訓練效率、加速其商業落地非常有效的手段。”
憶芯科技在可信計算這一遠景式的技術需求方面也有著前瞻布局,為其抓住AI產業增長創造了良好條件。據介紹,目前國內正在興起的隱私計算,或者AI大模型的應用,都涉及到數據主權和數據應用倫理的問題。孫唐表示,憶芯作為國產化的可信計算聯盟的存儲主任單位,正在聯合各家國產化GPU廠商共同協作討論如何發揮好各自的能力,在生態上把可信計算、可信存儲兩塊業務實現更高效的融合。
AI大模型也帶來了數據庫的蓬勃發展。如今在國外最火的向量數據庫,在今年上半年總體上也拿到了超過5億美金的融資,而憶芯今年的展臺上也帶來了存算融合對這類向量數據庫加速的現場展示。據孫唐介紹,其方案可進行60路以上的視頻采集分析,以及每秒百萬次以上的檢索和比對的能力。“這體現了我們對現在整個AI大模型生態底層加持的能力。”
“通過這兩年可以看到,存算一體的技術真正地從實驗室走向了市場,國內也涌現了一大批基于存算一體技術的新興公司。”孫唐預計,在不久的將來,存算一體技術將會有更多選擇,“從傳統的芯片工藝到新的元器件,其實在市場上已經可以看到一些公司在采用新技術來進行一些產品的延展。”
孫唐表示,在當前已經遇到的傳統計算機架構工藝瓶頸面前,存算一體的架構未來一定有屬于它的更廣闊應用空間;存算一體的技術特點和優勢,也一定會在未來的數字化市場當中占據一席之地。
“從小算力的可穿戴設備,到中等算力的邊緣計算設備,再到大算力場景下的數據中心的大量業務應用,其實都離不開存算一體相關技術。”孫唐表示,只有通過存算一體的技術,才能把現在整個系統當中應用功能分離所導致的功耗增加、成本上升以及擴展不變的弊端或痛點,給解決掉。
“我們會堅定不移地沿著存算一體、存算融合的這個方向走下去,”孫唐表示,“企業級的存儲市場已經跨入PCIe 5. 0世代,未來,我們會在算存一體化的新興芯片架構、新興的市場應用方面,繼續我們的研發探索。”
關鍵詞: