![]() |
藉由NVIDIA人工智能數據平台(NVIDIA AI Data Platform)加速人工智能推理(AI Reasoning),並為NVIDIA雲端合作夥伴及企業部署(NVIDIA Cloud Partners and Enterprise Deployments)獲得全新存儲認證
加州聖荷西市和坎貝爾市2025年3月19日 /美通社/ — 來自GTC 2025:
優化人工智慧基礎架構,迎接代理式人工智慧的未來
WEKA亦推出全新的增強記憶體網格™(Augmented Memory Grid™)功能,將WEKA數據平台(WEKA Data Platform)軟件與NVIDIA加速計算、網絡及企業軟件整合,旨在加速人工智能(AI)推理,最大化每秒處理的令牌數量,並大幅提升令牌效率。
藉由WEKA高效能存儲(High-Performance Storage)為人工智能代理(AI Agents)提供動力,
NVIDIA人工智能數據平台(NVIDIA AI Data Platform)正在重新定義企業基礎設施,以迎接代理人工智能(AI)時代的來臨。它提供可自訂的參考設計,將NVIDIA Blackwell平台、NVIDIA BlueField® DPUs、NVIDIA Spectrum-X™網絡、NVIDIA AI Enterprise軟件與企業存儲整合,將數據轉化為可執行的情報。 組織現在可以利用NVIDIA人工智能數據平台(NVIDIA AI Data Platform)與WEKA數據平台(WEKA Data Platform)軟件的優勢,打造一個大規模可擴展、高效能的企業人工智能基礎,將人工智能查詢代理與業務知識連接,並實現卓越的人工智能推理效能及更高的複雜推理準確度。
突破人工智能(AI)記憶體瓶頸,藉由WEKA增強記憶體網格(WEKA Augmented Memory Grid)
人工智能(AI)代理持續擴展自主決策、複雜問題解決及適應性學習的能力,這使得對能夠支持更長上下文視窗、擴展模型參數以及增加系統記憶體需求的人工智能(AI)基礎設施的需求日益增長。藉由WEKA增強記憶體網格(WEKA Augmented Memory Grid),人工智能(AI)模型可以擴展記憶體以支援大型模型推理,提供額外數百萬TB的容量,比現今單一TB固定增量高出三個數量級。 同時,WEKA增強記憶體網格(WEKA Augmented Memory Grid)能夠在微秒延遲下提供接近記憶體速度的效能,實現更快速的令牌處理,從而達成前所未有的推理結果。主要優勢包括:
- 顯著縮短首次令牌處理時間: 在處理105,000個令牌時,WEKA增強記憶體網格(WEKA Augmented Memory Grid)將首次令牌處理時間縮短了41倍,相較於重新計算預填上下文。
- 優化的令牌處理: 推理集群可以實現更高的令牌吞吐量,並將整個推理系統的令牌吞吐成本降低最多達24%。
憑藉全新NVIDIA存儲認證推動企業人工智能(AI)創新
WEKApod™ Nitro數據平台設備(WEKApod™ Nitro Data Platform Appliances)已獲得認證,成為首批支持NVIDIA Cloud Partner(NCP)部署的高效能存儲解決方案之一,並與NVIDIA HGX H200、B200及GB200 NVL72配合使用,旨在為NCP供應商提供強大的基礎設施服務,助力人工智能(AI)開發者和創新者。WEKApod設備提供高效能密度和能源效率 — 單個8U入門級配置最多可支援1,152顆GPU。
WEKApod™ Nitro設備也獲得了全新的NVIDIA認證系統存儲認證,適用於基於NVIDIA企業參考架構指南並搭配NVIDIA認證系統(NVIDIA-Certified Systems)部署人工智能(AI)工廠的企業。此認證驗證了WEKA數據平台(WEKA Data Platform)與NVIDIA最佳實踐的兼容性,確保為各類企業人工智能(AI)和高效能計算(HPC)工作負載提供最佳的存儲效能、效率和可擴展性。
「WEKA與NVIDIA合作,為各機構提供高效能的人工智能(AI)儲存解決方案,結合NVIDIA人工智能數據平台(NVIDIA AI Data Platform),解決限制人工智能(AI)創新的數據挑戰,並消除對模型能力和基礎設施效率的妥協,」WEKA產品總監Nilesh Patel表示。「正如突破音速障礙開啟了航空航天創新的新領域,WEKA增強記憶體網格(WEKA Augmented Memory Grid)正在打破人工智能(AI)記憶體的藩籬,擴展GPU記憶體並優化NVIDIA人工智能數據平台(NVIDIA AI Data Platform)上的代幣效率。這一突破將改變人工智能(AI)令牌經濟學,使創新更快、更具成本效益,同時不妥協於性能表現。」
「尋求利用自主人工智能(AI)和推理模型力量的企業,需為這些高要求的工作負載提供前所未有的效率和可擴展性,」NVIDIA儲存網絡技術副總裁Rob Davis如是說。「結合NVIDIA和WEKA技術,使人工智能(AI)代理在推理過程中能以最先進的速度和精確度存取和處理數據。」
服務範圍
- WEKA的NCP參考架構將於本月底推出,支援NVIDIA Blackwell系統。
- WEKA增強記憶體網格(WEKA Augmented Memory Grid)功能將於2025年春季正式對WEKA數據平台(WEKA Data Platform)客戶開放。
詳情
請參閱本公司網誌:
- 全新增強記憶體網格(Augmented Memory Grid)功能徹底革新人工智能推理基礎設施(AI Inference Infrastructure)的經濟學。
- WEKA與NVIDIA Blackwell一同釋放人工智能推理(AI Reasoning)潛能
歡迎蒞臨NVIDIA GTC 2025展位:與會者可以前往GTC博覽會大廳(GTC Expo Hall)的WEKA展位,體驗全新增強記憶體網格(Augmented Memory Grid)功能。
客戶支持語錄
Together AI
在Together AI,我們對速度和效率充滿熱忱。「這就是為什麼我們打造了Together推理引擎(Together Inference Engine),提供業界最快的推理速度,」Together AI技術總監Ce Zhang如是說。「我們很高興能夠利用WEKA增強記憶體網格(WEKA Augmented Memory Grid),縮短提示緩存的時間,並提高在多個節點間使用這些緩存的靈活性—從而降低延遲,並惠及超過50萬名在Together AI平台上開發的人工智能(AI)開發者。」
Yotta Data Services
「WEKA數據平台(WEKA Data Platform)在提升印度最快人工智能(AI)超級計算平台Yotta Shakti Supercloud的性能和可擴展性方面,發揮了關鍵作用,」Yotta Data Services(NVIDIA雲端合作夥伴)聯合創辦人、董事總經理兼行政總裁Sunil Gupta如是說。「WEKA增強記憶體網格(WEKA Augmented Memory Grid)功能及其作為NVIDIA Blackwell部署的高效能數據儲存認證,為雲端規模的人工智能(AI)帶來全新的效率。透過擴展GPU記憶體並最大化我們Shakti Supercloud隊伍的利用率,WEKA將幫助我們為客戶提供更好的人工智能(AI)性能、更快的推理速度以及更高的成本效益。」
WEKA簡介
WEKA正在設計一種為人工智能(AI)時代打造的新型企業數據架構。WEKA®數據平台(WEKA® Data Platform)採用雲端原生及人工智能(AI)原生架構,樹立人工智能(AI)基礎設施的標竿。該平台可靈活部署於任何地方,支援本地、雲端和邊緣運算環境之間的無縫數據轉移。該平台將傳統數據孤島轉化為動態數據管道,可加速GPU運算、人工智能(AI)模型訓練和推理以及其他高性能工作負載,使之能更高效地運作、減少能耗,並降低相關的碳排放。WEKA幫助全球最具創新精神的企業和研究機構解決複雜的數據挑戰,更快速、更可持續地探索新發現、見解和成果,其客戶更是包括財富50強中的12間企業。請瀏覽www.weka.io了解更多資訊,或在LinkedIn和X上關注WEKA。
「WEKA」及WEKA標誌乃WekaIO, Inc.的註冊商標。此處使用的其他商業名稱可能為其他商標擁有者分別擁有。