IBM 推出全新Telum處理器,依託新一代 IBM Z 大型主機加速 AI 應用

分享連結:

新聞要點:

  • 新一代IBM Telum II 處理器和 IBM Spyre 加速器可釋放更多企業級 AI 能力,包括大語言模型和生成式 AI
  • 先進的 IO 技術實現並簡化可擴展的 IO 子系統,進一步降低能耗和數據中心佔地面積

香港2024年9月2日 /美通社/ — 近日,IBM(紐約證券交易所:IBM)在 Hot Chips 2024大會上公佈了即將推出的 IBM Telum® II 處理器和 IBM Spyre™ 加速器的架構細節。這些新技術旨在大幅擴展下一代 IBM Z 大型主機系統的處理能力,通過新的 AI 集成方法,加速企業對傳統 AI 模型和大語言 AI 模型的協同使用。

IBM 重磅推出全新Telum處理器,依託新一代 IBM Z 大型主機加速 AI應用
IBM 重磅推出全新Telum處理器,依託新一代 IBM Z 大型主機加速 AI應用

隨著基於大語言模型的 AI 項目從概念驗證階段進入生產階段,企業對高能效、高安全性和高度可擴展解決方案的需求日益迫切。摩根士丹利最近發佈的一份研究報告預測,在未來幾年,生成式 AI 的電力需求將以每年 75% 的速度激增,其 2026 年的能耗或將與西班牙 2022 年的全年能耗相當。許多 IBM 客戶表示,支持適當規模的基礎模型和針對 AI 工作負載的混合架構越來越重要。

此次IBM發佈的主要創新技術包括:

  • IBM Telum II 處理器:這一全新芯片將搭載於下一代 IBM Z 系列主機,與第一代 Telum 芯片相比,其頻率和內存容量均有提升,高速緩存提升40%;集成 AI 加速器內核和數據處理單元 (DPU) 的性能也得到改善。IBM Telum II處理器將支持大語言模型驅動的企業計算解決方案,滿足金融等行業的複雜交易需求。
  • IO 加速單元:Telum II 處理器芯片上的全新數據處理單元 (DPU) 旨在加速大型主機上用於聯網和數據存儲的複雜 IO 協議,可簡化系統操作,提高關鍵組件性能。
  • IBM Spyre加速器:可提供額外的AI計算能力,與 Telum II 處理器相得益彰。Telum II 和 Spyre 芯片共同構成了一個可擴展的架構,可支持AI集成建模方法,即將多個機器學習或深度學習的AI模型與基於編碼器的大語言模型相結合。通過利用每個模型架構的優勢,AI集成的方法可以生成比單個模型更準確、更穩健的結果。Spyre 加速器芯片在 Hot Chips 2024 大會期間進行了預覽,並將作為Telum II 處理器的附加選件提供。每個加速器芯片均與IBM 研究院合作開發,通過一個 75 瓦 PCIe 適配器連接。與其他 PCIe 卡一樣,Spyre 加速器可根據客戶需求進行擴展。

IBM主機和 LinuxONE 產品管理副總裁 Tina Tarquinio 表示:「得益於IBM強大的多代並行的開發路線圖,我們得以在保持技術領先的同時,滿足企業不斷升級的 AI 需求。Telum II 處理器和 Spyre 加速器旨在提供安全、節能、高性能的企業計算解決方案。這些多年研發的創新成果將被引入下一代 IBM Z 平台,幫助客戶大規模利用大語言模型和生成式 AI技術。」

Telum II 處理器和 IBM Spyre 加速器將由 IBM 的長期合作夥伴三星晶圓代工(Samsung Foundry)生產,採用其高性能、高能效的 5 納米工藝節點。二者將共同支持企業的先進AI 用例,釋放業務價值,從而創造新的競爭優勢。利用AI集成的方法,客戶可以更快、更準確地獲得預測結果。適用的生成式 AI用例包括:

  • 保險理賠欺詐檢測:通過AI集成方法將大語言模型與傳統神經網絡相結合,以提高性能和準確性,增強對保險理賠欺詐的檢測。
  • 反洗錢高級監測:對可疑金融活動進行高級檢測,支持遵守監管要求並降低金融犯罪風險。
  • AI 助理:加速應用生命週期、知識和專業技能的傳授、代碼解釋和轉換等。

規格和性能指標:

  • Telum II 處理器:配備八個運行頻率達 5.5GHz的高性能內核,每個內核配備 36MB二級高速緩存,片上高速緩存容量增加 40%(總容量達 360MB)。每個處理器抽屜的虛擬 L4 高速緩存為 2.88GB,相比上一代增加 40%。集成的 AI 加速器可實現低延遲、高吞吐量的交易中 AI 推理,例如增強金融交易期間的欺詐檢測,並且每塊芯片的計算能力是上一代的四倍。

    Telum II 芯片中集成了最新的 IO 加速單元 DPU。在設計上,其IO 密度提高 50%,可大幅提高數據處理能力,進一步提高 IBM Z 的整體效率和可擴展性,使其成為處理大規模AI工作負載和數據密集型應用的不二之選。

  • Spyre 加速器:這是一款專為複雜 AI 模型和生成式 AI 用例提供可擴展功能的企業級加速器。它有高達 1TB 的內存,可在普通 IO 抽屜的八塊卡上串聯工作,以支持大型主機的整體 AI 工作負載,同時每塊卡的功耗不超過 75W。每塊芯片由 32 個計算內核組成,支持 int4、int8、fp8 和 fp16 數據類型,適用於低延遲和高吞吐量的 AI 應用。

產品時間表

作為 IBM 下一代 IBM Z 和 IBM LinuxONE 平台的中央處理器,Telum II 處理器預計在 2025 年向 IBM Z 和 LinuxONE 客戶提供。IBM Spyre 加速器仍在技術預覽階段,預計也將於 2025 年推出。

關於 IBM 未來方向和意向的聲明可能會隨時更改或撤銷,恕不另行通知。

訪問下方鏈接瞭解更多:

關於 IBM

IBM 是全球領先的混合雲與人工智能、以及企業服務提供商,為全球175個國家和地區的客戶服務,幫助企業把握其數據洞察、簡化業務流程、降本增效,獲得行業競爭優勢。 IBM 混合雲平台和紅帽OpenShift 為全球超過4,000家政府和企業機構的關鍵性基礎設施提供有力支撐,例如來自金融服務、電訊和醫療健康等行業的客戶,幫助他們快速、高效、安全地實現數碼轉型。 IBM 在人工智能、量子運算、特定行業的雲解決方案以及企業服務等方面的突破性創新,使其可以為客戶提供開放和靈活的選擇。 IBM 對信任、透明、責任、包容和服務的歷久彌新的承諾,是我們業務發展的基石。查詢更多資料,請瀏覽:www.ibm.com/

關於 IBM 香港,請登入Facebook 頁面 www.facebook.com/IBMHongKong

傳媒查詢:郭韜 gguotao@cn.ibm.com

分享連結:

熱門

【記者/于茹玲 台南報導】 為迎接臺南400,虎頭埤風景區推出限量2025-2026雙年卡,享無限次入園優惠, …

【記者/宋佳景 台中報導】 ART365美術館於12月8日盛大揭幕知名藝術家黃文棟(黃一)的生活美學展《坐看雲 …

藝術家郭正參深受西方抽象藝術影響,以其獨特的創作風格著稱,畫作以厚重的層次和符號標記為特色。抓住思想即記憶軌道中經久不滅的感動,在畫布上涵蓋了從紋理厚重的抽象畫到線性構圖的人物畫等各式圖象,郭正參個展《裸男。瓶花。風景》將在ART365展至7月14日止。