IBM은 AI를 지원하는 최신 IBM Z 메인프레임 시스템을 위한 차세대 Telum II 프로세서 및 Spyre AI 가속기를 공개함.
IBM은 차세대 Z 메인프레임 AI 시스템을 위해 두 개의 새로운 칩을 제공함: 5.5GHz에서 작동하는 8코어 Telum II 프로세서와 128GB 메모리를 갖춘 Spyre 가속기.
오늘 IBM은 AI 작업 부하를 발전시키기 위한 Telum II 프로세서와 Spyre 가속기의 첫 번째 아키텍처 세부정보를 공개함. 이 새로운 AI 메인프레임은 전통적인 AI 작업 부하와 LLM을 가속화하기 위해 새로운 앙상블 방법을 사용함.
Telum II 프로세서: 5.5GHz에서 작동하는 8개의 고성능 코어를 특징으로 하며, 코어당 36MB L2 캐시와 총 360MB의 캐시 용량을 제공함. 프로세서 드로어당 2.88GB의 가상 레벨-4 캐시는 이전 세대에 비해 40% 증가함. 통합된 AI 가속기는 낮은 대기 시간과 높은 처리량의 AI 추론을 가능하게 하며, 예를 들어 금융 거래 중 사기 탐지를 향상시킴. 이전 세대에 비해 칩당 계산 용량이 4배 증가함.
새로운 I/O 가속화 유닛 DPU는 Telum II 칩에 통합되어 데이터 처리 능력을 50% 향상시킴. 이 발전은 IBM Z의 전반적인 효율성과 확장성을 향상시켜 오늘날 기업의 대규모 AI 작업 부하와 데이터 집약적 애플리케이션을 처리하는 데 적합함.
Spyre 가속기: 복잡한 AI 모델과 생성적 AI 사용 사례를 위한 확장 가능한 기능을 제공하는 기업 등급의 가속기로, 최대 1TB의 메모리를 특징으로 하며, 일반 I/O 드로어의 8개 카드에서 함께 작동하도록 설계됨. 각 칩은 낮은 대기 시간과 높은 처리량의 AI 애플리케이션을 지원하기 위해 int4, int8, fp8 및 fp16 데이터 유형을 지원하는 32개의 계산 코어를 갖춤.
세부 사항을 시작으로, IBM Telum II 프로세서는 5.5GHz까지 증가된 주파수와 코어당 36MB의 증가된 캐시를 갖춘 8코어 설계를 특징으로 하며, 총 360MB의 캐시 풀을 제공함. 각 Telum II 프로세서는 낮은 대기 시간과 높은 처리량의 AI 추론 성능을 제공하는 통합 AI 가속기를 갖춤. 새로운 추가 사항으로는 Telum II 칩에 통합된 I/O 가속화 유닛 DPU가 있으며, 데이터 처리 능력을 50% 향상시킴.
IBM이 오늘 소개하는 두 번째 AI 칩은 IBM Z 메인프레임을 위한 Spyre AI 가속기로, 128GB의 메모리 용량과 Telum II 프로세서를 실행하는 IBM Z 메인프레임에 플러그인할 수 있는 8개 카드에서 1TB의 메모리를 제공함. 각 Spyre AI 가속기는 INT4, INT8, FP8 및 FP16 데이터 유형을 지원하는 32개의 계산 코어를 갖추고 있으며, 75W TDP 카드로 제공됨. 각 카드는 낮은 대기 시간과 높은 처리량의 AI 애플리케이션을 위해 설계됨.
IBM은 Telum II 프로세서를 갖춘 Z 메인프레임 AI 시스템이 2025년에 고객에게 제공될 것으로 예상하며, Spyre AI 가속기는 현재 기술 미리보기 중이며 2025년까지 제공될 것으로 예상함.