우리는 슈퍼컴퓨터 내부를 들여다보는 것을 좋아함. 최근 우리가 좋아했던 것 중 하나는 Nvidia가 지구에서 아홉 번째로 빠른 슈퍼컴퓨터 Eos를 보여준 것이다.
이제 일론 머스크가 X(구 트위터)에서 사용되는 거대한 AI 슈퍼클러스터 Cortex를 엿볼 수 있는 기회를 제공함.
현재 테슬라의 기가 텍사스 공장에서 건설 중인 이 슈퍼클러스터는 70,000개의 AI 서버를 수용할 예정이며, 초기 전력 및 냉각 요구량은 130메가와트로, 2026년까지 500메가와트로 확장될 예정이다.
비디오에서 머스크는 최대 2,000개의 GPU 서버를 보유할 수 있는 서버 랙이 줄지어 있는 모습을 보여줌. 이는 결국 Cortex를 채울 것으로 예상되는 50,000개의 Nvidia H100 GPU와 20,000개의 테슬라 하드웨어 유닛의 일부에 불과함. 비디오는 짧지만, 테슬라의 가장 야심찬 AI 프로젝트를 추진할 인프라를 드물게 보여주는 기회임.
Cortex는 테슬라의 AI 능력을 발전시키기 위해 개발되고 있으며, 특히 자사의 자동차에 사용되는 완전 자율주행(FSD) 시스템과 2025년 한정 생산 예정인 자율 휴머노이드 Optimus 로봇 훈련을 위해 설계됨. 이 슈퍼클러스터의 냉각 시스템은 대형 팬과 Supermicro에서 제공하는 액체 냉각 장치를 특징으로 하며, 대규모 전력 수요를 처리하도록 설계됨. Tom's Hardware는 이 시스템이 대형 석탄 발전소와 비슷하다고 지적함.
Cortex는 머스크의 여러 슈퍼컴퓨터 배치 전략의 일환으로, 100,000개의 Nvidia H100 GPU로 구동되는 운영 중인 멤피스 슈퍼클러스터와 뉴욕 버팔로에 예정된 5억 달러 규모의 Dojo 슈퍼컴퓨터를 포함함.
Nvidia의 최신 Blackwell GPU로 업그레이드하는 데 일부 지연이 있었음에도 불구하고, 머스크의 AI 하드웨어 공격적인 인수는 테슬라가 AI 개발의 최전선에 서고자 하는 열망을 보여줌.
올해 초, 이 논란의 여지가 있는 억만장자는 회사가 AI 분야에서 경쟁력을 유지하기 위해 올해만 Nvidia와 AMD 하드웨어에 "10억 달러 이상"을 지출할 계획이라고 밝힘.