인공지능 기업인 OpenAI는 점점 더 큰 대형 언어 모델을 추구하는 과정에서 예상치 못한 지연과 도전에 직면하고 있으며, 알고리즘이 '생각하는' 방식에 더 인간적인 방법을 사용하는 훈련 기법을 개발하고 있음.
AI 과학자, 연구자 및 투자자 12명이 로이터에 전한 바에 따르면, 이러한 기법은 OpenAI의 최근 출시된 o1 모델의 배경이 되며, AI 무기 경쟁을 재편할 수 있고 AI 기업들이 에너지에서부터 칩의 종류까지 끊임없이 요구하는 자원에 대한 함의를 가질 수 있음.
OpenAI는 이 이야기에 대해 언급을 거부함. 두 년 전 바이럴한 ChatGPT 챗봇이 출시된 이후, AI 붐으로 인해 큰 혜택을 본 기술 기업들은 '규모 확대'를 통해 더 많은 데이터와 컴퓨팅 파워를 추가하면 AI 모델이 지속적으로 개선될 것이라고 공개적으로 주장해왔음.
하지만 이제 일부 저명한 AI 과학자들은 '더 크면 더 좋다'는 철학의 한계에 대해 목소리를 내고 있음.
AI 연구소 Safe Superintelligence(SSI)와 OpenAI의 공동 창립자인 일리야 수츠케버는 최근 로이터에, 사전 훈련을 확대하는 결과가 정체되었다고 전함. 수츠케버는 사전 훈련에서 더 많은 데이터와 컴퓨팅 파워를 사용하여 생성적 AI 발전의 큰 도약을 이루는 초기 옹호자로 널리 알려져 있으며, 이는 결국 ChatGPT를 탄생시켰음. 그는 올해 초 OpenAI를 떠나 SSI를 설립함.
“2010년대는 규모 확대의 시대였고, 이제 우리는 다시 경이와 발견의 시대로 돌아왔다. 모두가 다음 것을 찾고 있다”고 수츠케버는 말함. “올바른 것을 확장하는 것이 그 어느 때보다 중요하다.”
수츠케버는 자신의 팀이 이 문제를 해결하는 방법에 대한 더 많은 세부 정보를 공유하지 않았지만, SSI는 사전 훈련을 확대하는 대안적 접근 방식을 연구하고 있다고 전함.
AI 연구소의 연구자들은 OpenAI의 GPT-4 모델을 능가하는 대형 언어 모델을 출시하기 위한 경쟁에서 지연과 실망스러운 결과에 직면하고 있음. 대형 모델의 '훈련 실행'은 수백 개의 칩을 동시에 실행하여 수천만 달러의 비용이 들 수 있으며, 시스템이 복잡하기 때문에 하드웨어로 인한 실패가 발생할 가능성이 높음. 연구자들은 실행이 끝날 때까지 모델의 최종 성능을 알지 못할 수 있으며, 이 과정은 몇 달이 걸릴 수 있음.
또한 대형 언어 모델은 막대한 양의 데이터를 소모하며, AI 모델은 세계에서 쉽게 접근할 수 있는 모든 데이터를 소진했음. 전력 부족도 훈련 실행을 방해하고 있으며, 이 과정은 막대한 양의 에너지를 요구함.
이러한 문제를 극복하기 위해 연구자들은 '테스트 시간 컴퓨트'라는 기법을 탐색하고 있으며, 이는 기존 AI 모델을 '추론' 단계에서 향상시키는 방법임. 예를 들어, 모델이 즉시 단일 답변을 선택하는 대신, 여러 가능성을 실시간으로 생성하고 평가하여 최선의 경로를 선택할 수 있음.
이 방법은 모델이 수학이나 코딩 문제와 같은 도전적인 작업이나 인간과 유사한 추론 및 의사 결정을 요구하는 복잡한 작업에 더 많은 처리 능력을 할당할 수 있게 함.
“포커 게임에서 봇이 단 20초 동안 생각하는 것이 모델을 100,000배 확장하고 100,000배 더 오랜 시간 훈련시키는 것과 동일한 성능 향상을 가져왔다”고 OpenAI의 o1 모델에서 작업한 연구원 노암 브라운이 지난달 샌프란시스코에서 열린 TED AI 컨퍼런스에서 말함.
OpenAI는 'o1'로 알려진 새로운 모델에서 이 기법을 채택했으며, 이는 이전에 Q*와 Strawberry로 알려졌음. o1 모델은 문제를 다단계 방식으로 '생각'할 수 있으며, 이는 인간의 추론과 유사함. 또한 박사 및 산업 전문가들로부터 수집된 데이터와 피드백을 사용하는 것을 포함함. o1 시리즈의 비밀은 GPT-4와 같은 '기본' 모델 위에 추가로 수행된 또 다른 훈련 세트에 있으며, 회사는 이 기법을 더 크고 더 많은 기본 모델에 적용할 계획임.
동시에 Anthropic, xAI, Google DeepMind와 같은 다른 주요 AI 연구소의 연구자들도 이 기법의 자체 버전을 개발하기 위해 작업하고 있음.
“우리는 이러한 모델을 매우 빠르게 개선할 수 있는 많은 수확할 수 있는 과일을 보고 있다”고 OpenAI의 최고 제품 책임자 케빈 웨일이 10월 기술 회의에서 말함. “사람들이 따라잡을 때쯤 우리는 세 단계 더 앞서 있을 것이다.”
Google과 xAI는 논평 요청에 응답하지 않았고, Anthropic은 즉각적인 논평을 하지 않았음.
이러한 변화는 지금까지 Nvidia의 AI 칩에 대한 끊임없는 수요가 지배해온 AI 하드웨어의 경쟁 환경을 바꿀 수 있음. Sequoia와 Andreessen Horowitz와 같은 저명한 벤처 캐피탈 투자자들은 OpenAI와 xAI를 포함한 여러 AI 연구소에서 비싼 AI 모델 개발에 수십억 달러를 투자해왔으며, 이 전환이 그들의 비싼 베팅에 미치는 영향을 주목하고 있음.
“이 변화는 우리를 대규모 사전 훈련 클러스터에서 추론 클라우드로 이동시킬 것이다. 이는 분산된 클라우드 기반 서버로서 추론을 위한 것임.”이라고 Sequoia Capital의 파트너인 소냐 황이 로이터에 전함.
Nvidia의 AI 칩에 대한 수요는 세계에서 가장 가치 있는 회사로 부상하게 만든 원동력이 되었으며, 10월에는 Apple을 초월함. 훈련 칩에서는 Nvidia가 지배적이지만, 칩 대기업은 추론 시장에서 더 많은 경쟁에 직면할 수 있음.
자사 제품에 대한 수요에 미치는 가능성에 대해 질문을 받자, Nvidia는 o1 모델의 기법의 중요성에 대한 최근 회사 발표를 언급함. CEO 젠슨 황은 추론을 위해 자사 칩을 사용하는 수요 증가에 대해 이야기함.
“우리는 이제 두 번째 확장 법칙을 발견했으며, 이는 추론 시점의 확장 법칙이다... 이러한 모든 요소가 블랙웰에 대한 수요를 매우 높게 만들었다.”고 황은 지난달 인도에서 열린 회의에서 말함. 이는 회사의 최신 AI 칩을 언급한 것임.