마이크로소프트 지원을 받는 OpenAI가 목요일에 쿼리에 대한 답변을 처리하는 데 더 많은 시간을 할애하여 어려운 문제를 해결하기 위해 설계된 ‘Strawberry’ 시리즈의 AI 모델을 출시한다고 발표함.
이 모델은 복잡한 작업을 추론할 수 있으며, 과학, 코딩 및 수학에서 이전 모델보다 더 어려운 문제를 해결할 수 있다고 AI 회사는 블로그 게시물에서 밝힘.
OpenAI는 이 프로젝트를 내부적으로 Strawberry라는 코드명으로 지칭했으며, 목요일에 발표된 모델은 o1과 o1-mini로 명명됨. o1 모델은 목요일부터 ChatGPT와 API에서 사용할 수 있다고 회사는 전함.
OpenAI의 추론 개선에 집중하는 연구원 Noam Brown은 소셜 미디어 플랫폼 X에서 이 모델들이 Strawberry 프로젝트와 동일하다고 확인함. 그는 “진정한 일반 추론이 가능한 AI 모델을 만들기 위한 OpenAI의 노력의 결실을 여러분과 공유하게 되어 기쁩니다”라고 작성함.
OpenAI는 블로그 게시물에서 o1 모델이 국제 수학 올림피아드의 자격 시험에서 83%의 점수를 기록했으며, 이전 모델인 GPT-4o는 13%에 불과했다고 밝힘. 이 모델은 경쟁 프로그래밍 문제에서도 성능이 향상되었으며, 과학 문제의 기준에서 인간 박사 수준의 정확도를 초과했다고 회사는 전함.
Brown은 이 모델들이 복잡한 문제를 더 작은 논리적 단계로 나누는 ‘사고의 연쇄’ 추론 기법을 통합하여 이러한 점수를 달성할 수 있었다고 설명함. 연구자들은 복잡한 문제에 대한 AI 모델의 성능이 이 접근 방식이 프롬프트 기법으로 사용될 때 개선되는 경향이 있다고 언급함. OpenAI는 이제 이 기능을 자동화하여 모델이 사용자 프롬프트 없이 스스로 문제를 분해할 수 있도록 함.
“우리는 이 모델들이 사람처럼 문제를 생각하는 데 더 많은 시간을 할애하도록 훈련했습니다. 훈련을 통해 그들은 사고 과정을 다듬고, 다양한 전략을 시도하며, 실수를 인식하는 법을 배웁니다”라고 OpenAI는 전함.
로이터는 2023년 11월에 Q*라는 이름으로 불리던 추론 프로젝트에 대한 OpenAI의 작업을 처음 보도했으며, 7월에는 이 프로젝트가 Strawberry로 알려지게 되었다고 보도함.