OpenAI는 내년에 '에이전트'를 출시할 예정임. 이들은 인간의 입력 없이 다양한 작업을 수행할 수 있는 독립적인 인공지능 모델이며, 곧 ChatGPT에서도 사용할 수 있을 것임.
샌프란시스코에서 열린 첫 번째 OpenAI DevDay 행사에서 CEO 샘 알트먼은 "2025년이 에이전트가 작동하는 시점"이라고 말했으며, 회사는 음성 비서가 스스로 전화를 걸어 딸기를 주문하는 초기 예시를 시연함.
회사는 인공지능 일반 지능(AGI)에 다섯 단계가 있으며 현재 우리는 두 번째 단계에 있다고 설명함. 이 단계에서는 AI가 아이디어를 사고한 후 응답할 수 있음. 에이전트는 세 번째 단계로, AI가 아이디어를 사고하고 응답을 계획하는 과정에서 독립적으로 행동을 수행할 수 있는 수준임.
알트먼은 이전에 o1 모델의 힘 덕분에 에이전트 등급 모델을 구축하는 데 도움을 줄 수 있다고 선언했으며, 우리는 곧 그 첫 번째 모델을 볼 수 있을 것이라고 말함. 더 큰 도전 과제는 이들이 인간의 가치에 맞춰 조정되고 "탈선"하지 않도록 하는 것임.
AI 에이전트의 목적은 무엇일까?
유용하고 기능적인 에이전트를 구축하는 것은 모든 AI 연구소가 목표로 하는 바임. 예를 들어, AI가 책을 쓸 뿐만 아니라 스스로 출판하는 방법을 알아내고, 아마존에 계정을 등록하여 Kindle Direct에 공유하는 것까지 가능하게 할 수 있음.
에이전트는 AGI로 가는 길에서 필요한 단계로, 목표를 달성하기 위해 필요한 작업을 수행할 수 있어야 함. 알트먼은 Dev Day에서 "우리가 OpenAI보다 AI 연구를 더 잘하는 AI 시스템을 만들 수 있다면, 그건 진정한 이정표가 될 것"이라고 말함.
그 단계에 도달하기 위해서는 이전 세대의 AI를 지속적으로 발전시켜야 함. 알트먼은 o1 모델이 에이전트를 실제로 가능하게 할 것이며, 사람들이 에이전트를 사용하기 시작하면 "큰 일이 될 것"이라고 덧붙임. "사람들이 에이전트에게 한 달이 걸릴 일을 한 시간 안에 해달라고 요청할 것"이라고 예측함.
사람들은 특정 작업을 수행하는 에이전트 하나와 다른 업무를 수행하는 에이전트 하나를 가질 수 있으며, 나중에는 10개 또는 100개의 에이전트가 다양한 일상 업무를 맡게 될 것임. 우리는 이미 o1이 아이디어를 사고 제안을 하는 방식에서 이러한 요소를 일부 볼 수 있었음.
조정은 에이전트의 가장 큰 장애물임
OpenAI는 새로운 모델을 출시할 때마다 철저한 안전 테스트 과정을 거치며, 이를 통해 안전하게 출시할 수 있는지 평가함. 이로 인해 과거에 지연이 발생했으며 특정 작업을 방지하기 위해 모델에 가드레일을 설정해야 했음.
GPT-4o 모델의 명확한 예시는 원래 이미지를 생성하고 음악을 만들며 심지어 목소리를 모방할 수 있지만, 이러한 모든 기능은 가드레일에 의해 차단됨. 가드레일이 깨지는 경우도 있음.
가드레일이 깨지는 것은 에이전트의 경우 더 큰 문제가 될 수 있음. 왜냐하면 이들이 사용자의 은행 계좌에 접근하거나 온라인에서 작업을 수행하거나 심지어 Fiver에서 누군가를 고용할 수 있기 때문임. 음성 모드를 사용하여 지시를 내릴 수 있음.
Dev Day의 예시에서 우리는 음성 봇이 판매자에게 전화를 걸어 400개의 초콜릿 딸기를 주문하고, 특정 주소를 말하며 현금으로 지불하겠다고 선언하는 모습을 보았음. AI 어시스턴트로서의 지위를 선언했지만, 때때로 AI라는 것을 알아차리기 어려웠음.
FT와의 인터뷰에서 OpenAI의 최고 제품 책임자 케빈 웨일은 "우리는 AI와 상호작용하는 모든 방법을 가능하게 만들고 싶다"고 말하며, 에이전트 시스템이 내년에 주류에 도달할 것이라고 덧붙임.
웨일은 에이전트 시스템에 대한 하나의 가드레일은 항상 AI로서 자신을 선언하도록 요구하는 것이라고 말했지만, Advanced Voice가 비트박스를 하거나 GPT-4o가 완벽한 벡터 그래픽을 생성하는 것을 본 적이 있다면, 이러한 제한이 항상 완벽하지 않다는 것을 알 것임.
나는 개인적으로 에이전트의 도래를 기대하고 있음. 나는 코딩을 좋아하고 에이전트가 나의 작업을 더 빠르게 구현할 수 있도록 도와줄 것이며, 지루한 테스트 단계를 대신해 줄 것임. 또한, 25만 개의 읽지 않은 이메일을 처리할 수 있게 해줄 것임. 스카이넷이 내게 인박스 제로를 도달하게 해주기 위한 대가라면 — 터미네이터를 환영함.