AI 세계가 에이전트 시스템 구축으로 전환되고 있는 가운데, OpenAI 팀이 세계에 오픈 소스 선물을 제공하기로 결정함. 팀은 다중 에이전트 시스템을 구축하고 조정하며 배포하기 위한 오픈 소스 프레임워크인 Swarm을 발표함.
OpenAI 솔루션 팀이 관리하는 이 프레임워크는 아직 실험 단계에 있으며 현재 생산용으로는 의도되지 않음.
Swarm은 에이전트 조정 및 실행을 경량화하고, 높은 제어 가능성을 제공하며, 테스트하기 쉽게 설계됨. 이는 두 가지 핵심 추상화인 에이전트와 핸드오프를 사용하여 달성됨. 에이전트는 지침과 도구를 보유하고 있으며 언제든지 다른 에이전트로 제어를 전환할 수 있음.
이 간단하지만 강력한 추상화는 도구와 에이전트 네트워크 간의 풍부한 상호작용을 가능하게 하여 가파른 학습 곡선 없이 확장 가능한 실제 솔루션을 제공함.
Swarm 에이전트는 Assistants API의 어시스턴트와 동일하지 않음. 편의상 비슷한 이름이지만 완전히 다름. Swarm은 Chat Completions API와 함께 작동하며 호출 간 상태를 유지하지 않음.
Assistants API는 메모리 관리가 내장된 완전 호스팅 솔루션을 제공하는 반면, Swarm은 컨텍스트, 단계 및 도구 사용에 대한 완전한 투명성과 세밀한 제어를 원하는 개발자에게 적합함. 거의 전적으로 클라이언트에서 실행되며, Swarm은 Chat Completions API와 마찬가지로 호출 간 상태를 유지하지 않음.
Swarm은 경량화되고 확장 가능하며 매우 사용자 정의 가능하여 단일 프롬프트에 맞지 않는 많은 독립적인 기능과 지침이 있는 시나리오에 이상적임.
이와 함께 OpenAI는 AI 에이전트가 기계 학습 엔지니어링 작업을 얼마나 효과적으로 수행할 수 있는지를 평가하기 위한 벤치마크인 MLE-bench도 발표함. 이를 위해 팀은 Kaggle의 75개 ML 엔지니어링 관련 대회를 수집하여 모델 훈련, 데이터셋 준비 및 실험 실행과 같은 주요 기술을 테스트하는 다양한 도전 과제를 제공함.
OpenAI는 이 벤치마크에서 여러 언어 모델을 평가했으며, 특히 가장 성능이 좋은 구성인 OpenAI의 o1-preview와 AIDE 스캐폴딩이 16.9%의 대회에서 Kaggle 동메달 수준에 도달함.