그리 오래전이 아니다. 오픈AI와 마이크로소프트는 무적처럼 보였다. 하지만 이제 경쟁자들이 따라잡고 있다. 앤트로픽의 클로드는 모델에서 선두를 달리고 있으며, 마이크로소프트 지원을 받는 깃허브는 클로드를 코파일럿에 추가했고, 아마존은 클로드를 Q 개발자(코드 위스퍼러)에 추가했다. 또한 메타의 라마는 이제 사용자 수에서 ChatGPT와 경쟁하며 오픈 소스 및 그 이상에서 가정용 이름이 되었다.
동시에 오픈AI의 초기 o1 피드백은 엇갈린 반응을 보였다. 오픈AI CEO 샘 알트만은 이 모델을 '추론을 위한 GPT-2'라고 언급하며 '깊이 결함이 있다'고 말했다.
앤트로픽 vs 오픈AI
오픈AI는 추론 능력 외에도 음성 기능에 더 집중하는 것처럼 보인다. 특히 최종 사용자를 겨냥하고 있다. 반면 앤트로픽은 엔지니어링 및 API 측면을 우선시하는 것 같다.
오픈AI는 최근 음성 대 음성 경험을 위한 표현력 있고 조정 가능한 음성을 도입했으며, 프롬프트 캐싱을 통해 비용을 줄였다. 텍스트 입력은 50% 할인되었고, 오디오 입력은 80% 할인되었다. 이 조치는 고급 실시간 AI를 더 접근 가능하게 만들었다.
한편, 앤트로픽은 선택된 사용자와 함께 클로드 모바일 앱에서 음성 받아쓰기를 실험하고 있으며, 최대 10분의 녹음이 가능하다.
오픈AI는 AI 코딩에서도 앤트로픽의 증가하는 경쟁에 직면하고 있다. 이 회사는 복잡한 코딩 작업을 처리하고 코드 생성을 자동화하는 도구를 발전시키고 있지만, 앤트로픽의 최근 '컴퓨터 사용' 출시가 그들에게 우위를 제공했다.
“AI 코딩은 아직 엔지니어를 완전히 대체할 수 없으며 '약간의 코칭'이 필요하다”고 앤트로픽 공동 창립자 다니엘라 아모데이가 말했다. 그녀는 또한 그들의 클로드 모델이 생산성을 크게 향상시켰으며, 이는 채용 전략을 재편할 가능성이 있다고 언급했다.
양사 모두 AI 지배를 위해 노력하고 있으며, 오픈AI의 향후 출시가 시장에 영향을 미칠 수 있으며, GitHub Copilot, Cursor 및 기타 코딩 도우미와 같은 제품에 도전할 수 있다.
완벽한 사용자 경험
앤트로픽은 AI와의 상호작용을 향상시키기 위해 화면 탐색에 집중하고 있다. 지난주, 이 회사는 AI가 컴퓨터 화면을 제어할 수 있는 기능을 도입하여 사용자를 대신해 웹을 탐색하거나 타이핑할 수 있게 했다.
'컴퓨터 사용'은 클로드 3.5 소네트가 이제 인간 사용자와 유사한 방식으로 컴퓨터 인터페이스를 탐색할 수 있는 실험적 공개 베타 기능이다. 이는 AI가 화면을 보고, 커서를 이동하고, 버튼을 클릭하고, 텍스트를 입력할 수 있게 하여 다양한 작업을 수행할 수 있게 한다.
더 있다. 앤트로픽은 클로드 내에서 분석 도구를 출시했다. 이를 통해 사용자는 JavaScript 코드를 실행하여 플랫폼 내에서 데이터 분석을 수행할 수 있다. 이를 통해 앤트로픽은 AI 사용자 경험 분야에서 두각을 나타냈다.
이 기능은 미리보기 모드에서도 제공되며, 클로드는 CSV(쉼표로 구분된 값) 파일에서 데이터 정리 및 심층 분석과 같은 복잡한 작업을 처리할 수 있다. 이는 팀이 정확한 통찰력을 제공하여 마케팅 팀이 고객 행동을 분석하고 재무 팀이 대시보드를 생성하는 데 도움을 주기 위해 설계되었다.
지난달, 앤트로픽은 클로드 아티팩트를 iOS 및 Android의 모든 사용자에게 제공하여 누구나 한 줄의 코드도 작성하지 않고 쉽게 앱을 만들 수 있게 했다.
앤트로픽은 분명히 인간이 AI와 상호작용하는 방식을 한 단계 끌어올리고 있다.
'앤트로픽이 여전히 컴퓨터를 인터페이스로 필요로 하는 것을 구축했지만, 미래에는 화면에서 벗어나 새로운 종류의 장치나 인터페이스를 사용하여 AI 에이전트와 상호작용할 가능성이 높다.' — AIM
오픈AI도 포기하지 않았다. 오픈AI DevDay 2024에서 로마인 위에트는 회사의 개발자 경험 책임자로서 o1-preview 데모를 선보이며 약속과 좌절을 동시에 드러냈다.
세 번의 시도 끝에 스위프트 맵스 앱 코딩이 중단되었지만, 이후 o1-mini와 커서를 함께 사용하여 드론을 성공적으로 제어하는 데모가 진행되었으며, 인상적인 백플립도 선보였다.
오픈AI는 또한 ChatGPT 데스크탑 앱에서 고급 음성 기능을 출시했으며, 얼마 전에는 사용자가 ChatGPT의 이전 대화에서 콘텐츠를 검색할 수 있는 기능을 출시했다.
또한 오픈AI는 어제 검색 엔진을 출시했다. ChatGPT 검색은 이제 스포츠, 뉴스, 주식 인용 등에서 시기적절하고 정확한 답변을 제공하는 개선된 웹 검색 기능을 제공하며, 자연어 상호작용과 최신 데이터를 혼합하고 있다.
음성 기능의 대가
최근 오픈AI는 개발자를 위한 실시간 API를 출시하여 그들이 애플리케이션에 고급 음성 및 자연 음성 대화 기능을 추가할 수 있게 했다. 이 API는 기업들이 복잡한 작업을 처리할 수 있는 음성 기반 고객 서비스 시스템을 구축할 수 있게 한다.
놀랍게도 앤트로픽의 클로드는 이 분야에서 거의 발전이 없다.
오픈AI는 확실히 잘하고 있다. 이 새로운 API는 몇 일 전 API 업데이트 전에 출시된 ChatGPT의 고급 음성 모드의 확장이다. 이는 여섯 가지 독특한 음성을 제공하며, 부드러운 오디오 입력 및 출력 옵션을 제공한다.
예를 들어, 사용자는 이제 냉장고의 사진을 보여주며 요리 아이디어를 요청하거나 문제의 사진을 공유하여 수학 문제에 대한 도움을 받을 수 있다.
이 업데이트는 구글의 대화형 AI 어시스턴트인 제미니 라이브와 유사하다. 이는 사용자가 이벤트를 계획하고, 조언을 요청하고, 역사적 사건에 대해 논의하며, 새로운 지역 주제와 아이디어를 탐색하는 데 도움을 준다고 주장한다.
말할 필요도 없이, 오픈AI의 API 업데이트는 여러 모델에 의존하는 전통적인 방법과 대조된다. 이는 OpenAI의 최신 GPT-4o 모델에 연결되어 있으며, 개발자가 기능을 관리하고 사용자 요청에 따라 응답할 수 있게 한다.
웰니스 회사인 헬스파이 미는 이 API의 초기 채택자 중 하나로, AI 코치인 리아를 통해 실시간 영양 코칭을 위해 이 API를 사용하고 있다. 이는 오픈AI의 GPT-4 터보와 음성을 위한 기계 학습 모델인 위스퍼를 사용한다.
현재 실시간 API는 텍스트 및 오디오 토큰을 기반으로 가격이 책정된다. 오디오 입력은 백만 토큰당 100달러, 출력은 백만 토큰당 200달러로 가격이 책정된다. 오픈AI는 또한 이 API에 강력한 안전 기능을 구축했으며, 자동 남용 감지 및 인간 검토 메커니즘을 포함하고 있다.
오픈AI는 향후 API의 기능을 확장할 계획이다. 비디오 및 시각적 입력과 같은 추가 모달리티를 지원할 예정이다.
앤트로픽의 클로드 소네트 3.5 아티팩트와는 달리, 오픈AI는 최근 캔버스를 공개했다. 이는 ChatGPT와 함께 글쓰기 및 코딩 프로젝트를 작업하기 위한 새로운 인터페이스였다.
놀랍지 않다. 오픈AI의 ChatGPT를 위한 새로운 캔버스 인터페이스는 코딩에서 앤트로픽의 클로드 소네트 3.5에 비해 부족하며, 개발자들은 일관되게 클로드의 코드 생성, 디버깅 및 학습 능력을 선호하고 있다.
“온디맨드 소프트웨어가 여기에 있다”고 플렉스파의 CTO 조슈아 켈리가 말했다. 그는 클로드를 사용하여 몇 초 만에 맞춤형 앱을 만들었다고 강조하며, 클로드 아티팩트가 사용자가 신속하게 맞춤형 앱을 개발할 수 있도록 지원하고 모든 사람이 잠재적인 앱 개발자가 될 수 있는 비전을 추진하고 있다고 말했다.
한편, 깃허브는 클로드 3.5 소네트, 제미니 1.5 프로, 오픈AI의 o1-mini 및 o1-preview로 구성된 다중 모델 라인업으로 코딩 분야에서 새로운 기준을 세웠다. 이는 VS 코드, Xcode 등에서 비할 데 없는 다재다능함과 개발자 선택을 제공하며, 오늘날의 코드 생성 요구를 위한 궁극적인 도구 키트로 깃허브를 자리매김하게 했다.
돈이 말한다
오픈AI와 앤트로픽 모두 지난해에 비해 사용자 성장을 크게 이뤘지만, 그들의 수익 창출 전략은 매우 다른 접근 방식을 보여준다.
위 분석에 따르면, 오픈AI의 수익 성장 대부분은 ChatGPT와 같은 AI 모델에 대한 유료 구독에서 발생하는 반면, 앤트로픽은 API 서비스를 통해 대부분의 수익을 올리고 있다.
실시간 API 및 음성 및 음성 제어와 같은 혁신은 오픈AI의 수익을 2024년 40억 달러로 끌어올렸으며, 이는 지난해 대비 580% 증가한 수치다. 그들의 예상 수익은 더욱 인상적이며, 2025년에는 116억 달러에 이를 것으로 예상된다.