OpenAI는 Broadcom과 함께 첫 번째 맞춤형 AI 칩을 개발하고 있는 것으로 보임
이 칩은 2026년까지 제조될 수 있음
이 조치는 OpenAI 기반 애플리케이션 운영 비용을 줄이는 데 도움이 될 수 있음
OpenAI는 최근 보고서에 따르면 첫 번째 AI 칩 개발에 한 걸음 더 가까워졌음. 이는 클라우드 컴퓨팅 비용이 증가함에 따라 OpenAI 플랫폼에서 애플리케이션을 만드는 개발자 수가 급증하고 있기 때문임
ChatGPT 제작자는 7월에 여러 칩 설계자와 논의 중이라는 보도가 있었고, 이제 로이터는 OpenAI가 Broadcom을 맞춤형 실리콘 파트너로 정착했다고 주장함. 이 칩은 2026년에 출시될 가능성이 있음
그 전에 OpenAI는 Microsoft Azure 시스템에 AMD 칩을 추가할 예정이며, 기존의 Nvidia 칩과 함께 사용될 것임. AI 거인의 '파운드리' 계획은 축소된 것으로 보임
이러한 움직임의 이유는 AI 기반 애플리케이션의 급증하는 비용을 줄이기 위해서임. OpenAI의 새로운 칩은 생성 AI 모델을 훈련하는 데 사용되지 않고, 대신 AI 소프트웨어를 실행하고 사용자 요청에 응답하는 데 사용될 것임
오늘 열린 DevDay 런던 행사에서 OpenAI는 개발자들을 유치하기 위해 사용하는 몇 가지 개선된 도구를 발표함. 가장 큰 도구인 실시간 API는 앱 개발자를 위한 고급 음성 모드로, 이제 다섯 가지 새로운 음성이 추가되어 범위와 표현력이 향상됨
현재 전 세계에서 300만 명의 개발자가 OpenAI의 API를 사용하고 있지만, 많은 기능이 여전히 대규모로 운영하기에는 너무 비쌈
OpenAI는 2020년 6월 GPT-3 출시 이후 API 토큰 가격을 99% 줄였다고 주장하지만, 여전히 갈 길이 멀고 이 맞춤형 AI 칩은 AI 기반 애플리케이션을 비용 효율적이고 진정으로 주류로 만드는 중요한 단계가 될 수 있음
OpenAI 기반 애플리케이션이 다가오고 있음
클라우드 AI 처리의 높은 비용은 OpenAI 도구를 통합한 애플리케이션의 발전을 저해하고 있지만, 일부 스타트업은 이미 도전하고 있음
인기 있는 온라인 비디오 편집기 Veed는 여러 OpenAI 모델에 연결하여 자동 전사 및 긴 형식 비디오에서 최고의 사운드바이트를 선택하는 기능을 제공함. Granola라는 AI 기반 노트패드는 GPT-4 및 GPT-4o를 활용하여 회의를 전사하고 후속 작업을 보내며, 회의 봇이 통화에 참여할 필요가 없음
소비자 애플리케이션을 넘어 Tortus라는 스타트업은 GPT-4o 및 OpenAI의 음성 모델을 사용하여 의사들을 돕고 있음. 이 도구는 의사-환자 대화를 듣고 건강 기록 업데이트와 같은 많은 관리 작업을 자동화하며, 진단 정확도를 향상시키는 데도 도움을 줌
AI 모델의 잠재적인 개인 정보 보호 및 환각 문제를 떠나서, 개발자들은 분명히 OpenAI 도구의 힘을 활용하고 싶어함. OpenAI의 저지연 대화형 음성 모드는 고객 서비스에 엄청난 잠재력을 가지고 있음
그럼에도 불구하고, 매장이나 고객 서비스 라인에 전화를 걸 때 OpenAI의 음성 모델과 대화할 수 있을 것으로 예상되지만, AI 운영 비용이 채택 속도를 늦출 수 있음. 그래서 OpenAI는 자사의 AI 칩을 조속히 개발하고자 하는 것으로 보임.