구글이 최신 버전의 Imagen 3, AI 텍스트-이미지 생성기를 미국 사용자들에게 출시했음. VentureBeat에 의해 발견됨. 이 도구는 구글의 AI 테스트 키친에서 접근 가능하며, 이전 모델에 비해 "더 나은 디테일, 풍부한 조명, 덜 방해되는 아티팩트"를 생성할 수 있도록 설계됨.
구글은 5월 I/O에서 업데이트된 Imagen 3 도구를 처음 발표했지만, 최근 며칠 사이에 Vertex AI 플랫폼을 통해 일반 사용자에게 제공된 것으로 보임. 일부 레딧 사용자들은 지난주에 Imagen 3을 실험하기 시작했고, 구글은 화요일에 이 도구에 대한 연구 논문을 발표했음.
다른 AI 이미지 생성기와 마찬가지로, Imagen 3은 사용자의 프롬프트에 따라 상세한 이미지를 생성할 수 있음. 특정 부분을 강조하고 원하는 변경 사항을 설명함으로써 이미지를 편집할 수도 있음.
일부 가드레일이 있는 것으로 보이며, 이 도구는 테일러 스위프트와 같은 공인 인물의 이미지를 생성하는 것을 거부하고, 무기 이미지를 생성하지 않음. 저작권이 있는 캐릭터의 이미지를 생성하는 것도 제한되지만, 원하는 캐릭터를 설명함으로써 쉽게 우회할 수 있음.
나는 이 도구를 사용해 소닉 더 헤지혹과 마리오처럼 보이는 이미지를 생성할 수 있었고, 내 동료는 미키 마우스를 닮은 캐릭터를 만들 수 있었음. 또한, 애플, 메이시스, 허쉬, 심지어 구글의 로고도 생성할 수 있었음.
이러한 다소 유연한 가드레일에도 불구하고, Imagen 3은 엘론 머스크의 X 플랫폼에 있는 AI 이미지 생성기인 Grok와는 뚜렷한 대조를 이룸. Grok는 약물, 폭력, 공인 인물들이 의심스러운 행동을 하는 이미지를 생성하는 데 사용됨.
하지만 구글의 AI 도구들도 문제에 직면했음. 올해 초, 구글은 사용자가 역사적으로 부정확한 이미지를 생성하는 것을 발견한 후 Gemini AI 챗봇을 통해 이미지를 생성하는 것을 중단했음.