구글의 연구 논문에 따르면, Imagen 3는 텍스트로부터 고품질 이미지를 생성하는 데 뛰어난 성능을 보이며, 다른 모델들보다 테스트에서 우수한 성과를 기록함.
Imagen 3는 사용자 프롬프트에 대한 이해도가 향상되었으며, xAI의 논란이 많은 Grok-2와는 달리 공격적이거나 불법적인 콘텐츠 생성을 방지하는 안전장치가 포함됨.
피드백에 따르면, Imagen 3는 이전 모델들에 비해 더 엄격한 제한이 있으며, 이는 구글의 이전 Gemini 모델과 관련된 문제들에 대한 반응으로 보임.
구글은 Imagen 3을 업데이트된 AI 기반 이미지 생성기로 출시했지만, 일반적인 대규모 발표 대신 미국의 모든 사용자에게 조용히 배포함.
VentureBeat에 의해 발견된 구글의 연구 논문은 Imagen 3를 텍스트 프롬프트로부터 고품질 이미지를 생성하는 잠재적 확산 모델로 설명함. 이 논문은 또한 Imagen 3이 테스트에서 다른 모델들보다 우수하다고 주장함.
구글은 이 고급 이미지 생성기를 5월 I/O 컨퍼런스에서 처음 소개했지만, 이달 말에 Vertex AI 플랫폼을 통해 널리 사용 가능하게 됨.
구글은 Imagen 3이 사용자 프롬프트를 이해하는 데 있어 큰 개선을 이루었다고 주장함. 다른 AI 이미지 생성기와 마찬가지로 텍스트 설명으로부터 상세한 비주얼을 생성할 수 있지만, 공격적이거나 불법적인 콘텐츠 생성을 제한함. 오용을 방지하기 위해, 이 모델은 공인 인물이나 무기 관련 비주얼을 생성하지 않음.
이는 제한이 적은 xAI의 Grok-2와 대조적이며, Grok-2는 웹에서 논란이 많은 이미지의 핫스팟이 됨.
사용자 피드백에 따르면, Imagen 3는 이전 버전들에 비해 더 엄격한 제한이 있으며, 이는 AI 이미지 생성기와 관련된 더 큰 도전 과제를 반영함. 이러한 도구들은 지속적인 논쟁을 불러일으키며, 새로운 AI 생성 콘텐츠는 종종 주목을 받고 논란을 일으키거나 온라인에서 의견을 나누게 함.
구글은 Imagen 3의 출시에서 신중한 접근 방식을 취하는 것으로 보임. 모델이 발전함에 따라 이 보수적인 입장을 유지할지는 아직 불확실함.
구글의 신중한 접근은 올해 초 Gemini 모델에 대한 반발에 대한 반응일 수 있음. Gemini가 역사적으로 부정확한 이미지를 생성하여 인종적 표현을 왜곡한 후, 구글은 문제를 해결하기 위해 이미지 생성을 일시 중단함.
마운틴 뷰에 본사를 둔 이 회사는 또한 Imagen 3가 빠른 스케치나 고해상도 이미지 생성과 같은 다양한 용도에 맞춰 여러 버전으로 제공될 것이라고 언급함.