NewsGPT™

Grok, 이제 이미지를 설명할 수 있는 안경을 썼다

📰 Grok gets glasses to see what you're talking about by TechRadar

Published: 2024-10-29 23:00:00

Featured Image
  • Grok AI가 이제 이미지를 설명할 수 있는 기능을 추가함.
  • RealWorldQA라는 새로운 벤치마크를 통해 Grok의 이미지 설명 능력을 평가함.
  • Grok의 기능이 테슬라의 자율주행 및 로봇 기술에 활용될 가능성이 있음.

X(구 트위터) 프리미엄 구독자는 이제 Grok AI 어시스턴트에게 이미지를 설명해 달라고 요청할 수 있게 됨. 엘론 머스크 소속의 회사 xAI가 시각 콘텐츠 분석을 위한 새로운 기능을 공개했으며, Grok-2 AI 모델을 사용해 사진, 도표 및 기타 스냅샷을 설명할 수 있는 능력을 부여함.

이 기능은 Grok을 ChatGPT, Gemini 및 기타 경쟁자들과 동등한 수준으로 끌어올림. X의 구독 계획에 가입하면 지금 바로 X의 이미지 게시물에서 버튼을 클릭하고 Grok에게 이미지에 대한 질문을 하거나 단순한 설명 분석을 요청할 수 있음.

새로운 기능과 함께 Grok은 RealWorldQA라는 새로운 벤치마크를 선보였으며, 이는 모델이 실제 이미지를 얼마나 잘 설명할 수 있는지를 보여주기 위한 것임. 회사는 RealWorldQA가 Grok이 경쟁자들보다 이미지 설명을 잘 한다고 주장하고 있으며, 아직 개발 중임에도 불구하고 그 성능을 보여줌.

스크린샷에서 볼 수 있듯이 Grok은 복잡한 다단계 이미지를 분해하고 그 안에서 무슨 일이 일어나는지를 설명할 수 있음. 또한 농담의 유머를 추론할 수 있지만, 농담을 설명하면 거의 항상 덜 웃기게 됨. 그럼에도 불구하고 이는 xAI가 Grok을 위한 새로운 기능, 특히 다중 모드 도구를 계속해서 출시하고 있다는 신호임. 이는 Grok이 시각 콘텐츠와 같은 방식으로 오디오 및 비디오 콘텐츠를 설명할 수 있는 단계가 될 수 있음.

언급되지 않은 한 가지 요소는 Grok의 시각 분석이 저작권 문제에 대해 별로 개의치 않는 AI 챗봇의 자유로운 이미지 생성 방식을 어떻게 묘사할 것인지임. 이는 닌텐도의 저작권 침해 사냥꾼인 Tracer가 그들을 상대로 소송을 제기했을 때 마리오의 이미지를 만든 사용자들이 직면했던 문제임. 마리오나 다른 지적 재산의 AI 이미지가 그렇게 묘사될지 아니면 더 일반적인 용어로 묘사될지는 흥미로운 발견이 될 것임.

xAI의 소유자가 누구인지 고려할 때, 이 기능은 머스크 소속의 다른 기술 회사에서도 분명한 잠재력을 가짐. 테슬라의 반자율 주행은 주변의 사람과 물체를 식별하고 그 간격을 파악하는 데 분명히 도움이 될 것임. 이는 테슬라가 지난 몇 년간 개발해온 인간형 로봇에도 마찬가지임.

🤖 NewsGPT Opinion

Grok이 이제 이미지를 설명할 수 있다니, 진짜 흥미로운 변화임. AI가 단순히 이미지를 생성하는 것에서 벗어나, 그 내용을 이해하고 설명할 수 있다니, 이건 마치 AI가 '눈'을 가진 것과 같음. 물론, 농담을 설명하면 웃음이 반감된다는 건 누구나 아는 사실이지만, 그럼에도 불구하고 Grok의 발전은 정말 대단함.

이 기능이 실제로 어떻게 활용될지는 두고 봐야겠지만, 테슬라의 자율주행차나 로봇에 적용된다면, 그 가능성은 무궁무진함. 주변 환경을 인식하고 분석할 수 있다면, 사고를 줄이고 더 안전한 운전이 가능해질 것임. 이건 단순한 기술 발전을 넘어, 우리의 일상생활에 큰 영향을 미칠 수 있는 변화임.

하지만 한편으로는 저작권 문제도 신경 써야 할 부분임. AI가 생성한 이미지가 저작권을 침해할 가능성이 있다는 점은 여전히 해결해야 할 숙제임. Grok이 이미지를 설명할 때, 그 이미지의 출처나 저작권을 어떻게 처리할지에 대한 명확한 기준이 필요함. 이 부분이 해결되지 않으면, 기술 발전이 오히려 부작용을 초래할 수 있음.

결국, Grok의 새로운 기능은 AI의 진화에 있어 중요한 이정표가 될 것임. 앞으로 AI가 어떻게 발전할지, 그리고 우리가 그 기술을 어떻게 활용할지에 대한 고민이 필요함. Grok이 보여주는 가능성은 정말 매력적임. 앞으로의 발전이 기대됨.

🏷️ Related Tags

📰 Next News

구글, 차세대 AI 에이전트 2025년까지 출시 안 한다

구글, 차세대 AI 에이전트 2025년까지 출시 안 한다

SAG-AFTRA, Ethovox와 음성 모델 구축을 위한 협약 발표

SAG-AFTRA, Ethovox와 음성 모델 구축을 위한 협약 발표