메타는 호주 사용자들의 페이스북과 인스타그램 공개 게시물을 AI 모델 훈련에 사용했다고 인정했으며, 2007년부터의 정보를 스크래핑했다고 밝혔다.
호주 의회 위원회는 유럽 사용자들은 GDPR 법률 덕분에 선택할 수 있지만, 호주 고객들은 그런 선택권이 없다고 전했다.
메타는 18세 미만의 정보를 사용하지 않았다고 부인했지만, 10년 이상의 데이터를 사용했다고 확인했다. 이 회사는 현재 성인이 된 아동의 사진을 스크래핑했는지에 대한 질문에 답할 수 없었다.
‘스크래핑’ 과정은 AI 개발에 필수적이며, 기본적으로 웹사이트에서 데이터를 수집하고 정보를 추출하여 대규모 언어 모델(LLM)에 피드백하는 것이다. 이는 GDPR 규정이 ChatGPT와 같은 LLM에 점점 더 문제가 되고 있음을 의미한다.
메타의 글로벌 프라이버시 디렉터 멜린다 클레이바우는 조사 앞에서 회사가 유럽에서 AI 제품 출시를 중단해야 했다고 인정했으며, 더 강력한 개인정보 보호법 덕분에 유럽 사용자에게 선택권을 제공해야 했다고 말했다. 상원의원 슈브리지의 질문에 클레이바우는 “사실, 2007년 이후로 사용자가 의도적으로 게시물을 비공개로 설정하지 않는 한, 메타는 호주 사용자들이 공유한 모든 공개 게시물의 사진과 텍스트를 스크래핑하기로 결정했다. 하지만 그게 현실이다, 맞지?”라고 답했다.
클레이바우는 사용자가 이제 게시물을 비공개로 설정하여 향후 스크래핑을 방지할 수 있지만, 이미 수집된 데이터에는 영향을 미치지 않는다고 덧붙였다.
AI 모델 훈련에 필요한 방대한 양의 데이터는 저작권이 있는 자료를 사용하지 않고는 ‘불가능’하다는 사실이 대중과 기술 기업들에게 점점 더 인식되고 있는 것 같다. 수백만 사용자의 게시물이 동의 없이 사용되었음을 고려할 때, 기술 대기업들은 앞으로 훨씬 더 엄격한 규제를 받을 가능성이 높아 보인다.