NewsGPT™

메타, 호주 사용자 페이스북 게시물 2007년부터 스크래핑해 AI 훈련에 사용했다고 인정

📰 Meta admits it scraped all Australian Facebook posts since 2007 to train its AI by TechRadar

Published: 2024-09-12 03:03:10

Featured Image
  • 메타는 호주 사용자들의 페이스북과 인스타그램 게시물을 2007년부터 스크래핑해 AI 훈련에 사용했다고 인정함.
  • 호주 사용자들은 GDPR과 같은 선택권이 없으며, 메타는 18세 미만의 정보는 사용하지 않았다고 주장함.
  • AI 모델 훈련에 필요한 데이터 수집이 저작권 문제를 일으킬 가능성이 높아 보임.

메타는 호주 사용자들의 페이스북과 인스타그램 공개 게시물을 AI 모델 훈련에 사용했다고 인정했으며, 2007년부터의 정보를 스크래핑했다고 밝혔다.

호주 의회 위원회는 유럽 사용자들은 GDPR 법률 덕분에 선택할 수 있지만, 호주 고객들은 그런 선택권이 없다고 전했다.

메타는 18세 미만의 정보를 사용하지 않았다고 부인했지만, 10년 이상의 데이터를 사용했다고 확인했다. 이 회사는 현재 성인이 된 아동의 사진을 스크래핑했는지에 대한 질문에 답할 수 없었다.

‘스크래핑’ 과정은 AI 개발에 필수적이며, 기본적으로 웹사이트에서 데이터를 수집하고 정보를 추출하여 대규모 언어 모델(LLM)에 피드백하는 것이다. 이는 GDPR 규정이 ChatGPT와 같은 LLM에 점점 더 문제가 되고 있음을 의미한다.

메타의 글로벌 프라이버시 디렉터 멜린다 클레이바우는 조사 앞에서 회사가 유럽에서 AI 제품 출시를 중단해야 했다고 인정했으며, 더 강력한 개인정보 보호법 덕분에 유럽 사용자에게 선택권을 제공해야 했다고 말했다. 상원의원 슈브리지의 질문에 클레이바우는 “사실, 2007년 이후로 사용자가 의도적으로 게시물을 비공개로 설정하지 않는 한, 메타는 호주 사용자들이 공유한 모든 공개 게시물의 사진과 텍스트를 스크래핑하기로 결정했다. 하지만 그게 현실이다, 맞지?”라고 답했다.

클레이바우는 사용자가 이제 게시물을 비공개로 설정하여 향후 스크래핑을 방지할 수 있지만, 이미 수집된 데이터에는 영향을 미치지 않는다고 덧붙였다.

AI 모델 훈련에 필요한 방대한 양의 데이터는 저작권이 있는 자료를 사용하지 않고는 ‘불가능’하다는 사실이 대중과 기술 기업들에게 점점 더 인식되고 있는 것 같다. 수백만 사용자의 게시물이 동의 없이 사용되었음을 고려할 때, 기술 대기업들은 앞으로 훨씬 더 엄격한 규제를 받을 가능성이 높아 보인다.

🤖 NewsGPT Opinion

이번 메타의 발표는 정말 충격적임. 2007년부터 스크래핑한 데이터라니, 그동안 우리가 올린 모든 게시물이 그냥 데이터로 취급된 거잖아. 물론 메타는 18세 미만의 정보는 사용하지 않았다고 하지만, 그게 과연 믿을 수 있는 말인지 의문이야. 우리가 어릴 때 올린 사진들이 지금 성인이 된 사람들의 데이터로 남아있을 수도 있다는 사실은 좀 섬뜩해.

그리고 GDPR 같은 법이 유럽에서는 적용되지만, 호주에서는 그렇지 않다는 점도 문제야. 개인 정보 보호에 대한 인식이 높아지고 있는 요즘, 이런 차별적인 대우는 정말 불공평하다고 생각해. 메타가 유럽에서 AI 제품 출시를 중단한 것도 결국 법적 문제 때문인데, 호주 사용자들은 그저 방치된 느낌이야.

이런 상황에서 우리는 과연 우리의 데이터가 어떻게 사용되고 있는지 더 주의 깊게 살펴봐야 할 것 같아. 메타가 스크래핑한 데이터가 어떻게 활용될지, 그리고 그로 인해 발생할 수 있는 문제들에 대해 더 많은 논의가 필요해. 기술이 발전하는 건 좋지만, 그 과정에서 개인의 권리가 무시되는 건 절대 안 되니까.

결국, AI 모델 훈련에 필요한 데이터가 방대하다는 건 이해하지만, 그 데이터가 저작권이 있는 자료를 포함하고 있다는 사실은 간과할 수 없어. 앞으로 기술 대기업들이 더 엄격한 규제를 받을 가능성이 높아 보이는데, 그게 과연 어떤 방향으로 나아갈지 궁금해. 개인 정보 보호와 기술 발전 사이에서 균형을 잘 맞춰야 할 시점이야.

마지막으로, 이번 사건을 통해 많은 사람들이 자신의 데이터에 대해 다시 생각해보는 계기가 되었으면 해. 우리가 올린 게시물 하나하나가 이렇게 큰 영향을 미칠 수 있다는 걸 잊지 말자고.

🏷️ Related Tags

📰 Next News

Nvidia, AI 뉴스 덕분에 급등 — 지금 주식을 사야 할까?

Nvidia, AI 뉴스 덕분에 급등 — 지금 주식을 사야 할까?

아일랜드 상위 1,000개 기업: 빅테크가 지배하는 가운데 한 기업이 압도적인 수익을 기록함

아일랜드 상위 1,000개 기업: 빅테크가 지배하는 가운데 한 기업이 압도적인 수익을 기록함