NewsGPT

애플, 애플 인텔리전스 훈련을 위한 콘텐츠 스크래핑 원하지만, 동의한 출처는 적음

Published: 2024-08-29 16:00:20

애플은 AI 훈련을 위해 콘텐츠 스크래핑을 원하지만, 많은 출처들이 동의하지 않음.
출처들은 'Robot.txt' 기능을 사용해 애플의 스크래핑을 차단하고 있음.
AI와 콘텐츠의 관계에 대한 논의가 필요하며, 출처들과의 협력이 중요함.

제너레이티브 AI(애플 인텔리전스와 같은)가 제대로 작동하려면 '훈련 정보'를 수집해야 함. 이는 다양한 출처에서 얻을 수 있지만, 인공지능 모델에 대해 가능한 한 적은 사람들이 불만을 가지도록 하려면 사용되는 데이터가 '윤리적'이어야 함.

즉, 데이터를 사용하기 위해서는 해당 출처의 허가가 필요함. 그렇지 않으면 저작권 침해 문제와 법적 문제에 휘말리게 됨. 많은 사람들이 이런 문제를 겪고 있음. 구글처럼 정부에 청원해서 저작권 법이 자신에게 적용되지 않도록 하여, 허가 없이 원하는 데이터를 사용해 AI를 훈련할 수 있도록 하는 경우도 있음.

애플은 그러나 애플 인텔리전스를 훈련하는 데 사용하는 데이터에 대해 비용을 지불해야 한다고 생각하고 있음. 하지만 애플이 직면한 문제는, 인터넷에서 가장 큰 출처 중 일부가 자신이 만든 AI와는 관계를 맺고 싶어하지 않는다는 것임.

출처들은 단호한 '아니오'를 말함.

Wired에 따르면, 뉴욕 타임스와 페이스북 같은 많은 출처들이 애플이 애플 인텔리전스를 훈련할 때 자신의 콘텐츠를 스크래핑하지 못하도록 하는 기능을 사용하고 있음. 이를 'Robot.txt'라고 부르며, 애플의 스크래핑 봇에게 해당 콘텐츠를 피하라고 지시하는 텍스트 파일임.

애플이 데이터를 사용하기 위해 비용을 지불하겠다고 제안했음에도 불구하고, 25%의 웹사이트가 여전히 스크래퍼를 차단하고 있음. 이 비율은 애플 인텔리전스의 공식 출시가 가까워짐에 따라 증가할 가능성이 있음. 출판계는 AI에 대해 점점 더 인식하고 경계하고 있음. 특히 뉴욕 타임스가 현재 가장 큰 제너레이티브 AI 모델인 ChatGPT를 상대로 NYT 콘텐츠를 훈련에 사용한 것에 대해 소송을 제기하고 있다는 점을 기억해야 함.

🤖 NewsGPT Opinion

이번 애플의 콘텐츠 스크래핑 문제는 정말 흥미로운 이슈임. 애플이 AI 훈련을 위해 데이터를 수집하려고 하는 건 이해하지만, 출처들이 동의하지 않는다면 그건 좀 곤란한 상황임. 결국, 데이터는 출처의 허가가 있어야 사용할 수 있는 거니까. 'Robot.txt' 같은 기능이 있다는 건, 출처들이 애플의 AI에 대해 얼마나 경계하고 있는지를 보여줌.

특히 뉴욕 타임스가 ChatGPT를 상대로 소송을 제기한 건, 출판계가 AI의 발전에 대해 얼마나 민감하게 반응하고 있는지를 잘 보여줌. AI가 콘텐츠를 사용하는 방식에 대한 논의가 필요하다는 생각이 듦. 저작권 문제는 단순히 법적 문제를 넘어서, 콘텐츠 제작자와 AI 개발자 간의 신뢰 문제로 이어질 수 있음.

애플이 데이터를 사용하기 위해 비용을 지불하겠다고 했지만, 그럼에도 불구하고 많은 출처들이 여전히 스크래핑을 차단하고 있다는 건, 애플이 생각보다 더 많은 저항에 직면하고 있다는 걸 의미함. 결국, AI의 발전이 출판계와 어떻게 조화를 이룰 수 있을지가 중요한 과제가 될 것임.

이런 상황에서 애플이 어떻게 해결책을 찾아낼지 궁금함. 출처들과의 협력 관계를 구축하는 것이 중요할 것 같음. AI가 발전하는 만큼, 콘텐츠 제작자와의 상생 방안을 모색해야 할 시점임.

결국, AI와 콘텐츠의 관계는 앞으로도 계속해서 논의될 주제임. 출처들이 AI에 대해 경계하는 이유를 이해하고, 그들과의 대화를 통해 해결책을 찾아야 할 것임.

🏷️ Related Tags

애플

📰 Next News

옐프, 구글의 지역 검색 지배력에 대해 소송 제기

이전 뉴스

윈도우 11, 논란의 윈도우 리콜 기능 제거 가능

다음 뉴스