OpenAI 엔지니어들이 AI 훈련 데이터에 대한 소송에서 뉴욕타임스 및 기타 주요 신문들이 수집한 중요한 증거를 실수로 삭제한 것으로 보인다고 수요일 법원 제출서에 따르면 전해짐.
신문의 법률팀은 OpenAI의 AI 훈련 데이터에서 그들의 뉴스 기사가 포함된 사례를 찾기 위해 150시간 이상을 소모했다고 주장함. 하지만 이 실수가 어떻게 발생했는지, 데이터에 무엇이 포함되었는지는 설명하지 않음. 제출서에 따르면 OpenAI는 오류를 인정하고 데이터를 복구하려고 했지만, 복구된 데이터는 불완전하고 신뢰할 수 없어서 뉴스 조직의 기사가 OpenAI의 AI 모델 구축에 어떻게 사용되었는지를 제대로 추적할 수 없음. OpenAI의 변호사들은 데이터 삭제를 '글리치'로 묘사했지만, 뉴욕타임스의 변호사들은 그것이 의도적이라고 믿을 이유가 없다고 언급함.
뉴욕타임스는 지난해 12월 이 획기적인 소송을 시작했으며, OpenAI와 그 파트너인 마이크로소프트가 그들의 AI 도구를 '수백만' 개의 기사를 복사하고 사용하여 구축했으며, 그 결과로 '직접 경쟁'하고 있다고 주장함. 이 출판사는 OpenAI가 그들의 작품을 복사한 것에 대해 '수십억 달러의 법정 및 실제 손해배상'을 청구하고 있음.
뉴욕타임스는 이미 OpenAI와의 법정 싸움에서 100만 달러 이상을 지출했으며, 이는 대부분의 출판사들이 맞설 수 없는 상당한 비용임. 한편 OpenAI는 악셀 스프링거, 콘데 나스트, 더 버지의 모회사인 복스 미디어와 같은 주요 매체들과 거래를 체결했으며, 이는 많은 출판사들이 싸우기보다는 파트너십을 선호한다는 것을 시사함.
OpenAI는 법원에 대한 업데이트를 제출하는 데 뉴욕타임스와 함께하지 않음. 이 선언서는 뉴스 조직을 대표하는 변호사 제니퍼 마이젤에 의해 제출되어 법원에 발생한 일을 공식적으로 통지하기 위해 작성됨.
OpenAI 대변인 제이슨 듀트롬은 더 버지에 보낸 이메일에서 회사가 제기된 주장에 동의하지 않으며 곧 자체 응답을 제출할 것이라고 밝힘. 뉴욕타임스는 더 버지의 논평 요청을 거부함.