OpenAI, 2천만 건의 ChatGPT 로그 공개 명령 철회 요청
페이지 정보
본문

(퍼플렉시티가 정리한 기사)
OpenAI는 수요일 연방 판사에게 2천만 건의 익명화된 ChatGPT 대화 로그를 뉴욕 타임스에 제출하도록 요구하는 명령을 번복해 달라고 요청하며, 이러한 공개가 사용자 프라이버시를 침해하고 AI 소송에 "위험한 선례"를 남길 것이라고 주장했습니다. 이러한 움직임은 신문사와 다른 언론사들이 제기한 저작권 침해 소송에서 대화 기록을 제출해야 하는 금요일 마감일을 앞두고 나온 것입니다.
OpenAI가 지지를 호소하는 공개 성명에서 강조하지 않은 것은 Ona Wang 치안판사가 이미 11월 7일 OpenAI에 불리한 판결을 내렸으며, OpenAI가 로그를 제출하는 것이 "적절하다"고 판단했다는 점입니다. 판사는 기존 보호 명령과 OpenAI의 "철저한 비식별화" 프로세스를 통해 사용자 프라이버시가 충분히 보호된다고 판단했습니다.
프라이버시 주장이 증거개시 명령과 충돌하다
수요일에 게시된 블로그 포스트에서 OpenAI의 최고 정보 보안 책임자인 Dane Stuckey는 뉴욕 타임스가 "사용자 프라이버시 침해"를 요구하고 있다고 비난하며, 이 신문사가 "타임스의 근거 없는 소송과 아무런 관련이 없는" 사람들의 대화를 요구하고 있다고 주장했다. 회사는 요청된 대화 기록의 "99.99%"가 저작권 주장과 무관하다고 주장했다.
2천만 건의 대화는 2022년 12월부터 2024년 11월까지의 무작위 샘플을 나타낸다. OpenAI는 뉴욕 타임스 콘텐츠가 포함된 채팅만 식별하기 위한 타겟 검색을 포함한 프라이버시 보호 대안을 제안했지만, 이러한 제안은 거부되었다.
저작권 분쟁의 중심에 있는 훈련 데이터
뉴욕 타임스는 2023년 12월 OpenAI와을 상대로 소송을 제기했으며, 이들 기업이 ChatGPT 훈련을 위해 허가나 보상 없이 "수백만 건"의 기사를 사용하여 저작권을 침해했다고 주장했습니다. 이 신문사는 ChatGPT가 자사 콘텐츠를 어떻게 재생산하는지 분석하고, OpenAI가 증거를 조작하기 위해 챗봇을 "해킹"했다는 주장에 반박하기 위해 로그에 대한 접근이 필요하다고 주장합니다.
Wang 판사는 이전에 2025년 5월 OpenAI가 모든 채팅 로그를 보존하도록 요구하는 보존 명령을 내렸으나, 해당 명령은 9월에 부분적으로 해제되었습니다. 2천만 건의 로그 제출을 둘러싼 현재의 분쟁은 증거개시 절차에서의 갈등이 심화되고 있음을 보여줍니다.
OpenAI는 이 요청이 합리적인 증거개시 범위를 초과한다고 주장하며, "이 규모의 개인정보를 전면적으로 제출하도록 명령한 법원을 알지 못한다"고 언급했습니다. 이 사건은 훈련용 저작권 자료의 오용 혐의로 AI 기업들을 상대로 제기된 수많은 소송 중 하나이며, 잠재적 손해배상액은 수십억 달러에 달합니다.