레딧이 인공지능 스타트업 퍼플렉서티 AI와 세 곳의 데이터 스크래핑 업체를 상대로 저작권 침해 소송을 제기했다. 이들 기업이 사전 허가 없이 레딧의 콘텐츠를 AI 학습에 활용한 것이 문제가 됐다. 레딧은 고소장에서 이들 회사를 ‘절도범’에 비유하며, 특히 퍼플렉서티에 대해 “경쟁사처럼 정식 계약을 맺는 대신 데이터 확보를 위해 어떤 수단도 마다하지 않는다”며 강하게 비판했다.
최근 레딧은 오픈AI와 구글 등 주요 AI 기업들과 데이터 라이선스 계약을 체결해 왔다. 오픈AI와는 지난해 약 840억 원 규모의 협정을 맺은 것으로 알려졌으며, 구글도 뒤따라 계약에 합류했다. 당시 레딧은 향후 3년간 라이선스 계약으로 약 2,880억 원의 수익을 기대한다고 발표한 바 있다.
퍼플렉서티 외에도 이번 소송 대상인 세 스크래핑 업체는 미국 텍사스에 기반을 둔 서프API와 리투아니아 소재 옥실랩스, 러시아 운영의 AWM프록시다. 이들은 웹사이트 보안 조치를 무력화하고, AI 훈련에 쓰일 콘텐츠를 ‘세탁’해 기업 고객에게 재판매한 혐의로 지목됐다.
벤 리 레딧 최고법률책임자는 “AI 시장의 경쟁 과열이 대규모 데이터 ‘세탁’ 시장을 낳았고, 이로 인해 많은 기업이 기술적 보호장치를 우회해 데이터를 무단 수집하고 있다”고 지적했다. 레딧은 실제로 퍼플렉서티의 데이터 수집 여부를 검증하기 위해 구글 검색 엔진에서만 노출되는 ‘가짜 게시물’을 올렸으며, 이 게시글이 몇 시간 내 퍼플렉서티 검색창에 등장했다고 주장했다.
이에 대해 퍼플렉서티는 아직 소장을 받지 못했으며, “공공 지식에 대한 정당한 접근권을 지키기 위해 강경히 대응하겠다”고 입장을 밝혔다. 또한 “우리는 정확한 AI 기술로 사실을 전달하며, 개방성과 공공 이익에 반하는 협박엔 굴하지 않겠다”고 반박했다.
레딧은 이미 올해 초에도 앤트로픽을 상대로 비슷한 소송을 제기한 바 있으며, 현재 뉴욕 남부 연방법원에 제기된 이번 소송은 AI 학습용 데이터 수집 관행을 둘러싼 법적 분쟁이 본격화되고 있음을 보여준다. AI 산업이 급성장하면서 데이터 제공자와 AI 개발자 간의 갈등은 앞으로도 더욱 격화될 전망이다.
<저작권자 ⓒ TokenPost, 무단전재 및 재배포 금지>