실시간뉴스 전체보기

닫기
더보기닫기

“우리 기사 쓰지 마”… 무차별 AI 데이터 수집, 급부상한 ‘저작권 전쟁’

'데이터 포식자' AI… 세상에 공짜는 없다

입력 2024-07-07 17:44
신문게재 2024-07-08 1면

1
챗GPT4o를 통해 생성한 ‘콘텐츠 저작권을 둘러싸고 대치 중인 AI 테크 기업과 언론사’.(이미지=챗GPT4o)

 

콘텐츠 업계와 인공지능(AI) 테크 기업 간 AI 학습 데이터를 둘러싼 저작권 전쟁이 한창이다. AI 업계는 산업 발전을 위해 데이터 접근을 허용해달라는 입장이지만, 콘텐츠 업계는 정당한 사용료를 지급해야 한다고 맞서고 있다.



7일 콘텐츠 및 IT 업계에 따르면 미국 온라인 커뮤니티 기업 레딧은 최근 자사 웹사이트에서 데이터 스크래핑(정보 수집·저장) 차단 조치를 단행했다. 자사 데이터가 AI 학습에 무단 사용되고 있는 부분에 대한 경고성 조치다.

전쟁의 서막은 언론사들의 저작권 사수를 위한 총력전에서 시작됐다. 뉴욕타임스와 시카고트리뷴에 이어 미국 탐사보도 매체인 CIR은 최근 오픈AI와 마이크로소프트를 상대로 저작권 침해 소송을 제기하고 나섰다. 보상 요구액은 디지털 밀레니엄 저작권법(DMCA)에 의거, 위반 건당 최소 2500달러(350만원)이다.

국내에서도 양 업계 간 저작권 문제가 불거져 홍역을 치른 적이 있다. 지난해 한국신문협회는 네이버가 생성형 AI ‘하이퍼클로바X’ 학습을 위해 제휴 언론사 뉴스를 무단 활용했다며 공정거래위원회에 제휴 약관 개선을 요구한 바 있다. 이에 대해 네이버 관계자는 “해석의 차이다. 네이버는 제휴 언론사와의 약관에 근거해 학습을 시켰고, 신문협회는 (AI 학습에 대해) 동의하지 않았다고 해석한 것의 차이일 뿐”이라고 설명했다.

상황이 이렇게 번지자 AI 테크 기업들은 산업 혁신을 위해 디지털 데이터 수집(TDM)에 대한 면책 규정을 요구하고 있다. 연구나 조사 목적 등으로 저작권자 허가 없이 저작물을 이용할 수 있는 ‘공정 이용’을 주장한 것이다. 아울러 보상 규모 책정도 쉽지 않다는 입장이다. 하정우 네이버클라우드 AI 이노베이션 센터장은 국회 토론회에서 “생성형 AI가 콘텐츠를 생성할 때 특정 데이터가 얼마만큼 기여하는지를 정량적으로 측정하는 것은 현존 기술로 불가능하다”고 항변했다.

하지만, 최경진 가천대 법대 교수는 “현재 공정위 소송과 관련된 대법원 판결이 나온 게 없지만, 공정 이용 여부는 사전 판단이 어려워 사후에 개별 케이스별로 결정해야 한다”면서 “AI 기업에서 공정 이용을 AI 학습을 위한 근거로 활용하기에는 리스크가 있다”고 덧붙였다.

이처럼 콘텐츠 업계와 AI 기업 간 분쟁이 잇따르자 해외에서는 유료 콘텐츠 공급 파트너십을 체결하는 추세다. 오픈AI는 최근 레딧, 월스트리트 저널, 마켓 워치, 뉴욕포스트, 타임스 등과 콘텐츠 제휴 협약을 맺었다.

다만, 국내에서는 아직 이 같은 움직임이 없다. 네이버 관계자는 “AI 학습 관련 콘텐츠 협업에 대해서 확정된 것은 없다. 서로 윈윈할 수 있는 방향으로 협의할 것”이라고 말했다. 일부 국내 언론사들은 AI 학습에 자사 콘텐츠 활용 금지를 자체적으로 공지하기 시작했다.

이에 대해 전문가들은 “(앞으로 양 업계가 공생하기 위해서는) AI 업계가 질 좋은 데이터를 확보하고 콘텐츠 기업이 수익을 창출할 수 있는 상생 전략을 택해야 한다”고 입을 모으지만, 구체적인 가이드라인은 없는 상태다.

나유진 기자 yujin@viva100.com 

기자의 다른기사보기 >

이시각 주요뉴스