미리보기
미리듣기
AI가 만든 콘텐츠의 저작권은 누구의 것인가? 프롬프트 입력부터 결과물의 권리까지, 새로운 창작 시대에 법과 윤리가 어떻게 대응해야 할지를 깊이 있게 탐구한다.
거대 언어 모델(large language model, LLM)인 파운데이션 모델(Foundation Model)은 대규모 데이터 세트를 기반으로 사전 학습된 AI 모델을 말한다. 최근 딥러닝 기술이 발전하면서 많은 데이터를 사용하여 사전 학습된 모델이 만들어졌는데, 이를 파운데이션 모델이라고 부른다. 파운데이션 모델은 다양한 분야에서 활용되며, 자연어 처리, 이미지 인식, 음성 인식 등 다양한 분야에서 뛰어난 성능을 보인다. 예를 들어, GPT-3는 자연어 생성 분야에서 세계적인 수준의 성능을 보이는 파운데이션 모델 중 하나다. 기본적으로 대규모의 데이터 세트를 사용하여 학습되기 때문에 다양한 데이터 분포와 패턴을 학습할 수 있다. 이를 통해 새로운 과업에 대해서도 일반화된 성능을 보이며, 파인 튜닝(fine-tuning) 과정을 통해 적은 데이터 세트로도 높은 성능을 보이는 경우가 많다. 최근에는 공개된 코드나 모델을 활용하여 간단하게 사용할 수 있어서 다양한 분야에서 활용될 수 있다.
-01_“생성형 AI” 중에서
기계 학습은 AI가 스스로 데이터를 분석하고 학습하는 방식이다. 학습에 사용되는 데이터는 AI가 자율적으로 선별할 수도 있고, 개발자 또는 서비스 제공자에 의해 지정될 수도 있다. 학습에 이용되는 데이터가 저작물일 경우 이는 곧 저작물을 이용하는 행위에 해당하게 된다. 이 과정에서 다양한 데이터가 시스템 메모리 등에 저장되며, 일시적 복제를 포함한 복제 행위가 발생한다. 일반적으로 일시적 복제는 일정 요건하에 면책이 가능하나, 원칙적으로는 복제권 침해 여부의 쟁점이 될 수 있다.
-03_“기계 학습” 중에서
저작물의 정의에 대해 대법원과 학설도 일관되게 ‘인간의’ 노력으로 한정하기 때문에 인간이 아닌 AI가 만들어 낸 결과물은 저작물성이 부인된다. 다만 ‘인간의’라는 의미를 인간이 직접적으로 제작한 것만이 아닌 인간과 직간접적으로 관련된 것으로 해석할 수 있다면, AI가 만들어 낸 결과물도 인간에 의해 창작되거나 제작된 AI에 의한 것이어서 인간의 사상과 감정이 표현됐다고 보지 못할 이유는 없다. 따라서 ‘인간의’에 대한 해석 여부에 따라 AI 생성물도 저작물성을 인정할 여지가 있다. 인간이 코딩한 소프트웨어이고 데이터 기반의 기계 학습도 인간에 의하여 이루어진 점 등 기술적으로 인간이 관여하여 만들어 낸 것이다. 또한 학습 데이터도 인간의 사상과 감정이 담긴 정보라는 점에서 인간의 사상과 감정의 표현이 아니라고 보기 어렵기 때문이다.
-06_“생성형 AI 창작과 저작자” 중에서
서비스 제공자를 CP로 인정하는 것은 지양될 필요가 있다. 프롬프트로 생성하는 행위는 이용자의 사실 행위로 봐야지 이를 서비스 제공자의 생성으로 볼 수 있는 것은 아니기 때문이다. 온라인 서비스 제공자로서의 측면에서 보면, 생성형 AI 서비스가 이용자가 제공한 데이터를 기반으로 새로운 콘텐츠를 생성하거나 제공하는 경우, 해당 서비스는 이용자가 업로드한 콘텐츠에 대한 호스팅 또는 중계 기능을 제공하는 온라인 서비스 제공자로 간주될 수 있다. 디지털 밀레니엄 저작권법은 온라인 서비스 제공자에 대한 책임을 제한하고 있으며, DMCA의 책임 제한 규정에 따라 온라인 서비스 제공자는 이용자가 업로드한 콘텐츠의 저작권 침해에 대한 책임에서 면책될 수 있다.
-09_“서비스 제공자 책임” 중에서