토록 하고 있다. 다만, 공공의 이익이 더 클 경우에는 저 작권자의 권리를 제한함으로써 이용자가 해당 저작물을 이용하여 새로운 가치를 창출할 수 있는 발판을 마련하 고 있다. 이를 위해 「저작권법」이 추구하는 목적은 저작 권자의 이익 보호만이 아닌, 이용자의 공정한 이용도 보 호하는 것이다. 나아가 양자의 균형을 통해 ‘문화발전’이 라는 더 큰 목적을 위한 것이기도 하다. 4. 데이터의 중요성에 비례하는 법적 이슈 가. 학습데이터는 왜 중요한가? 데이터는 전통적인 생산의 3요소인 토지, 노동, 자 본과 더불어 생산의 4요소라고 여긴다. 그만큼 데이터는 알고리즘 시대에 중요한 자원이다. 이제 데이터는 기업 경쟁력의 원천이다. AI 모델을 구축하는 과정은 학습 알 고리즘에 따라, 데이터에 담긴 특징값(feature)을 학습하 도록 하는 것이다. 인간이 이해할 수 있는 능력과 범위를 넘어선다. 역사 이래로, 인간이 학습할 수 있는 시간과 방법은 한정되어 있다. 그렇지만, AI는 컴퓨팅 능력에 따라 다르 겠지만 온종일 학습이 가능하다. 학습된 AI 모델은 다양 한 서비스와 연계되어 AI 시스템으로서 이용자에게 제 공된다. 우리가 가장 많이 이용하는 AI 서비스인 챗GPT는 초거대모델인 GPT 모델을 이용한 AI 시스템이다. 인간 의 능력을 넘어서는 결과를 만들어낸다. 이처럼, AI 경쟁 력은 데이터에 기반한다고 해도 과언이 아니다. 데이터는 매력적인 면이 있지만 제대로 사용하지 못할 경우에는 치명적인 결과를 가져올 수 있다는 점을 제대로 인식하 여야 할 것이다. 나. 다양한 법적 이슈 AI와 관련된 법적 이슈는 다양하다. AI는 기본적으 로 사람이 만들어 놓은 데이터를 기반으로 학습한다. 데 이터에는 사람들의 삼라만상이 담겨있다고 해도 과언이 아니다. 사람들이 작성한 글이나 이미지, 영상 등이 사용 된다. 데이터 학습에 기반한 인공지능의 문제는 다양하 지만, AI 모델의 학습과 학습된 모델을 통해 나타나는 문 제는 다음과 같이 언급된다. “언어 모델을 학습하고 추론하는 데 필요한 과도한 에너지 소비와 탄소 배출과 관련된 환경 문제, 언어 모델 의 위험 발화 생성 시 이에 대한 책임 소재와 언어 모델 생 성 데이터에 관한 지식재산권과 관련한 책임성이 문제로 대두되고 있다. 그뿐만 아니라, 특히 언어 모델의 공정성과 투명성에 대한 문제의식이 제고되고 있다.”3는 것이다. AI 모델의 한계는 블랙박스 현상으로 인하여, 개 발자도 내부적인 처리과정을 알 수 없다는 것이다. 이 러한 한계를 극복하기 위해 설명 가능한 인공지능 (explainable AI)에 투자를 하고 있다. AI 모델이나 시스 템에 의하여 발생한 문제에 대한 책임을 어떻게 따져야 할지는 불명확하다. 다양한 법적 논의를 통하여 문제해 결 방안을 찾는 것이 방법이 될 것이다. 3 이화란·하정우, “초대규모 언어 모델의 공정성과 투명성에 관한 동향”, 정보과학회지, 2022.11, 37면. NYT는 2023.12월 오픈AI 및 MS를 상대로 저작권 침해소송을 제기했다. 소장에서 증거로 제시한 챗GPT로 생성한 결과물은 NYT 기사와 실질적으로 유사한 것으로 보인다. 다만, 이 같은 결과가 AI 모델의 암기에 의한 것인지 생성에 의한 것인지는 명확하지 않다. 이는 생성형 AI에서 가장 쟁점이 되는 사항이고, 앞으로 기술적이나 법적으로 정리해야 할 과제이기도 하다. 45 2025. 02. February Vol. 692
RkJQdWJsaXNoZXIy ODExNjY=