2025 법무사 2월호

데이터의 상당 부분은 사람이 생성한 글을 가공하 여 얻는다. 이 가공을 통해 문제될 수 있는 편향이나 문 화적인 차별적인 사항을 정제하게 된다. ‘정제’라는 것은 AI가 학습할 때 혼란스럽지 않도록 일관되고 체계적인 방식으로 데이터에 “레이블링” 하는 것이다. 데이터에 대 한 설명을 작성하는 과정이다. 제대로 된 이름표가 붙은 데이터는 기계의 입장에 서는 품질 좋은 데이터로 평가할 수 있다. 문제는 데이터 자체에 내재되어 있는 편향적인 가치이다. 예를 들어, 우리 사회는 “간호원”이라는 개념이 의사 와 차별적이라는 이유로 “간호사”로 개칭한 바 있다. 기계 는 간호사와 간호원의 차이를 쉽게 구분하지 못할 것이 다. 그렇지만, 오래된 데이터에는 “간호원”이라는 표현이 담겨있을 것이고, 지금과 비교할 경우 문화적인 차별을 담게 되는 것이다. 이는 하나의 예이지만, 이렇게 시대에 따른 차별, 계 층적 차별, 성적 차별 등 수많은 차별이 우리 사회에 존 재하기 때문에 데이터에도 담길 수밖에 없다. 무엇보다, 지금이 아닌 과거의 데이터에 기반한다는 것이 가장 큰 문제가 아닐 수 없다. 5. 혁신을 이끌어 갈 공정이용과 「저작권법」의 변화 오픈AI를 포함한 글로벌 빅테크 기업들은 상당수 가 저작권 침해를 이유로 소송 중이다. 학습에 사용된 데 이터가 저작권을 침해했다는 이유에서다. 앞서 언급한 NYT를 포함한 게티이미지 등 다양한 권리자가 기업들 을 고소했다. 아직은 확정된 판결이 나오지 않았다. 앞으 로 수년은 더 걸릴 것으로 보인다. 그만큼 쟁점이 많고 소 송가액도 크기 때문이다. 우리나라도 예외는 아니다. 2025.1월, 지상파 방송 3 사는 네이버에 저작권 침해를 이유로 소송을 제기했다. 「저작권법」은 서비스가 새로운 가치를 창출하거나 비소비적·비향유적 이용이라면 공정이용을 긍정해 왔 다. 그동안 많은 기업들은 「저작권법」 상 “공정이용(fair use)”을 방어논리로 이용해 왔다. 이는 혁신을 이끌어내 는 수단으로 작용했다고 해도 과언이 아니다. 기술혁신과 「저작권법」의 응전(應戰)은 인간이 중 심이었으나 이제는 인간이 매개되거나 인간을 위한 것이 아닌 “AI”라는 새로운 유형이 대두되고 있다. 즉, 인공지 능이나 인공지능 기술이 「저작권법」에 도전하고 있는 상 황이다. 인공지능은 산업은 물론 사회를 변화시킬 것으로 예상된다. 기술혁신은 점진적인 기술발전 과정에서 유의 미하게 나타나곤 한다. 그 과정에서 기술발전에 따라 의 도하지 않게 직접적인 규제로서 작용하는 법이 「저작권 법」이라는 점은 역설적이다. 인공지능의 발전을 위해 필요한 기계학습의 기본이 되는 데이터의 확보에 있어서도 「저작권법」은 적지 않은 역할을 하고 있다. 각국은 데이터 확보를 위해 「저작권 법」을 개정한 바 있다. 우리도 알고리즘 중심사회를 이끌어나가기 위해서 라도, 법제의 정비가 필요한 시점이다.4 데이터 확보를 하는 경우나 확보된 데이터를 이용하여 기계학습을 하 는 경우에 저작권을 침해하는 것인지 논란이 적지 않기 때문에 이에 대한 입법적 해결이 필요하다. 그동안 다양한 기술이 「저작권법」의 변화를 가져왔 다. 이제는 사회혁신을 이끌어내기도 한 「저작권법」을 어 떠한 방향으로 개정해야 할지에 대한 입법자의 고민이 필요한 시점이다. 인공지능과 관련된 논의는 기술혁신과 법무사 시시각각 이슈와 쟁점 4 20대 국회에서 박정 의원이 빅데이터 확보를 위해 발의한 「저작권법」 개정이유를 “빅데이터를 활용하기 위해서는 저작물 등 기존 자료를 처리하여 필요한 정보를 분 석하는 것이 필수적이나 현행법은 저작자의 이익을 부당하게 해치지 않는 범위 내에서 저작물의 공정한 이용이 가능하다고 포괄적으로 규정하고 있을 뿐 정보를 분 석하는 과정에 저작물 등을 복제할 수 있는지 명시적으로 규정하고 있지 않아 빅데이터 활용의 활성화가 어려운 실정”이라고 밝히고 있다. 2017.12.7. 발의(의안번호, 2010698) 46

RkJQdWJsaXNoZXIy ODExNjY=