본문 바로가기
etc/Youtube review

[노마드 코더] 깃헙 Copilot! 쓰면 고소각이라고?

by injeolmialmond 2021. 7. 26.

https://www.youtube.com/watch?v=a9349pRiCRk 

먼저, 코파일럿이란 무엇인가?

http://www.aitimes.com/news/articleView.html?idxno=139354 

 

깃허브-오픈AI, 자체 코드 생성하는 AI 도구 '코파일럿' 출시 - AI타임스

마이크로소프트(MS) 자회사 깃허브와 오픈AI가 소프트웨어 개발자들에게 사용할 코드를 추천하는 AI시스템을 개발했다. 코파일럿(Copilot)이라는 이름의 이 AI툴은 MS 비주얼 스튜디오 코드 편집기

www.aitimes.com

코파일럿은 깃허브와 오픈AI가 만든 서비스. 깃헙은 2018년 마이크로소프트가 인수한 기업으로, 개발자들이 본인의 코드를 올리기 위해서 (그 이유는 아카이빙일 수도 있겠지만, 대부분의 경우에는 협업을 하는 상황에서 다른 개발자들과 소통하기 위해, 본인이 맡은 코드를 계속해서 백업하고, 왜 어떤 코드를 작성했는지, 왜 어떤 부분을 수정했는지 주석을 달면서 설명하기 위해서이다) 사용하는 서비스이다. 오픈AI는 일론 머스크가 2015년 설립한 인공지능 회사로, 인공지능 정보를 오픈소스로 공개하는 기업이다. 최근 GPT-3라는 거대 언어모델을 내놓은 것으로 유명하다.

아무튼 코파일럿이라는 이 서비스는:

- 이미 작성된 코드를 분석해 특정 기능을 포함한 새로운 매칭코드를 생성

- 비주얼 스튜디오에서 작성 중인 코드, 주석, 함수를 분석해 사용자에게 적절한 후속 코드를 제안하는 방식

- 코딩언어가 아닌 일반 자연어로 작성하더라도 이를 인식해 그에 맞는 코드로 변환 가능

이러한 서비스이고, 지난 6월 29일 깃허브가 발표했다.

 

그런데 이러한 서비스의 뒤에는 깃허브에 올라갔던 수많은 개발자들의 코드가 있었다. 이러한 코드들을 학습 데이터로 삼아서 코파일럿은 학습했다는 것인데.. 여기까지는 문제가 없어 보이지만, 이번에 이슈가 되는 것은 라이센스 관련 문제이다.

 

모든 오픈소스 코드는 3개의 라이센스 중 하나인데, 다른 라이센스와는 달리 GPL 라이센스의 경우 해당 오픈소스 코드를 이용했을 경우, 그 결과물 역시 모두 오픈소스로 공개해야 하며, 그 코드에 문제가 있어서 손해를 봤을 경우 원작자를 고소할 수도 있음. 그러나 다른 라이센스는 이러한 규칙이 없음.

문제는 깃헙은 공개적으로 올라온 모든 코드들을, 라이센스와 상관없이 일괄적으로 수집해서 코파일럿 모델을 학습시키는데 사용했다는 것! 이게 문제가 되는 이유는 코파일럿을 사용해서 코드를 작성한 사람과, 학습 데이터로 사용된 코드를 작성한 원작자 사이의 저작권 소송 문제도 있겠지만, 코파일럿은 유료 서비스이기 때문에 더더욱 문제가 되는 것이다. 일종의 '라이센스 세탁'이라고 여겨진다고 한다.

 

깃헙 대표는 모든 코드들은 라이센스와 관계없이 사용될 수 있다고 말했음. 왜냐하면 코파일럿은 '어디서도 보지 못한' 코드를 만들기 때문. 라이센스를 신경쓰지 않아도 되도록, 코파일럿이 알아서 가공을 하기 때문에 상관 없다는 것이다. 그렇지만 그 결과 역시 개발자들이 작성한 코드의 결과물이 아닌지, 우리는 알 수 없기 때문에 문제가 되는 것.

 

그런데 더욱 문제가 되는 것은.. 코파일럿이 '어디서도 보지 못한' 코드가 아닌 것을 제공하는 사례도 있었다는 것. 한 줄도 빠짐없이 똑같은 코드를 추천하는 경우가 있었다는 점에서 문제가 되고 있음.

 

여기서 파생되는 많은 문제들

- 마소는 이 서비스로 떼돈 벌텐데, 원작자들한테는 한 푼도 안줘도 되는가

- 만약 내가 쓴 코드가 깃헙에 올라와있던, 라이센스로 보호 받는 결과물이었다면, 나는 소송당하는가? 그 때 이건 내가 복붙한게 아니라 코파일럿이 추천해준 것이라는 점을 어떻게 보여줄 수 있는가?

 

또한 깃헙 코파일럿을 틀어놓고 비주얼스튜디오 코드(마이크로소프트의 코드 편집기 프로그램)를 사용하면, 그 코드는 AI 모델을 학습시키는데 사용된다고 하는데, 내가 깃헙에 올리도록 동의하지 않았음에도 이러한 과정이 이루어진다는 것도 문제가 되고 있음.

댓글