KISDI 정보통신정책연구원

KISDI 정보통신정책연구원

검색 검색 메뉴

영상보고서

오픈 알고리즘과 클로즈드 데이터: AI 경제의 근본적인 딜레마

  • 등록일 2021-12-28
자막

오픈 알고리즘과 클로즈드 데이터: AI 경제의 근본적인 딜레마
| KISDI 디지털경제사회연구본부 이준배 부연구위원

15세기 영국에선, 영주나 대지주가 대규모로 양을 키우기 위해 미개간지나 공공 방목장과 같은 곳에 울타리를 두르는 일이 빈번했습니다. 공유지를 사유지로 만드는 이 행위를 일컬어, ‘울타리를 두른 곳’이라는 뜻의 ‘인클로져’(enclosure)라 부릅니다. 

인공지능 알고리즘과 소프트웨어는 인공지능 생태계에서의 저변 확대와 개방형 혁신 전략 차원에서 자유롭게 공유되고 있는 반면, 데이터는 독점적 사용을 통해 우위를 확보할 수 있다는 점 때문에 상대적으로 개방과 공유가 더딘 상태이며, 이를 ‘현대판 인클로져’라고 표현할 수 있을 것입니다. 

#1. 플랫폼 기업들의 데이터 울타리 치기
2020년 9월 공정거래위원회는, 부동산 데이터 업체들을 상대로 부동산 매물 정보를 카카오에 제공하지 못하게 한 네이버에 10억원의 과징금을 부과했습니다. 네이버 측은 자사가 비용을 들여 구축한 독자 데이터에 대한 카카오의 무임승차 시도를 막으려 한 조치였다며 올해 초 행정 소송을 제기했습니다. 

소송 결과완 별개로, 이 사건은 기업이 구축한 독자 데이터 및 데이터 수집 네트워크가 시장 지배력을 가질 수 있고, 향후 이 데이터 접근권과 관련해 많은  분쟁이 일어날 수 있다는 점을 보여준 사례로 평가됩니다. 

올해 미국 연방거래위원회(FTC)의 새 수장에 오른 리나 칸 위원장 역시 예일대 로스쿨 시절, 자신의 논문을 통해 “플랫폼 기업은 막대한 이용자 정보를 손에 쥐고 있다”며 “이 데이터는 신규 사업자의 진입을 막는 장벽”이라 평가했는데요. 이처럼 플랫폼 기업을 중심으로 한 데이터의 배타적 운영은  전세계적으로 논란이 첨예한 이슈입니다. 

사실, 데이터와 같은 디지털 정보재(information goods)는 무한 복제 및 공유가 가능하다는 성질을 갖고 있지만, 또 이런 데이터에 “울타리를 치는” 배타적 행위를 통해 이익을 극대화할 유인이 존재합니다. 

이 같은 특성 때문에 기업의 데이터는 본질적으로 개방공유되는 데 한계가 있다고 봐야 합니다.

#2. AI 경제의 ‘오픈 이노베이션’, 왜?
‘클로즈드 데이터’, 즉 닫힌 데이터 생태계와 달리 AI 분야는 오픈 알고리즘이 대표적인 규준으로 자리잡고 있다는 점에서 대비를 이룹니다. 

구글의 인공지능 알고리즘 ‘TensosFlow’나 페이스북의 ‘Pytorch’는 오픈 소스 형식으로 라이브러리가 공개돼 프로그램 개발자들의 자유로운 활용이 가능합니다. 

결과물의 소스코드 및 API를 공유/배포하고, 전세계 개발자들이 피드백을 주고받는 채널인 깃허브(GitHub) 등 AI 분야에선 연구 성과물의 개방/공개 움직임이 활발한 추세입니다. 

즉, 연구 결과물과 이 결과가 도출되기까지의 과정을 모두 공개/공유함으로써 상호 검증(peer-review)을 진행하고 기술의 신뢰성을 제고하는 오픈 사이언스 방식이 AI 분야의 규준으로 자리잡고 있는 것입니다. 

이런 개방형 혁신의 이점을 기업에서 활용하기 위한 접근을 ‘오픈 이노베이션’(open innovation)이라 부를 수 있고, 이는 혁신과 기술개발을 기업 내부가 아닌 시장에 위탁하는 전략으로 이해됩니다. 

사실 AI 분야는 복잡하고 실패 가능성이 큰 연구 개발 분야인 만큼 외부 전문가나 커뮤니티를 활용하는 ‘오픈 이노베이션 전략’이 유리합니다. 반면 데이터는 영역별로 분절이 돼 있을 뿐 아니라 개인정보보호, 보안 이슈 등으로 결과물을 반출하기도 어렵다는 점에서 오픈 이노베이션 전략의 적용이 쉽지 않다는 한계를 갖고 있습니다. 

#3. 데이터와 AI의 딜레마, 해결책은
AI는 기계 학습의 기본이 되는 데이터의 투입이 많을수록 기술 발전이 용이해집니다. 문제는, 앞서 설명드린 것처럼, 데이터 분야가 본질적으로 폐쇄적이라는 한계를 갖고 있다는 점입니다. 

즉 개방을 모토로 하는 AI 경제와 데이터 경제 사이엔 근본적인 딜레마가 존재합니다. 

결국, 데이터 및 AI 분야의 동반 성장이나 시너지 효과를 위해선 개인 정보 및 기업 기밀 보호 등을 준수하면서 데이터를 활용한 혁신과 연구를 극대화할 수 있는 다양한 대안이 모색돼야 합니다. 

예를 들어 의료 데이터의 경우, 병원 별로 흩어져 있는 임상 데이터에 표준화된 규준을 정립하고, 개인 식별이 불가능한 분석 결과물만을 공유하는 등의 방법으로 연구를 활성화하는 노력을 하고 있습니다. 

아울러 데이터 분석 기술을 보유한 스타트업 및 중소기업과 데이터를 보유한 기업간 협업을 확산하고 일반 국민의 데이터 문해력(literacy)를 높이는 방향으로의 정책적 지원도 필요합니다.

데이터와 AI 분야의 딜레마와 협업 과제에 대한 더 자세한 내용은 KISDI 홈페이지 내 <오픈 알고리즘과 클로즈드 데이터: AI 경제의 근본적인 딜레마> 보고서에서 확인하실 수 있습니다.

설명

| KISDI 디지털경제사회연구본부 이준배 부연구위원

15세기 영국에선, 영주나 대지주가 대규모로 양을 키우기 위해 미개간지나 공공 방목장과 같은 곳에 울타리를 두르는 일이 빈번했습니다. 공유지를 사유지로 만드는 이 행위를 일컬어, ‘울타리를 두른 곳’이라는 뜻의 ‘인클로져’(enclosure)라 부릅니다.

인공지능 알고리즘과 소프트웨어는 인공지능 생태계에서의 저변 확대와 개방형 혁신 전략 차원에서 자유롭게 공유되고 있는 반면, 데이터는 독점적 사용을 통해 우위를 확보할 수 있다는 점 때문에 상대적으로 개방과 공유가 더딘 상태이며, 이를 ‘현대판 인클로져’라고 표현할 수 있을 것입니다.

KISDI 영상보고서 이번편에서는 '오픈 알고리즘과 클로즈드 데이터 : AI 경제의 근본적인 딜레마'에 대해 설명드립니다.

#인클로져 #클로즈드데이터 #AI경제딜레마

※ 관련보고서 : AI TREND WATCH(2021-02)오픈 알고리즘과 클로즈드 데이터: AI 경제의 근본적인 딜레마
※ 유튜브 바로가기 : https://youtu.be/RZcQWhsKOgI

  • 부서대외협력팀
  • 담당자한유경
  • 연락처043-531-4383