‘이루다 개인정보 위반과 데이터 프라이버시’ AI 네트워크 @클럽하우스

6 min readMay 6, 2021

지난 5월 1일 클럽하우스에서 이루다 개인정보 위반으로 본 오픈소스 인공지능 모델과 데이터 프라이버시 문제를 주제로 커먼컴퓨터 김민현 대표를 주축으로 토론을 진행했습니다. 논의 내용을 간략히 공유합니다.

이루다 개발사 ‘스캐터랩’, 개인정보법 위반했다!

개인정보 무단 사용’ 등으로 논란을 일으킨 인공지능 챗봇 ‘이루다’의 개발사가 결국 1억 330만원의 과징금과 과태료를 내게 됐습니다. 인공지능 기업의 개인정보 위반 첫 사례가 됐는데요.

스캐터랩은 자사의 앱 서비스인 ‘텍스트앳’과 ‘연애의 과학’에서 수집한 카카오톡 대화를 지난해 1월부터 올해 1월까지 이루다의 인공지능 개발과 운영에 이용한 것으로 확인됐는데 이 과정에서 카카오톡 대화에 포함된 이름, 휴대전화번호, 주소 등의 개인정보를 삭제하거나 암호화하는 등의 조치를 전혀 하지 않고 약 60만 명에 달하는 이용자의 카카오톡 대화문장 94억 여 건을 이용했다는 점 때문에 이런 처벌을 받게 됐습니다.

특히 문제가 됐었던 건 ‘법정대리인의 동의 없이 만 14세 미만 아동의 데이터를 모았다는 점’이었습니다.

또 개발사 스캐터랩이 개발자들의 코드 공유 및 협업 사이트로 알려진 깃허브에 2019년 10월부터 올해 1월까지 이름 22건(성은 미포함)과 지명정보(구·동 단위) 34건, 성별, 대화 상대방과의 관계(친구 또는 연인) 등이 포함된 카카오톡 대화문장 1431건과 함께 인공지능 모델을 게시한 것 역시도 개인정보 보호법을 위반했다고 봤고요. 다만 이 점은 과태료나 과징금 없이 시정명령으로 마무리 됐습니다.

토론에서 나왔던 주요 내용입니다.

인공지능 스타트업의 입장에서 생각해본다면..

대기업들은 ‘프라이버시’ 관리가 시스템화 되어 있습니다. 구글의 경우에는 지메일, 드라이브 등 다양한 서비스를 하고 있지만 통합적인 데이터 관리를 하고 있죠. 애드센스 같은 경우도 마찬가지고요.

스타트업 입장에서는 데이터 수집도 해야 하고 서비스도 만들어야 하다보니 챙길 게 참 많죠. 해야 할 일이 많으니 개별 기업에서 모든 걸 다 챙기는 건 불가능에 가깝습니다. 스캐터랩이 연애의 과학 등에서 챗봇을 만드는 과정에서도 데이터 프라이버시를 체계적으로 관리하는 것은 만만친 않았을 겁니다. 법적인 문제도 마찬가지죠. 게다가 이 문제에 관한 사회적 합의가 만들어져 있지 않았기 때문에 ‘악의’를 가지고 이런 행동을 했다고 볼 수 없습니다. 중요한 건 이 문제를 개별적 기업의 입장에서 접근하면 안된다는 것입니다.

정부는 어떤 역할을 해야 하는가

데이터 3법의 통과로 4차 산업혁명에 맞춘 데이터 활용법안이 나왔다는 것은 고무적인 일입니다. 데이터 3법은 개인정보보호법, 정보통신망법, 신용정보법을 말하는데요. 2020년 8월 5일부터 시행되고 있는 이 법에 따르면 개인 식별이 어렵도록 가공한 ‘가명정보’를 통계 작성이나 과학적 연구 등에 정보 소유자 사전 동의 없이 사용할 수 있게 됐습니다. 과도한 보호 탓에 사용하지 못했던 개인정보 활용도가 높아질 것이라는 분석이 실제로 나오고 있죠.

국제적 방향성과 유럽의 GDPR과도 어느 정도 맥을 같이 하게 됐습니다.데이터 3법 통과 이전에는 개인정보 활용이 힘들고 한국만의 정의도 많았습니다. 데이터 3법 전에는 ‘명시적 동의’ 없이는 아무것도 활용을 할 수가 없었는데요. 이제는 가명 정보 등 비식별화 조치를 한 후에 일정 데이터를 이용할 수 있게 됐죠.

이번 사례에서 볼 수 있듯 그러나, 앞으로 이 문제는 챗봇을 넘어 다른 인공지능 서비스에서의 개인정보 보호 이슈로 발전할 가능성이 큰 만큼 충분한 사회적 논의가 필요합니다.

* GDPR이란?

유럽 의회에서 유럽 시민들의 개인정보 보호를 강화하기 위해 만든 통합 규정입니다. 2016년 유럽 의회에서 공표됐고 약 2년 간의 유예기간을 가진 후 2018년 5월 25일 시행된 규정입니다. 유럽연합(EU)의 개인정보보호 법령으로 정보주체의 권리와 기업의 책임성 강화, 개인정보의 EU 역외이전 요건 명확화 등을 주요 내용으로 합니다. 유럽연합 시민의 데이터를 활용하는 경우 GDPR을 준수해야 합니다.

인공지능에 대한 반감은 어떻게 해결할 것인가

이번 이슈로 이미 활발하게 연구가 진행중인 프로젝트도 추가적 검토에 들어가는 모습을 볼 수 있습니다. 알아서 조심하는 분위기도 생기고 있는 것이죠. 사회적 담론이 생긴다는 것 자체는 긍정적인 효과일텐데요. 인간보다 똑똑한 인공지능의 등장 자체를 경계하고 두려워하는 사람들도 많습니다. 실제 일론 머스크의 오픈 AI가 인공지능 언어모델 GPT-3를 공개하지 않은 이유도 ‘이게 어떻게 활용될 지 모르기 때문’이라고 하던데요.

인공지능이라는 단어를 빅데이터로 바꾸면 인간에게 고마운 일이 생깁니다. 인공지능이 스마트한 것은 사용자 입장에선 편리함을 주기 때문이죠. 우리가 가전을 쓸 때 사용하는 LG 씽큐도 그렇죠. 결국 문제가 됐던 걸 생각해보면 인공지능이 사람들이 지키는 규범을 깬 대목이죠. 어떻게 인공지능이 스마트해지면서 사람들의 규범을 따를 것인가 이 점을 좀 더 깊이있게 고민해봐야 할 것 같습니다. (커먼컴퓨터 소프트웨어 엔지니어 민호님의 의견)

+ 블록체인 활용, 현실성이 있을까요?

마이데이터나 의료데이터 등 블록체인을 활용해 개인 정보를 직접 관리하자는 시류가 있다는 점에서 ‘블록체인’을 적용해 해결할 수 있지 않냐는 의견도 나왔는데요.

블록체인이 EU GDPR과 호환 가능한가에 대한 질문이 계속 제기되는 가운데 프랑스의 데이터 보호 감독 기관인 CNIL은 2018년 9월 이 주제에 대한 1차 분석 결과를 발표하면서 블록체인과 GDPR 준수에 대한 지침을 제공한 최초의 사례가 되기도 했습니다. 다만 아직은 모호한 이 둘의 연결고리를 만들어 나가는 과정이 중요하겠죠.

간략하게 내용을 정리해드렸는데요. 함께 참여를 원하시면 클럽하우스에서 AI네트워크를 검색해주세요! 또 인공지능에 대한 지속적인 토론에 참여하고 싶으신 분은 언제든 댓글로 함께해주세요. 감사합니다 : )

AI 네트워크는 블록체인 기반 플랫폼으로 인공지능 개발 환경의 혁신을 목표로 하고 있습니다. 수백만 개의 오픈 소스 프로젝트가 라이브로 구현되는 글로벌 백엔드 인프라를 표방합니다.

최신 소식이 궁금하시다면 아래 커뮤니케이션 채널을 참고해주시기 바랍니다. 다시 한 번 감사합니다.

AI네트워크 공식 홈페이지: https://ainetwork.ai/

공식 텔레그램: telegram.com/ainetwork_kr

아이나이즈(Ainize): https://ainize.ai

유튜브: https://www.youtube.com/channel/UCnyBeZ5iEdlKrAcfNbZ-wog

페이스북:https://www.facebook.com/ainetworkofficial/

포럼:https://forum.ainetwork.ai/

AIN Price chart: https://coinmarketcap.com/currencies/ai-network/onchain-analysis/

‘이루다 개인정보 위반과 데이터 프라이버시’ AI 네트워크 @클럽하우스

Written by AI Network

No responses yet