빅데이터분석기사

Part1.빅데이터 분석기획_빅데이터의 이해 + 개인정보

joy_your 2024. 2. 28. 10:58

01. 개인정보 개요

- 개인정보의 정의와 판단 기준

1. 개인정보 정의

살아있는 개인에 관한 정보로서 개인을 알아볼 수 있는 정보이다.

당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 정보를 포함한다.

 

2. 개인정보의 판단기준

'생존하는' '개인에 관한' 정보여야 한다.

'정보'의 내용, 형태 등을 제한이 없다.

개인을 '알아볼 수 있는' 정보여야 한다.

   + 다른 정보와 '쉽게 결합하여'개인을 알아볼 수 있는 정보도 포함

** 개인정보의 예 ) 성명, 전화번호, 주소, 주민등록번호나 운전면허번호, 학번 또는 회사의 사번 등

 

 

- 개인정보의 이전 : 개인 정보가 다른 사람(제3자)에게 이전되거나 공동으로 처리하게 하는 것

개인정보의 처리 위탁과 제3자 제공으로 분류된다.

1. 개인정보의 처리 위탁 : 개인정보처리자의 업무를 처리할 목적으로 제3자에게 이전되는 것이다.

** 개인정보를 제공하는 자의 업무 처리와 이익을 위하는 경우

 

2. 개인정보의 제3자 제공 : 해당 정보를 제공받는 자의 고유한 업무를 처리할 목적 및 이익을 위하여 개인정보가 이전되는 것이다.

** 개인정보를 제공받는 자의 업무 처리와 이익을 위하는 경우

 

 

- 개인정보의 보호

1. 개인정보의 보호조치

조직 내부의 정보보안 방침과 개인정보보호법에 위배되지 않도록 개인정보보호 가이드라인을 점검한다.

데이터를 외부에 공개하는 경우 가이드라인에서 정한 규칙을 준수하는지 반드시 확인한다.

가이드라인에 명시되지 않은 경우 관계기관이나 조직 내부의 법무가이드를 받은 후 적절한 범위 안에서 데이터를 활용하도록 한다.

개인정보 보호를 위해 주기적인 패스워드 변경, 시스템 패스워드 관리 보안 강화, 의심스러운 메일 열람 금지, 정기적인 보안교육 참여 등을 유도한다.

백신의 설치 및 최신 버전으로 유지하고, 개인 정보를 과하게 요구하는 사이트의 가입을 자제한다.

 

2. 빅데이터 개인정보보호 가이드라인(방송통신위원회)

비식별화 :  <수집 시부터 개인식별 정보에 대한 철저한 비식별화 조치>

개인정보가 포함된 공개된 정보 및 이용내역정보는 비식별화 조치를 취한 후 수집, 저장, 조합, 분석 및 제3자 제공 등이 가능하다.

 

투명성 확보 : <빅데이터 처리 사실, 목적 등의 공개를 통한 투명성 확보>

개인정보 취급방침을 통해 비식별화 조치 후 빅데이터 처리 사실, 목적, 수집 출처 및 정보 활용 거부권 행사 방법 등을 이용자에게 투명하게 공개한다.

   + (개인정보 취급방침) 비식별화 조치 후 빅데이터 처리 사실, 목적 등을 이용자에게 공개하고 '정보활용 거부 페이지 링크'를 제공하여 이용자가 거부권을 행사할 수 있도록 조치

   + (수집 출처 고지) 이용자 이외의 자로부터 수집한 개인정보 처리 시 '수집 출처, 목적, 개인정보 처리 정리 요구권'을 이용자에게 고지

   ** 개인정보 자기결정권 : 자신에 관한 정보가 언제, 누구에게, 어느 범위까지 알려지고 또 이용되도록 할 것인지를 스스로 결정할 수 있는 권리

 

 

재식별 시 조치 : <개인정보 재식별 시, 즉시 파기 및 비식별화 조치>

빅데이터 처리 과정 및 생성 정보에 개인정보가 재식별될 경우, 즉시 파기하거나 추가적인 비식별화 조치하도록 한다.

 

민감정보 및 비밀정보 처리 : <민감정보 및 통신비밀의 수집, 이용, 분석 등 처리 금지>

특정 개인의 사상, 신념, 정치적 견해 등 민감정보의 생성을 목적으로 정보의 수집, 이용, 저장, 조합, 분석 등 처리를 금지한다.

이메일, 문자 메시지 등 통신 내용의 수집, 이용, 저장, 조합, 분석 등 처리를 금지한다.

 

기술적, 관리적 보호조치: <수집된 정보의 저장, 관리 시 '기술적, 관리적 보호조치'시행>

비식별화 조치가 취해진 정보를 저장, 관리하고 있는 정보 처리시스템에 대한 기술적, 관리적 보호조치를 적용한다.

   + (보호조치) 침입차단시스템 등 접근 통제장치 설치, 접속 기록에 대한 위, 변조 방지 조치, 백신 소프트웨어 설치, 운영 등 악성 프로그램에 의한 침해 방지 조치한다.

 

3. 개인정보 보호를 위한 고려사항

기업은 적법하게 정보주체의 권리를 보호하면서 데이터의 효율적인 이용 방안을 모색하는 것이 중요하다.

데이터와 관련된 주요 법령 및 규제 기관의 가이드라인을 지속적으로 파악하고 내부 프로세스를 사전에 검토하여야 한다.

적용되는 법령에 따른 내부 개인정보 컴플라이언스 체계를 구축하여야 한다.

데이터를 이전할 경우에는 관련 법률에 따른 적법한 프로세스를 마련하여야 한다.

 

 

- 개인정보보호 관련 법률

비즈니스 모델과 처리하는 데이터에 따라 [개인정보보호법]과 [정보통신망 이용촉진 및 정보보호 등에 관한 법률] 그리고 [신용정보의 이용 및 보호에 관한 법률]등을 기본적으로 검토하여야 한다. (데이터3법)

이 외 경우에 따라 [위치정보의 보호 및 이용 등에 관한 법률]과 [정보통신기반보호법] 및 [국가정보화 기본법]과 [전자정부법]등을 추가적으로 검토하여야 한다.

 

 

02. 개인정보 법/제도

- 개인정보보호법

1. 개인정보보호법의 개요

당사자의 동의 없는 개인정보 수집 및 활용하거나 제3자에게 제공하는 것을 금지하는 등 개인정보보호를 강화한 내용을 담아 제정한 법률이다.

상대방의 동의 없이 개인정보를 제3자에게 제공하면 5년 이하의 징역이나 5,000만원 이라의 벌금에 처할 수 있다.

** 개인정보 보호를 위한 법체계를 일원화하고 개인의 권익 보호를 강화하기 위한 법으로 2011년 3월 29일 재정되어 같은 해 9월 30일부터 시행

 

2. 개인정보의 범위(제2조 제1호)

'개인정보'란 살아있는 개인에 관한 정보로서 성명, 주민등록번호 및 영상 등을 통하여 개인을 알아볼 수 있는 정보(해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 것을 포함)를 말한다.

어떤 정보가 개인정보에 해당하는지는 그 정보가 특정 개인을 알아볼 수 있게 하는 다른 정보와 쉽게 결합할 수 있는가에 따라 결정된다.

법원은 그 정보 자체로는 누구의 정보인지 알 수 없더라도 다른 정보와 결합 가능성을 비교적 넓게 인정하여 개인정보에 해당한다 판단하고 있다.

** 광범위한 데이터가 개인정보에 해당하여 이 법이 적용될 수 있다는 점을 유의

 

3. 개인정보의 처리 위탁

일정한 내용을 기재한 문서에 의하여 업무 위탁이 이루어져야 한다(개인정보보호법 제26조 제1항).

위탁하는 업무의 내용과 수탁자를 정보주체에게 알려야 하는바, 개인정보처리방침에 해당 내용을 추가하여 공개하거나, 사업장 등의 보기 쉬운 장소에 게시하는 방법 등을 시행해야 한다(개인정보보호법 제26조 제3항, 동법 시행령 제28조 제3항).

수탁자에 대한 교육 및 감독 의무를 부담하게 된다(개인정보보호법 제26조 제4항).

수탁자가 위탁받은 업무와 관련하여 개인정보를 처리하는 과정에서 개인정보보호법을 위반하여 발생한 손해배상책임에 대하여는 수탁자를 개인정보처리자의 소속 직원으로 본다(개인정보보호법 제26조 제6항).

손해가 발생한 경우 정보주체의 손해배상 청구에 대해 위탁자가 책임을 질 수 있다.

 

4. 개인정보의 제3자제공 : 정보주체로부터 개인정보 제3자 제공 동의를 받아야 한다(개인정보보호법 제17조 제1항).

 

5. 개인정보 처리 위탁과 제3자 제공 판단 기준

<서울중앙지방법원 2018.08.16 선고2017노1296 판결 참조>

개인정보의 취득 목적과 방법

대가 수수 여부

수탁자에 대한 실질적인 관리, 감독 여부

정보주체 또는 이용자의 개인정보보초 필요성에 미치는 영향

개인정보를 이용할 필요가 있는 자가 실직적으로 누구인지 등

 

6. 비식별 개인정보의 이전

정보주체 또는 제3자의 이익을 부당하게 침해할 우려가 있는 경우는 제외한다.

통계작성 및 학술연구 등의 목적을 위하여 필요한 경우로서 '특정 개인을 알아볼 수 없는 형태로 개인정보'를 제공할 수 있도록 규정하고 있다(개인정보보호법 제18조 제2항 제4호).

데이터 제공이 목적에 부합하는지, 특정 개인을 알아볼 수 없는 형태로 제공하는지에 대해 사전에 검토하여야 한다.

 

 

- 정보통신망 이용촉진 및 정보보호 등에 관한 법률(정보통신망법)

1. 정보통신망법의 개요

정보통신망의 개발과 보급 등 이용 촉진과 함께 통신망을 통해 활용되고 있는 정보보호에 관한 규정한 법률이다.

이용자의 동의를 받지 않고 개인정보를 수집하거나 제3자에게 개인정보를 제공한 경우, 법정대리인의 동의 없이 만 14세 미만의 아동의 개인정보를 수집한 경우, 악성 프로그램을 전달 또는 유포한 경우 등은 5년 이하의 징역 또는 5,000만원 이하의 벌금에 처해진다.

 

2. 개인정보의 처리 위탁

원칙적으로는 개인정보 처리위탁을 받는 자, 개인정보 처리위탁을 하는 업무의 내용을 이용자에게 알리고 동의를 받아야 한다.

단, 정보통신서비스 제공자 등은 정보통신서비스의 제공에 관한 계약을 이행하고 이용자의 편의 증진을 위하여 필요한 경우에는 고지 절차와 동의 절차를 거치지 않고, 이용자에게 이에 관해 알리거나 개인정보 처리방침 등에 이를 공개할 수 있다(정보통신망법 제25조 제2항).

만일 제3자에게 데이터 분석을 위탁할 경우, 해당 서비스가 정보통신서비스 제공에 관한 계약을 이행하고 이용자의 편의 증진을 위한 것인지 검토해야 한다.

 

 

- 신용정보의 이용 및 보호에 관한 법률(신용정보보호법)

1. 신용정보보호법의 개요

개인신용정보를 신용정보회사 등에게 제공하고자 하는 경우에 해당 개인으로부터 서면 또는 공인전자서명이 있는 전자문서에 의한 동의 등을 얻어야 한다.

신용정보주체는 신용정보회사 등이 본인에 관한 신용정보를 제공하는 때에는 제공받은 자, 그 이용 목적, 제공한 본인정보의 주요 내용 등을 통보하도록 요구하거나 인터넷을 통하여 조회할 수 있도록 요구할 수 있다.

신용정보회사 등이 보유하고 있는 본인정보의 제공 또는 열람을 청구할 수 있고, 사실과 다른 경우에는 정정을 청구할 수 있다.

 

2. 신용정보의 범위(제2조 제1호 및 제2호, 제34조 제1항)

"신용정보"란 금융거래 등 상거래에 있어서 거래 상대방의 신용을 판단할 때 필요한 정보로서 다음 각 목의 정보를 말한다.

가. 특정 신용정보주체를 식별할 수 있는 정보

나. 신용정보주체의 거래내용을 판단할 수 있는 정보

다. 신용정보주체의 신용도를 판단할 수 있는 정보

라. 신용정보주체의 신용거래능력을 판단할 수 있는 정보

마. 그 밖에 가목부터 라목까지와 유사한 정보

 

3. 개인신용정보

"개인신용정보"란 신용정보 중 개인의 신용도와 신용거래능력 등을 판단할 때 필요한 정보를 말한다.

"개인신용정보"는 기업 및 법인에 관한 정보를 제외한 살아 있는 개인에 관한 정보로서 성명, 주민등록번호 등을 통하여 개인을 알아볼 수 있는 정보이며, 신용정보주체의 거래내용, 신용도, 신용거래능력 등과 결합되는 경우에만 개인신용정보에 속한다.

** 성명과 연락처만을 처리하는 경우에는 개인정보를 처리하는 것이며, 성명과 연락처 및 거래금액을 함께 처리하는 경우에는 개인신용정보를 처리하는 것으로 해석

 

4. 개인신용정보의 처리 위탁

신용정보회사 등은 그 업무 범위에서 의뢰인의 동의를 받아 다른 신용정보회사에 신용정보의 수집, 조사를 위탁할 수 있다.

개인신용정보 처리에 대한 업무 위탁의 경우에는 수집된 신용정보의 처리를 자본금 또는 자본 총액이 1억 원 이상인 기업으로서 신용정보관리, 보호인 등을 지정한 자에게 위탁할 수 있다.

신용정보회사, 신용정보집중기관, 은행, 금융지주회사, 금융투자업자, 보험회사 등은 신용정보 처리 위탁 시 금융위원회에 보고해야 하며, 이에 관한 구체적 사항은 [금융회사의 정보처리 업무 위탁에 관한 규정]에 따른다.

특정 신용정보주체를 식별할 수 있는 정보는 암호화하거나 봉함 등의 보호조치를 하여야 하며, 신용정보가 분실, 도난, 유출, 변조 또는 훼손당하지 않도록 수탁자를 연 1회 이상 교육하여야 한다.

위탁 계약의 이행에 필요한 경우로서 수집된 신용정보의 처리를 위탁하기 위하여 제공하는 경우 정보주체의 동의를 받지 않아도 된다(신용정보보호법 제17조, 동법 시행령 제14조).

 

5. 개인신용정보의 제3자 제공

개인신용정보를 타인에게 제공하려는 경우 정보주체에 서비스 제공을 위하여 필수적 동의 사항과 그 밖의 선택적 동의 사항을 구분하여 설명한 후 각각 동의를 받도록 하고 있다(신용정보보호법 제32조, 제34조 등).

기타 개인정보 제공 시 개인정보보호법이 적용된다.

 

6. 개인식별정보

"개인식별정보"란 생존하는 개인의 성명, 주소 및 주민등록번호, 여권 번호, 운전면허번호, 외국인 등록번호, 국내거소 신고번호 및 성별, 국적 등 개인을 식별할 수 있는 정보를 말한다.

 

 

- 2020년 데이터3법의 주요 개정 내용

** 데이터3법: 개인정보보호법, 정보통신망 이용촉진 및 정보보호 등에 관한 법률, 신용정보의 이용 및 보호에 관한 법률

데이터 이용 활성화를 위한 '가명정보'개념 도입 및 데이터 간 결합 근거 마련

개인정보보호 관련 법률의 유사, 중복 규정을 정비 및 거버넌스 체계 효율화

데이터 활용에 따른 개인정보처리자 책임 강화

다소 모호했던 개인정보의 판단기준 명확화

 

1. 개인정보보호법 주요 개정 내용

개인정보 관련 개념을 개인정보, 가명정보, 익명정보로 구분

가명정보를 통계 작성 연구, 공익적 기론 보존 목적을 처리할 수 있도록 허용

가명정보 이용 시 안전장치 및 통제 수단 마련

분산된 개인정보보호 감독기관을 개인정보보호위원회로 일원화

개인정보보호위원회는 국무총리 소속 중앙행정기관으로 격상

 

2. 정보통신망법 주요 개정 내용

개인정보보호 관련 사항을 개인정보보호법으로 이관

온라인상 개인정보보호 관련 규제 및 감독 주체를 개인정보보호위원회로 변경

 

3. 신용정보보호법 주요 개정 내용

가명정보 개념을 도입해 빅데이터 분석 및 이용의 법적 근거 마련

가명정보는 통계작성, 연구, 공익적 기록보존 등을 위해 신용정보 주체의 동의 없이 이용, 제공 가능

 

 

- 유럽 연합과 미국의 개인정보보호 체계

1. 유럽 연합(EU)

유럽 연합의 시민이 데이터를 활용하는 경우 GDPR(General Data Protection Regulation)을 준수해야 한다.

** GDPR: 유럽 의회에서 시민들의 개인정보 보호를 강화하기 위해 만든 통합 규정

GDPR은 정보주체의 권리와 기업의 책임성 강화 등을 주요 내용으로 하며 위반 시 과징금 부과를 규정하고 있다.

GDPR의 주요 항목으로 사용자가 본인의 데이터 처리 관련 사항을 제공받을 권리, 열람, 정정, 삭제 요청 권리, 데이터 이동 권리, 처리 거부 요청 권리 등이 있다.

 

2. 미국

미국은 기본적으로 시장 자율 규율(self-regulation)방식으로 EU나 한국과 같이 공공 부문과 민간 부문을 포함하는 개인정보보호에 관한 일반법이 연방 법률로써 존재하지 않는다.

   + 대신 공공, 통신, 금융, 교육, 의료, 근로자 정보 등 영역별로 개인정보보호를 규율하는 개별 법률이 각 분야별 개인정보보호를 담당

** 공공 부문에서는 프라이버시법(Privacy Act)이 개인정보보호 일반법으로의 역할을 한다.

** 미국의 법 제도는 연방법과 각 주 법으로 구성된다.

 

주 법체계에서는 EU의 GDPR 제정 이후 캘리포니아 주의 캘리포니아 소비자 개인정보보호법(California Consumer Privacy Act, CCPA)을 시작으로 많은 주들이 포괄적인 일반 개인정보보호법을 도입하려는 노력을 진행 중이다.

 

 

 

03. 개인정보 비식별화

- 개인정보 비식별화의 개요

1. 비식별 정보 : 정보의 집합물에 대해 [개인정보 비식별 조치 가이드라인]에 따라 적정하게 '비식별 조치'된 정보

** 익명 데이터는 데이터를 수집하는 단계에서 특정 개인을 식별할 수 없는 형태로 수집하는 것으로 비식별 정보와는 특성이 다름

 

2. 비식별 조치 : 정보의 집합물에서 개인을 식별할 수 있는 요소를 전부 또는 일부 삭제하거나 대체 등의 방법을 통해 개인을 알아볼 수 없도록 한느 조치

 

3. 비식별 정보희 활용

비식별 정보는 개인정보가 아닌 정보로 추정되므로 정보주체로부터의 별도의 동의 없이 해당 정보를 이용하거나 제3자에게 제공할 수 있다.

   + 다만, 불특정 다수에게 공개되는 경우에는 다른 정보를 보유하고 있는 누군가에 의해 해당 정보주체가 식별된 가능성이 있으므로 비식별 정보의 공개는 원칙적으로 금지

 

4. 비식별 정보의 보호

비식별 정보는 개인정보가 아닌 것으로 추정되지만, 새로운 결합 기술이 나타나거나 결합 가능한 정보가 증가하는 경우에는 정보주체가 '재식별'될 가능성이 있다.

비식별 정보를 처리하는 자(비식별 정보를 제공받은 자 포함)가 해당 정보를 이용하는 과정에서 재식별하게 된 경우에는 해당 정보를 즉시 처리 중지하고 파기하여야 한다.

비식별 정보라고 하더라도 필수적인 관리적, 기술적 보호 조치는 이행해야 한다.

 

 

- 개인정보 비식별화 조치 가이드라인

데이터 이용 과정에서 개인 정보 침해, 방지를 위해 개인정보를 비식별 조치하는 절차 및 방법에 대한 가이드라인으로, 개인정보를 비식별 조치하여 이용 또는 제공하려는 사업자 등이 준수해야 할 기준을 제시한다.

** 통계법 등 관련법에 따라 개인정보를 수집, 이용하는 경우에는 당해 법령에 따라 처리

 

1. 개인정보 비식별화 조치 가이드라인의 추진배경

정부 3.0 및 빅데이터 활용 확산에 따른 데이터 활용가치가 증대되고 있다.

개인정보 보호 강화에 대한 사회적 요구가 지속되고 있다.

** '보호와 활용'을 동시에 모색하는 세계적 정책변화에 적극 대응이 필요

 

2. 개인정보 비식별화 조치 가이드라인의 단계별 조치 사항

1단계 [사전검토] : 개인정보에 해당하는지 여부를 검토한 후, 개인정보가 아닌 것이 명백한 경우 법적 규제 없이 자유 통계 활용 > 개인정보, 식별정보

 

2단계 [비식별 조치(개인식별 요소 제거)] : 정보 집합을(데이터 셋)에서 개인을 식별할 수 있는 요소를 전부 또는 일부 삭제하거나 대체하는 등의 방법을 활용, 개인을 알아볼 수 없도록 하는 조치 > 가명, 총계, 삭제, 범주화, 마스킹

 

3단계 [적정성 평가] : 다른 정보와 쉽게 결합하여 개인을 식별할 수 있는지를 [비식별 조치 적정성 평가단]을 통해 평가 > k-익명성, l-다양성, t-근접성

** k-익명성 : 동일한 값을 가진 레코드를 k개 이상으로 하여 특정 개인을 식별할 확률을 1/k로 함

** l-다양성 : 각 레코드는 최소 1개 이상의 다양성을 가지도록 하여 동질성 또는 배경지식 등에 의한 추론을 방지

** t-근접성 : 전체 데이터 집합의 정보 분포와 특정 정보의 분포 차이를 t이하로 하여 추론 방지

 

비식별 적정성 평가에서 부적정 판단을 받는다면 다시 비식별조치로 돌아간다.

 

4단계 [사후관리] : 비식별 정보 안전 조치, 재식별 가능성 모니터링 등 비식별 정보 활용 과정에서 재식별 방지를 위해 필요한 조치 수행 > 관리적/기술적 보호조치

 

3. 개인정보 비식별화 조치 가이드라인의 단계별 조치 기준

사전검토 : <개인정보 해당 여부 검토>

빅데이터 분석 등을 위해 정보를 처리하려는 사업자 등은 해당 정보가 개인정보인지 여부에 대해 개인정보 해당 여부 판단 기준을 참조하여 판단

해당정보가 개인정보에 해당하지 않는 것이 명백한 경우에는 별도 조치 없이 빅데이터 분석 등에 활용 가능하고, 해당한다고 판단되는 경우 다음 단계의 조치 필요

 

비식별조치 : <비식별 조치기법 적용>

식별자(Identifier) 조치 기준

** 식별자 : 개인 또는 개인과 관련한 사물에 고유하게 부여된 값 또는 이름

   + 정보 집합물에 포함된 식별자는 원칙적으로 삭제 조치

   + 데이터 이용 목적상 반드시 필요한 식별자는 비식별 조치 후 활용

 

정보 집합물에 포함된 속상도 데이터 이용 목적과 관련이 없는 경우에는 원칙적으로 삭제

** 속성자 : 개인과 관련된 정보로서 다른 정보와 쉽게 결합하는 경우 특정 개인을 알아볼 수도 있는 정보

 

데이터 이용 목적과 관련이 있는 속성자 중 식별요소가 있는 경우에는 가명처리, 총계처리 등의 기법을 활용하여 비식별 조치 필요

희귀병명, 희귀 경력 등의 속성자는 구체적인 상황에 따라 개인 식별 가능성이 매우 높으므로 엄격한 비식별 조치 필요

** 각각의 기법에는 이를 구현할 수 있는 다양한 세부기술이 있으며, 데이터 이용 목적과 기법별 장/단점 등을 고려하여 적절한 것을 활용

 

적정성 평가 : <k-익명성 모델 활용>

적정성 평가 필요성

   + 비식별 조치가 충분하지 않은 경우 공개 정보 등 다른 정보와의 결합, 다양한 추론 기법 등을 통해 개인이 식별될 우려

   + 개인정보 보호책임자 책임 하에 외부전문가가 참여하는 [비식별 조치 적적성 평가단]을 구성, 개인 식별 가능성에 대한 엄격한 평가 필요

   + 적정성 평가 시 프라이버시 보호 모델 중 k-익명성을 활용

   + k-익명성은 최소한의 평가수단이며, 필요시 추가적인 평가모델(l-다양성, t-근접성) 활용

 

적정성 평가 절차

   + 기초 자료 작성: 개인정보처리자는 적정성 평가에 필요한 데이터 명세서, 비식별 조치 현황, 이용기관의 관리 수준 등 기초 자료 작성

   + 평가단 구성 : 개인정보 보호책임자가 3명 이상으로 평가단을 구성(외부 전문가는 과반수 이상)

   + 평가 수행 : 평가단은 개인정보처리자가 작성한 기초자료와 k-익명성 모델을 활용하여 비식별 조치 수준의 적정성을 평가

   + 추가 비식별 조치 : 개인정보처리자는 평가결과가 '부정적'인 경우 평가단의 의견을 반영하여 추가적인 비식별 조치 수행

   + 데이터 활용 : 비식별 조치가 적정하다고 평가받은 경우에는 빅데이터 분석 등에 이용 또는 제공이 허용

 

사후관리 : <비식별 정보 안전 조치>

비식별 조치된 정보가 유출되는 경우 다른 정보와 결합하여 식별될 우려가 있으므로 필수적인 보호조치 이행

   + 관리적 보호조치 : 비식별 정보파일에 대한 관리 담당자 지정, 비식별 조치 관련 정보공유 금지, 이용 목적 달성 시 파기 등의 조치 필요

   + 기술적 보호조치 : 비식별 정보 파일에 대한 접근 통제, 접속기록 관리, 보안프로그램 설치/운영 등의 조치 필요

 

비식별 정보 유출 시 보호조치

   + 유출 원인 분석 및 추가 유출 방지를 위한 관리적/기술적 보호조치

   + 유출된 비식별 정보의 회수/파기

 

사후 관리 : <재식별 가능성 모니터링>

비식별 정보를 이용하거나 제3자에게 제공하려는 사업자 등은 해당 정보의 재식별 가능성을 정기적으로 모니터링 필요

모니터링 결과, 다음의 점검 항목 중 어느 하나에 해당되는 경우에는 추가적인 비식별 조치 강구

비식별 정보를 제공/위탁한 자가 재식별 가능성을 발견한 경우에는 이를 즉시 그 정보를 처리하고 있는 자에게 통지하고 처리 중단 요구 및 해당 정보를 회수/파기하는 등 조치 필요

 

사후관리 : <비식별 정보 제공 및 위탁계약 시 준수사항>

비식별된 정보를 제3자의 기관에 제공하거나, 처리 위착하는 경우 재식별 위험관리에 관한 내용을 계약서에 포함

   + 재식별 금지 : 비식별 정보를 제공받거나 처리를 위탁받은 사업자 등은 다른 정보와 결합을 통해 재식별 시도가 금지됨을 명시

   + 재제공 또는 재위탁 제한 : 비식별 정볼르 제공하거나 처리를 위탁하는 자는 재제공 또는 재위탁 가능 범위를 정하여 계약서에 명시

   + 재식별 위험 시 통지 : 재식별이 되거나 그 가능성이 높아지는 상황이 발생한 경우에는 데이터 처리 중지 및 비식별 정보 제공자 또는 위탁자에게 통지 의무 등 명시

 

사후관리 : <재식별 시 조치 요령>

비식별 정보가 재식별된 경우에는 신속하게 그 정보의 처리를 중단하고 해당 개인정보가 유출되지 않도록 조치 필요

재식별된 정보는 즉시 파기 조치하되, 해당 정보를 다시 활용하려면 비식별 조치 절차 다시 수행

 

 

4. 개인정보 비식별화 조치 가이드라인의 조치 방법

가명처리 

   > 개인정보 중 주요 식별 요소를 다른 값으로 대체하는 방법

   > 값을 대체 시 규칙이 노출되어 역으로 쉽게 식별할 수 없도록 주의

   ex) 홍길동, 35세, 서울 거주, 한국대 재학 -> 임꺽정, 30대, 서울 거주, 국제대 재학

 

총계처리

   > 데이터의 총합 값을 보여 주고 개별 값을 보여 주지 않는 방법

   > 특정 속성을 지닌 개인으로 구성된 단체의 속성 정보를 공개하는 것은 그 집단에 속한 개인의 정보를 공개하는 것과 마찬가지이므로 주의

   ex) 임꺽정 180cm, 홍길동 170cm, 이콩쥐 160cm, 김팥쥐 150cm -> 물리학과 학생 키 합 : 660cm, 평균 : 165cm

   ex) 에이즈 환자 집단임을 공개하면서 특정인이 그 집단에 속함을 알 수 있도록 표시하는 행위 금지

 

데이터 삭제

   > 데이터 공유나 방 목적에 따라 데이터 셋에 구성된 값 중 필요 없는 값 또는 개인식별에 중요한 값을 삭제하는 방법

   ex) 주민등록번호 901206-1234567 -> 90년대 남자

   ex) 개인과 관련된 날짜정보(합격일 등)는 연단위로 처리

 

데이터 범주화

   > 데이터의 값을 범주의 값으로 변환하여 값을 숨기는 방법

   ex) 홍길동, 35세 -> 홍씨(30~40세)

 

데이터 마스킹

   > 개인을 식별하는 데 기여할 확률이 높은 주요 식별자를 보이지 않도록 처리하는 방법

   > 남아 있는 정보만으로 개인을 식별할 수 없어야 하며, 공개된 다른 정보와 결합하더라도 특정 개인을 식별할 수 없어야 함

   ex) 홍길동, 35세, 서울 거주, 한국대학교 재학 -> 홍ㅇㅇ, 35세, 서울 거주, ㅇㅇ대 재학

 

 

 

04. 개인정보 활용

- 데이터 수집의 위기 요인과 통제 방안

1. 사생활 침해로 위기 발생

M2M(Machine to Machine) 시대가 되면서 정보를 수집하는 센서들의 수가 증가하고 있다.

개인정보의 가치가 커짐에 따라 많은 사업자들이 개인정보 습득에 더 많은 자원을 투입하고 있다.

특정 데이터가 본래 목적 외로 가공되어 2차, 3차 목적으로 활용될 가능성이 커지고 있다.

위험의 범위가 사생활 침해 수준을 넘어 사회, 경제적 위협으로 더 확대될 수 있다.

** 사생활 침해 우려는 민간뿐만 아닌 정부의 정보 수집에서도 나타나고 있다.

 

2 동의에서 책임으로 강화하여 통제

개인정보는 본래의 1차적 목적 외에도 2차, 3차적 목적으로 가공, 유통, 활용되고 있다.

   + 개인정보의 활용에 대해 개인이 매번 동의하는 것은 매우 어려운 일이며, 경제적으로도 비효율적

개인정보 사용으로 발생하는 피해에 대해서는 개인정보 사용자가 책임을 지게 한다.

개인정보를 사용하는 주체가 익명화 기술 같은 더 적극적인 보호 장치를 마련하게 하는 효과가 있을 것으로 기대된다.

** 익명화: 사생활 침해를 방지하기 위해 데이터에 포함된 개인정보를 삭제하거나 알아볼 수 없는 형태로 변환하는 방법

 

 

- 데이터 활용의 위기 요인과 통제 방안

1. 책임원칙 훼손으로 위기 발생

빅데이터의 분석 결과에 따라 특정한 행위를 할 가능성이 높다는 이유만으로 특정인 처벌받는 것은 민주주의 사회 원칙을 훼손한다.

특정인이 특정 사회, 경제적 특성을 가진 집단에 속한다는 이유만으로 그의 신용도와 무관하게 대출이 거절되는 상황은 잘못된 클러스터링의 피해이다.

특정 조건을 가진 학생이 대학에 진학하고자 할 때 잘못된 예측 알고리즘에 의해 진학할 기회 자체를 주지 않는다면 이는 사회 정의 문제와도 직결된다.

 

2. 결과 기반 책임 원칙을 고수하여 통제

기존의 책임 원칙을 더 강화해야 한다.

예측 결과에 의해 불이익을 당할 가능성을 최소화하는 방안 마련이 필요하다.

제도 마련과 함께 알고리즘의 기술적 완성도를 더 높여야 한다.

 

 

- 데이터 처리의 위기 요인과 통제 방안

1. 데이터 오용으로 위기 발생

빅데이터는 과거에 일어났던 일로 인해 기록된 데이터에 의존한다.

   + 빅데이터를 기반으로 미래를 예측하는 것은 어느 정도 정확도를 가질 수 있지만 항상 맞는 것은 아님

빅데이터 사용자가 데이터를 과신할 때 큰 문제가 발생할 가능성이 높다.

   + 잘못된 지표를 사용하는 것은 오히려 과거 경험에 의존하는 것보다 더 잘못된 결론을 도출할 수 있음

   ** 잘못된 인사이트를 도출하여 비즈니스에 활용할 경우 더 많은 손실이 발생할 수 있음

 

2. 알고리즘 접근을 허용하여 통제

알고리즘에 대한 접근 권한을 부여받아 직접 검증할 수 있도록 한다.

알고리즘에 대한 객관적인 인증방안을 마련 및 도입한다.

알고리즘의 부당함을 반증할 수 있는 방법을 제시해 줄 것을 요청한다.

공개해 준 알고리즘을 해석해 줄 알고리즈미스트와 같은 전문가를 영입한다.

   + 알고리즈미스트는 컴퓨터, 수학, 통계학, 비즈니스 등의 다양한 지식이 필요