개인정보보호를 위한 보안 처리기술로는 익명성을 보장을 위한 비식별화 조치(K 익명성, L 다양성 평가) 및 암호화 처리 방법이 있습니다. 개인정보보호를 기술적 측면에서 강화하기 위한 다양한 수단에 대해서 정리해보겠습니다.
개인정보보호 필요성
악의적인 공격이나 또는 내부자의 실수나 고의적인 의도로 수 많은 대량의 개인정보들이 유출되는 사고가 빈번히 일어나고 있습니다. (페이스북 계정유출 사건 보도자료)
IT 기술의 발달로 위치정보, 신상정보 같은 다양한 개인정보들이 빅데이터로 관리 분석되고 있습니다. 이런 대규모 데이터를 익명화, 암호화하여 만약 유출이 되더라도 피해의 확산을 최소화할 수 있는 기술의 적용이 필요합니다.
보안 처리기술
개인정보 보호를 위한 빅데이터 처리 기술은 크게 다음과 같이 분류할 수 있습니다.
분석기술 종류 | 특징 |
1. 비식별조치 | 특정 개인을 알아볼 수 없도록 암호화 하거나 일부분을 삭제하는 방법 K-익명성, L-다양성, T-접근성 기술을 통해 비식별화 수준을 평가할 수 있습니다. |
2. 암호화 | 데이터 저장 및 전송시 비밀번호, 고유 식별정보, 바이오 정보 등을 암호화 (개인정보 보호법) |
1. 비식별 조치
데이터를 보고 특정인임을 추론할 수 없게 하거나 또는 민감한 정보의 다양성을 높이는 등의 방법으로 개인정보를 보호할 수 있습니다. 처리 방법은 다음과 같습니다.
처리 방법 | 설명 (사례) |
가명처리 | [데이터]김철수, 44세, 한국대 재학 [가명처리]홍길동, 40대, 서울소재 대학 재학중 |
총계처리 | 데이터를 전체 평균을 내거나 합산하여 표현 (예, 20대 직장인 소득 평균 OOO만원) |
데이터삭제 | 개인정보 관련 데이터를 삭제하거나 범주화하여 숨김 (예, 서울거주 20대 남성) |
범주화 | 데이터를 범주화하여 특정 정보를 숨김 (예, 김모씨, 수도권 거주) |
데이터마스킹 | 임의의 Noise나 공백 등으로 대체하여 개인정보를 가리는 방법 (예, 김OO, 주민번호: 2*****-*******) |
이런 비식별화 조치 수준을 평가하기 위한 방법으로 K 익명성, L 다양성 등의 평가기준을 이용할 수 있습니다.
K-익명성
주어진 데이터 집합에서 준식별자의 항목이 적어도 K개가 존재하도록 데이터를 구성하는 것입니다. 가령 K값이 4라고 한다면 아래와 같이 녹색의 준 식별자에 해당하는 항목이 4개 존재하는 형태입니다.
따라서 만약 이 데이터가 외부인이 보더라도 동일한 데이터가 4개 이상이 되므로 특정인을 구분하기가 그만큼 어려워집니다.
L-다양성
K 익명성으로 비식별화가 되더라도 일부 정보들이 모두 같은 값을 가질 경우 공격대상의 정보를 알아낼 수가 있습니다.
가령 위와 같이 익명화 되어있더라도 특정 30대 연령대가 위암에 걸리기 쉽다는 사실을 유추할수 있는 취약점이 있습니다.
이의 보완을 위해 위와 같이 연령대를 40대 이상, 이하로 분류하여 질병을 다시 혼합 함으로써 이런 유추에 의한 공격 가능성을 없앨 수 있습니다.
2. 암호화
개인정보보호법의 24조에서는 고유의 식별정보나 주민번호의 암호화 적용 등의 조치를 시행할 수 있는 근거가 됩니다. 개인정보의 저장 및 전송시 암호화를 해야 하며 다음의 대상에 대해 수행합니다.
저장시 | 전송시 |
– 비밀번호, 고유식별번호, 바이오정보 – 계좌번호, 신용카드 정보 | – 비밀번호, 고유식별번호, 바이오정보 – 개인정보, 인증정보 |
저장시 암호화
개인정보를 저장하고 관리하는 데이터베이스 내의 정보를 암호화하여 저장해야 합니다. 암호화 방법은 암, 복호화 모듈의 위치와 조합에 따라 다음과 같이 구분할 수 있습니다.
- 응용프로그램 자체 암호화: 서버에 모듈이 위치하며 응용프로그램에서 요청
- DB 서버 암호화: 암호화 모듈은 DB서버 내에 위치하며 응용프로그램에서 요청
- DBMS 자체 암호화: DB 자체암호화 지원으로 애플리케이션의 수정은 불필요함
- DBMS 암호화 기능호출: 응용프로그램에서 DB 서버의 암, 복호화 API를 호출하는 방식으로 애플리케이션 수정이 필요함
- 운영체제 암호화: 파일서버 및 OS 내에 암, 복호화 모듈이 위치
저장 시 암호화는 데이터베이스의 성능이나 운영체제 파일시스템의 성능저하 가능성이 있으므로 벤치마크를 통해 유형을 선택해야 합니다.
전송시 암호화
웹 브라우저에 접속시 클라이언트와 웹서버 간 암호화 기술을 적용하는 방식입니다. 일반적으로 SSL, TLS 방식을 통해 전송계층 암호화를 이용하면 편리합니다.
그리고 개인정보처리 시스템 간 암호화를 위해서는 VPN과 같은 가상의 전용망 기술을 사용하여 외부의 공격자 침입에 대비할 수 있어야 합니다. (예, IPSec 기술)
그리고 이메일을 통해 개인정보를 전송하는 경우라면 첨부 파일이나 내용의 유출을 막도록 PGP나 S/MIME 기술을 이용해서 암호화 전송할 수 있습니다.
맺음말
이상으로 개인정보보호를 위한 비식별화 조치 및 암호화 기술에 대해 간략히 알아보았습니다. 해당 기술의 자세한 내용은 다음에 다시 다뤄보도록 하겠습니다.