재미있는 보안 이야기

[누구나 이해하는 IT보안] 비정형 데이터의 안전한 활용 :: 가명처리 기술


인공지능은 데이터를 통해 학습하고 추론하며 우리에게 유용하게 사용되고 있습니다. 

인공지능과 데이터는 현대사회에서는 더이상 무시할 수 없을 정도로 중요한데요. 

이 두가지 기술은 우리의 삶을 완전히 변화 시키고 새로운 가능성을 제시하는 데 핵심적인 역할을 하고 있습니다. 

최근 인공지능(AI) 기술과 컴퓨팅 자원의 발달로 비정형데이터(이미지·영상·음성·텍스트 등)에 대한 활용 수요가 폭발적으로 증가했는데요.


4차 산업시대에서 인터넷을 통해 수집되는 많은 데이터는 곧 경쟁력입니다. 

고객 정보, 거래 정보, 소비 패턴 등의 다양한 데이터를 수집, 분석하고 이를 적극적으로 활용할 수 있는 기업이 경쟁에서 앞서나가고 있습니다. 

데이터 수집 과정에서 개인정보는 개인의 특성과 행동을 파악하는 데 있어 중요한 정보이며, 

분석을 통해 기업의 의사 결정 과정에 활용하면 더 높은 가치를 창출 할 수 있습니다.


📌데이터 활용의 제한

그러나 이 과정에서 개인정보, 데이터를 수집할 수 없다면 빅데이터의 활용도는 상당히 제한됩니다.

데이터를 활용하는 과정에서 사전에 정보 주체에게 수집 항목, 보관 기간, 이용 목적 등을 알리고 

동의를 받아야 하는 제도는 데이터 활용의 발목을 붙잡았습니다. 

그 결과 우리는 빅데이터 활용 국가 중 활용 순위가 중하위권에 달하는 결과를 가져왔습니다.


이에 4차 산업 시대의 성장동력인 데이터 활용에 대한 시대적 요구를 반영하여 특정 목적으로 

개인정보를 가명처리 할 경우 정보 주체의 동의 없이도 안전하게 데이터를 활용할 수 있는 가명정보 제도를 추진하였습니다. 


가명정보 제도는 빅데이터, AI 등 다양한 융·복합 산업에서의 데이터 이용 수요가 급증하는 가운데, 

데이터 활용의 핵심인 가명정보 활용을 위한 법적 근거가 마련함으로, 가명정보 활용에 필요한 가명정보 처리 목적, 

처리 절차 및 방법, 안전조치에 관한 사항 등을 안내하여 안전한 데이터 활용 환경을 구축하고 있습니다.



📌개인정보와 가명정보?

개인정보는 살아있는 개인에 관한 정보로 성명, 주민등록번호, 영상 등 개인을 알아볼 수 있는 정보를 말합니다.

가명정보는 개인정보의 일부 또는 전부를 삭제•대체하는 등 가명처리를 통해 추가정보 없이는 특정 개인을 알아볼 수 없는 정보를 가명정보라고 합니다.


📂정형데이터와 비정형데이터?

정형데이터는 정해진 규칙에 맞게 구조화된 형식으로 존재하는 데이터를 말합니다. DB에 열과 행으로 저장된 테이블 형식의 자료처럼 말이죠.

정형데이터의 특징은 데이터 연산, 분석 등 데이터 처리방식과 가면 처리기술, 방법이 비교적 단순합니다.

반면, 비정형데이터는 일정한 규격이나 정해진 형태가 없이 구조화되지 않은 데이터를 말합니다. 

예시로 사진, 비디오, 통화 음성, 대화기록, 보고서, 메일 본문 등이 있습니다. 

비정형데이터는 연구 목적, 환경에 따라 데이터 처리 방식 및 가명 처리 기술과 방법이 복잡하고 다양합니다.



📝비정형 데이터의 가명처리 • 활용 예시  

이미지 • 영상 

- 특정 질병을 진단(보조)하는 의료 AI연구 개발을 위해 병원이 보유한 MRI, CT, X-ray 사진 • 영상을 가명처리 후 학습 데이터로 활용

- 불법현수막을 탐지하여 알려주는 CCTV개발을 위해 지자체가 보유한 공공장소 CCTV 촬영영상을 가명처리하여 AI연구 개발에 활용

음성 • 텍스트

- 민원인 상담, 대응을 위한 음성 생성 AI를 개발하기 위해 공공기관이 보유한 민원상담 음성정보와 상담 기록 정보를 가명처리하여 학습 데이터로 활용

- 법적 문서, 사건 기록, 조사 보고서 등의 사건 관련자의 개인정보를 가명 처리하면, 연구나 통계분석, 교육 목적으로 활용



📍가명처리란 무엇인가요?

개인정보의 일부를 삭제하거나 일부 또는 전부를 대체하는 등의 방법으로, 추가 정보 없이는 특정 개인을 알아볼 수 없도록 처리하는 것을 말합니다.

비정형데이터 가명처리 기술

- 이미지 필터링 기술에는 블러링, 픽셀화, 마스킹이 있으며, 얼굴이 외에도 사람 형상, 옷차림, 차량 번호 등 사물 및 동물 등도 필터링 대상이 될 수 있습니다.





😎마크애니 AI 자동 마스킹 솔루션

CCTV 영상의 외부 반출 시 사람의 신체 및 얼굴, 차량번호 등을 자동 마스킹하는 개인정보 및 민감정보 유출 방지 솔루션입니다.

AI 자동 마스킹 솔루션은 주요 영상 반출 시, 최신 고속 AI 모듈 적용으로 영상 내 

주요객체를 정확하게 구분하여 신체, 얼굴, 차량번호(번호판)을 자동으로 인식하고 마스킹합니다. 

기존 수동 마스킹 대비 비약적인 속도와 정확도를 지원하며 개인정보 및 민감정보 유출을 방지 할 수 있습니다. 


개인정보 마스킹
- 정지화상 대상 마스킹 기능
- 움직이는 객체 추적하여 자동 마스킹
- 마스킹이 필요한 객체를 자동 추적

각종 커스터 마이징 기능 제공
- 마스킹 객체 설정 기능 제공
- 수동 마스킹/언마스킹 기능 제공
- 설정된 객체 일괄 마스킹 기능 제공





마크애니는 기업, 기관의 기밀문서와 데이터를 보호하기 위해 촘촘한 엔드포인트 문서 보안 솔루션을 보유하고 있습니다. 랜섬웨어 공격으로 문서와 데이터가 유출돼도 인가된 직원이 아니면 함부로 파일을 열어볼 수 없고 사내·외, 원격 환경 지원이 가능해 언제 어디서나 기업 네트워크를 강력하게 보호하죠. 이미 공공, 금융, 제조, 유통 등 국내 600여 곳이 마크애니 솔루션과 함께하고 있답니다. 



🙌 똑똑한 AI로 영상 자동 마스킹이 필요하시다면, 마크애니와 함께하세요!









출처 : 가명정보 처리 가이드라인 |  개인정보보호위원회 

        : 가명정보 활용 촉진을 위한 가이드라인 개선방안 연구 : 가명정보 처리 가이드라인을 중심으로 | 오지민 | 건국대학교




Social Media Links

솔루션 소개

둘러보기

마크애니

고객지원


(주)마크애니  서울시 중구 퇴계로 286 쌍림빌딩 13층  

(+82) 02-2262-5222ㅣ contact@markany.com  

업자 등록번호 : 101-81-47345

Copyright © 2024. MarkAny. All Rights Reserved.

솔루션 소개

둘러보기

고객지원

Copyright © 2024. MarkAny. All Rights Reserved.