Privacy란?
<aside>
💡 나와 관련된 모든 데이터를 control 할 수 있는 권리
</aside>
- 문화권, 법에 따라 다를 수 있고, 상황에 따라서도 다를 수 있음.
- 많은 사람들이 private 하다고 생각하는 data
- Identity
- Finances
- Health
- Biometrics
- Privileged Communications
- Location Data
- Subject : 그 데이터와 관계 있는 사람
- Owner : 그 데이터를 갖고 있는 사람
Computer-Related Privacy Problems
- Data collection
- 어떤 정보가 어떻게 모아지고 있는지 알기 어려움
- Notice and consent
- Control and ownership of data
Fair Information Practices
- Data should be obtained lawfully and fairly.
- Data should be relevant to their purposes, accurate, complete and up to date
- Etc..
Privacy-Preserving Data Mining
- Data에서 식별 정보를 제거하면 작동하지 않음.
- 명백하게 식별되는 정보를 제거할 수 있더라도, 종종 남은 데이터에서 식별이 가능함.
- Data perturbation
-
분석 결과에 영향을 주지 않으면서 데이터와 관련된 개인 정보 보호 위험을 제한할 수 있음.
-
실제로 Apple이 user data를 수집하는 방법
-
적당히 작은 노이즈를 강제로 넣고, 랜덤 샘플링하여 노이즈밖에 안 나오게끔 함.
→ 통계적으로 구분 불가함.
-
데이터 마이닝은 종종 상관 관계 및 집계에 초점을 맞추고 있어 이 방법을 사용하더라도, 안정적으로 수행할 수 있게 됨.
Precautions for Web Surfing
실제로 Privacy 침해가 Web에서 많이 발생함.