什麼是數據匿名化?
數據匿名化旨在通過刪除或加密數據庫中的個人身份信息來保護私人或敏感數據。數據匿名化的目的是在保護個人或公司隱私活動的同時,維護所收集和共享數據的完整性。
數據匿名化也稱爲“數據混淆”、“數據掩碼”或“數據去標識化”。它與去匿名化形成對比,去匿名化是數據挖掘中使用的技術,旨在重新識別加密或模糊的信息。
要點總結
- 數據匿名化是指從敏感數據中去除或加密個人或身份識別信息。
- 隨着企業、政府、醫療保健系統和其他組織越來越多地將個人信息存儲在本地或雲服務器上,數據匿名化對於維護數據完整性和防止安全漏洞至關重要。
- 在高度敏感的醫療保健和金融領域,必須以符合監管要求的方式對患者或客戶數據進行模糊處理。
瞭解數據匿名化
企業在日常業務運營中會產生、存儲和處理海量的敏感數據。由於各個行業和國家生成和共享的數據中蘊含着相關信息,科技進步得以蓬勃發展。得益於社交媒體和電子商務平臺等領域共享的數據,金融科技( Fintech )在爲客戶定製金融服務方面取得了長足進步。
數字媒體和電子商務公司之間共享的數據幫助這兩個行業更好地在其網站上向特定用戶或消費者投放產品廣告。然而,爲了使共享數據發揮作用,同時又不泄露數據庫中客戶的身份信息,必須採用匿名化技術。
數據匿名化實踐
數據匿名化在大多數處理敏感信息的行業中得到應用,例如醫療保健、金融和數字媒體行業,旨在提升數據共享的完整性。數據匿名化降低了在不同國家、行業甚至同一公司內部不同部門之間共享數據時發生意外泄露的風險,同時也減少了身份盜竊的發生幾率。
例如,如果醫院在與醫學研究實驗室或製藥公司共享患者機密數據時能夠確保患者匿名,那麼這種做法就符合倫理。具體做法是從共享列表中刪除患者的姓名、社會安全號碼、出生日期和地址,同時保留醫學研究所需的重要信息,例如年齡、疾病、身高、體重、性別、種族等。
數據匿名化技術
數據匿名化可以通過多種方式實現,包括刪除、加密、概括等等。公司可以從收集的數據中刪除個人身份信息 (PII) ,或者使用強密碼對這些信息進行加密。企業還可以選擇對數據庫中收集的信息進行概括。例如,一個表格包含了五位零售業 CEO 的確切總收入。假設記錄的收入分別爲 52 萬美元、23 萬美元、10.9 萬美元、87.5 萬美元和 12.4 萬美元。這些信息可以概括爲“低於 50 萬美元”和“高於或等於 50 萬美元”等類別。雖然數據經過了模糊處理,但對用戶仍然有用。
數據匿名化推理
數據匿名化是指對機密信息進行脫敏和掩蔽處理,即使發生數據泄露,泄露者也無法利用這些數據。保護數據在每個組織中都應是重中之重,因爲落入不法分子手中的機密信息可能會被有意或無意地濫用。處理敏感客戶信息時缺乏敏感性可能會給企業帶來巨大損失,因爲監管機構會對嚴重疏忽行爲進行嚴厲打擊。諸如支付卡行業數據安全標準 ( PCI DSS) 等法律法規要求規定,一旦發生信用卡數據泄露,金融機構將面臨鉅額罰款。加拿大《個人信息保護和電子文件法》(PIPEDA) 規範了企業披露和使用個人信息的行爲。此外,還有許多其他監管機構負責監督組織對私人數據的使用或濫用情況。
通過一種稱爲去匿名化(或“重新識別”)的過程,可以對匿名化數據進行解碼。由於匿名化數據可以被解碼和還原,批評者認爲匿名化會給人一種虛假的安全感。