差分隱私是一個隱私安全的特征共享方法,通過僅分享數(shù)據(jù)庫中的一些統(tǒng)計特征,而不公開特定實體信息,來達到保護隱私安全的目的。 差分隱私這項匿名化技術,能夠應用在機器學習推理和共享數(shù)據(jù)用例上,包括廣告、金融、醫(yī)療保健和教育行業(yè)應用,皆會使用差分隱私進行數(shù)據(jù)分析,并免暴露個人紀錄。
谷歌在2019年發(fā)布將差分隱私技術應用在數(shù)據(jù)庫的重要研究,其目標是希望差分隱私能夠確保數(shù)據(jù)庫查詢的結果,不會泄漏數(shù)據(jù)庫中任何個體的過多信息。 這項研究的重要性在于,過去差分隱私都僅停留在科學研究階段,真正完整的差分隱私查詢引擎很少,而谷歌的這項研究則將差分隱私帶進實際應用中。
差分隱私用于實際系統(tǒng)之所以存在挑戰(zhàn),在于差分隱私系統(tǒng)常假設每個個體最多只與一條數(shù)據(jù)庫記錄相關聯(lián),但在數(shù)據(jù)庫實際應用上并非如此,谷歌提出在數(shù)據(jù)庫中進行差分隱私聚合的方法,這是一個通用且可擴展的方法,每個個體可以和任意行數(shù)的數(shù)據(jù)相關聯(lián)。
谷歌在發(fā)布差分隱私論文的同時,也開源了自家核心產品中所使用的差分隱私函式庫,包括谷歌的廣告資料中心,以及疫情社區(qū)人流趨勢報告,都使用了這個函式庫。
現(xiàn)在谷歌進一步擴展自家產品對差分隱私的支持,利用差分隱私函式庫,在BigQuery加入這項隱私保護功能,優(yōu)點除了提升數(shù)據(jù)應用隱私保護之外,也能協(xié)助企業(yè)符合法遵要求,而且因為差分隱私與其他隱私保護技術相比,更能保留數(shù)據(jù)的統(tǒng)計特性和可用性,因此企業(yè)在保護用戶隱私的同時,仍可以對資料進行分析,挖掘有價值的信息。
谷歌提到,之后他們還會在BigQuery資料無塵室中整合差分隱私,使企業(yè)能夠以更具隱私安全的方式共享敏感資料。