「ビッグデータ」はホットワードから日常的なものに変わりました,データが無限の可能性を解放している間,オンライン カジノ 比較バシー漏洩という隠れた大きな危険も引き起こしました。数年前のテクノロジー企業の野蛮な成長以来,近年、データに関する法規制が相次いでいます,情報社会は両極間のバランスを模索している。データの感度を下げることにより、データと被験者の間の相関関係を低減できる可能性が得られます,高度なオンライン カジノ 比較バシー保護と大きなデータ利用価値を同時に維持できる。
「データの匿名化」特別記事は分類され、匿名化されます、匿名化、仮名化と一連の関連概念,中国の分析、EU、米国およびその他の管轄区域におけるさまざまな概念の法的評価,データの匿名化の技術ソリューションとオンライン カジノ 比較バシー モデルの紹介,さまざまなビジネス シナリオにおける業界の実践事例と法的導入計画について話し合う,データ利用とオンライン カジノ 比較バシー保護のバランスの取れた発展を促進するため。
前号のレビュー:オンライン カジノ 比較には統計を使用できます、パスワード、抑制、仮名化、一般化、ランダム化、データ合成とその他のテクノロジー。減感作技術の法的評価は機械的な対応ではない,代わりに、特定の技術的ソリューションを検討してください、実装の強度と適用シナリオ,実装の認識不能度を具体的に評価する。
それでは,減感作の効果を合法的に測定する方法,つまり、認識不能の程度?この記事では、従来の定性基準 (サードパーティ基準など) を紹介します。、セーフハーバー基準) および特殊な定量的基準 (K-Anonymous など)、差分オンライン カジノ 比較バシー モデル),データ分析を通じてさらに洗練された定量的評価パスを探索します。
1. オンライン カジノ 比較性的基準
法的基準は正確な数字オンライン カジノ 比較ないことがよくあります,ただし定性的な説明。減感作効果の基準について,どの国の法律にも第三者の基準があります,同時に,「削除」すべきデータ項目を列挙しようとする法律もあります。
1. オンライン カジノ 比較
サードパーティの標準はオンライン カジノ 比較的な立法例です,国内法の主な違いは、第三者の性質と範囲にあります。
米国医療保険の相互運用性と説明責任法 (HIPAA) は、医療データのオンライン カジノ 比較に関する専門家決定基準を提案しています,つまり、統計的知識と科学的手法を備えた専門家によって測定される,データ受信者が合理的に利用できるデータと合理的に利用できるテクノロジーを考慮する,減感された健康情報から個人を特定するリスクは非常に小さい。
英国情報コミッショナー局が「オンライン カジノ 比較: データ保護リスク管理のための実践規範」で提案した動機付けられた侵入者テスト,つまり、内部関係者やプロのハッカーではない一般の第三者が対象,一般公開で検索、尋ねる、調査およびその他の方法,匿名情報を再特定できるか。
我が国の国家基準「個人情報の匿名化に関するガイドオンライン カジノ 比較ン」では、外部の一般職員と内部の違反者に対する侵入者テストを個別に提案しています。
2. オンライン カジノ 比較
米国 HIPPA が健康情報のオンライン カジノ 比較のためのセーフハーバー基準を提案,18 個の識別子の削除を指します,データ処理者は、処理された情報が個人を個別にまたは組み合わせて特定できるとは考えていません。これらの 18 個の識別子には名前が含まれています、州より小さい地理情報、年未満の日付情報、電話番号、ファックス番号、メールアドレス、社会保障番号、医療記録番号、健康保険の受取人番号、銀行口座番号、証明書番号、車両識別番号、デバイス識別子、URL アドレス、IP アドレス、生体認証識別子、正面写真、その他の一意の識別子。
それに似ています,上海市衛生健康委員会は、新型コロナウイルス流行調査報告書から確認された感染者の名前を削除、性別、年齢などの識別子,公開時間のみ、地域と会場の情報,こうして患者のオンライン カジノ 比較バシーを保護。
しかし,HIPPA のセーフハーバー基準も批判されています – 18 個の識別子の列挙は網羅的ではありません,そして、識別子の削除はオンライン カジノ 比較を意味するものではありません,特にサンプルサイズが小さいか、またはまれな属性値の場合,依然として個人が特定される可能性があります。たとえば,1,000 人の血液が Rh 陰性である場合、その血液は 1 人の人物である可能性が高い。
2. オンライン カジノ 比較量的基準
私の国の「個人情報の匿名化に関するガイドライン」、EU の「匿名化技術に関する意見」、国際標準化機構の「オンライン カジノ 比較バシー強化データ匿名化用語および技術分類」(ISO/IEC 20889) はすべて K-匿名性モデルを導入しています、差分オンライン カジノ 比較バシー モデル,数学的手法を使用して、データの感度解除とオンライン カジノ 比較バシー保護の定量的な評価基準を提供する。
1. K-オンライン カジノ 比較モデル
ハーバード大学教授ラタナヤ・スウィーニーが研究で指摘,合計の生年月日、性別、郵便番号のこれら 3 つの属性でアメリカ人の 87% を識別できます,それで彼女は 1998 年に K-anonymous を提案しました。オンライン カジノ 比較 (オンライン カジノ 比較) の意味,識別子をある程度まで一般化する,任意の属性値に対してこのように,少なくとも K 個のデータ主体が同じ属性値を共有。
以下に示すように,公的にクエリ可能なデータベースがあると仮定します,生年月日を含む、オンライン カジノ 比較、病気の状態の 3 つの属性。攻撃者はターゲットの張三の生年月日を知っている (1950 年 2 月 1 日)、オンライン カジノ 比較 (北京市朝陽区建外街興福コミュニティ),そしてチャン・サンの病気のステータスを調べようとしている。
元のデータベース内,攻撃者は生年月日と住所を通じて張三を狙うことができる,それにより彼が高血圧であることが明らかになりました。生年月日を生まれた年と月に一般化した場合、コミュニティを街頭に一般化する,張三とこれら 2 つの属性を共有する人の数は 10 人に増加します (K=10),したがって、攻撃者は等価クラスから Zhang San を特定できません。しかし,攻撃対象となるセンシティブな属性(病状)の属性値の差が小さい場合,オンライン カジノ 比較の効果は限定的。たとえば,建外街に住んでいます、1950 年 2 月生まれの 10 人は全員高血圧,攻撃者は、張三も高血圧を患っていると判断できる。
オンライン カジノ 比較に基づく L-ダイバーシティ (L-ダイバーシティ),各等価クラスには、各機密属性に少なくとも L 個の異なる属性値が必要。たとえば,北京市朝陽区に住む人々にさらに一般化すると、1950 年生まれの人,これらの 200 人は高血圧または心臓病に苦しんでいます (L=2,2 つの病気について),襲撃者は張三がどの病気にかかっているか特定できていない。しかし,機密属性値が不均一に分布している場合,では、L-多様性の効果は限定的である。たとえば,200 人に 10 人の心臓病がある,190 高血圧,攻撃者は張三も高血圧であると推測できます。
L 多様性に基づく T 近さ (T 近さ),等価クラス内の機密属性の分布がデータセット全体の分布と類似していることを要求します,2 つの差はしきい値 T 未満です。ただし、発症確率が年齢に強く関係する病気の場合,生年月日を一般化して T 近似を達成するのは困難。たとえば,高齢者は高血圧になる可能性が高い,張三と同等のクラスに属します,データセット全体の平均よりもはるかに多くの高血圧患者がいる可能性がオンライン カジノ 比較。
2. 差分オンライン カジノ 比較バシー モデル
差分オンライン カジノ 比較バシーとは,データセットにランダムノイズを追加することにより,データセットまたはそのサブセットの統計的特性に最小限の影響を与える個人の記録を作成する。この種のノイズ (ラプラシアン ノイズなど) は慎重に設計されています、確率分布に従う,攻撃者がクエリ結果とデータセットの組み合わせから特定の人物を除外できないようにするため,しかし、これによりある程度のデータの歪みが避けられません。
たとえば,地域内の高血圧患者の数は 40 人,新しい住人が引っ越してきたとき,病気の人の数が 41 人になった場合,新しい入居者は高血圧であると判断できます,オンライン カジノ 比較バシーが漏洩する原因となる(統計データは必ずしも匿名であるとは限りません)。ノイズ追加後,病気の人の数はまだ 40 人だと仮定します,でも40はうるさいです、正確な数字ではありません,したがって、新しい居住者の病気の状態を判断することは不可能。
差分オンライン カジノ 比較バシー モデルは、オンライン カジノ 比較バシー保護の程度について厳密な数学的定義を提供します。以下に示すように,指定されたオンライン カジノ 比較バシー予算 ε に基づきます (許容できるオンライン カジノ 比較バシー リスクを指します),データ セット内の任意の 2 つの隣接するデータ セット D1 について、D2,クエリ関数 f の感度が S の場合,あるランダムアルゴリズム M が確率式 Pr[M(D1)] ≤ exp(ε) × Pr[M(D2)] を満たす場合,アルゴリズム M は「ε-差分オンライン カジノ 比較バシー」を実現します。
3. さらなるオンライン カジノ 比較
上記の定性基準と定量基準は、オンライン カジノ 比較を測定するための基準を提供します,しかし,測定基準に関する質問に完全に答えられるものはありません。
サードパーティ標準は再識別の主題に重点を置いています,各国は第三者の性質と範囲を定義しています,専門家のように、内部関係者、一般的な外部サードパーティ。しかし,サードパーティ標準では、データセットをテストする際にサードパーティが使用すべき方法と標準が明確になっていません,したがって,企業がオンライン カジノ 比較の有効性を自己検査して判断するのは困難。
セーフハーバー標準では、多数のオンライン カジノ 比較を列挙しようとしています,これらの機密属性値を削除するように企業をガイド,これは、特定の業界内での感度低下の最小しきい値を提供する可能性があります。しかし,データは分離されていない,データ間には関係があります,オンライン カジノ 比較を削除しても,いくつかの非機密属性値の組み合わせ,データ主体の身元を導き出すことも可能かもしれない。
K-匿名性モデルと差分プライバシー モデルは従来の定性基準を打ち破る,脱感作の程度は数学的に定義されます,効果を測定するための定量的なツールを提供します。しかし,各国の法律では K のみが指定されています、L、T、ε およびその他のパラメータ,しかし、値は割り当てられていません。K>10 は匿名化を意味します?K>10000 はオンライン カジノ 比較を意味します?データの感度を下げるための明確な定量的基準は本当にあるのか?
これらの数字には標準的な答えがないかもしれません,しかし実際には、データの力を利用したほうがよいかもしれません,比較的科学的な測定標準をシミュレートする。たとえば,同じ業界、同様のビジネス シナリオで 100 社とそのデータセットをサンプリング,統合されたデータ可用性要件とオンライン カジノ 比較バシー保護要件を設定します,その後、各企業はデータ セットを個別に感度解除します。感度を下げたデータセットの場合,K-匿名性または差分オンライン カジノ 比較バシー モデルによって検証済み,各データセットの K/L/T/ε 値を計算する,これら 100 組の値を整理して分析します,したがって、現在の実務で許容される K/L/T/ε 標準を大まかに計算できます。
オンライン カジノ 比較問題の概要と次号のプレビュー:減感作効果の測定,既存の定性的なサードパーティ標準、セーフハーバー標準,定量的な K 匿名モデルもあります、差分オンライン カジノ 比較バシー モデル。現在,認識不可能性を正確に測る尺度はありません,しかし、特定のシナリオでの実証研究を通じてそれを行うことができます,定量的基準をさらに検討中。それでは,認識不能の度合いは緩やかなので,データの非感作化の法的効果も段階的ですか?次の記事では、現行法に基づく仮名化を分析します、匿名化、匿名化の法的地位。
オンライン カジノ 比較 ICP No. 05019364-1