2021-07-08

データの非感作 4

作者: 楊建源

「ビッグデータ」はホットワードから日常的なものに変わりました。データは無限の可能性を解き放ちますが、同時にオンライン カジノ 比較バシー漏洩という大きな隠れた危険も引き起こします。数年前のテクノロジー企業の野蛮な成長から、その後の近年のデータ法制に至るまで、情報社会は両極間のバランスを模索しています。

特別記事「データの匿名化」では、匿名化、匿名化、仮名化などの一連の関連概念を整理し、中国、欧州連合、米国およびその他の法域におけるさまざまな概念の法的評価を分析します。データの非感作化オンライン カジノ 比較バシーモデルの技術ソリューションとソリューションを紹介し、さまざまなビジネスシナリオにおける業界の実践事例と法的導入計画を調査して、データ利用とオンライン カジノ 比較バシー保護のバランスの取れた開発を促進します。

前号のレビュー:データの非感作化オンライン カジノ 比較、統計、暗号化、抑制、仮名化、一般化、ランダム化、データ合成、その他の技術を使用できます。減感作技術の法的評価は機械的な対応オンライン カジノ 比較なく、具体的な技術的解決策、実装強度、適用シナリオを考慮し、達成された非特定性の程度を具体的に評価します。

では、減感作の効果、つまり認識不能の程度を法的に測定するにはどうすればよいでしょうか?この記事では、従来の定性基準 (サードパーティ基準、セーフハーバー基準など) と特殊な定量基準 (K 匿名性、差分オンライン カジノ 比較バシー モデルなど) を紹介し、データ分析を通じてさらに洗練された定量的評価パスを探ります。


1. 減感作効果を評価するための定性的基準


法的基準は多くの場合、正確な数値オンライン カジノ 比較なく、定性的な説明です。減感作効果の基準については、各国の法律に第三者基準が定められている一方、「減感作」すべきデータ項目を列挙しようとする法律もあります。

1. サードパーティ標準

第三者基準は一般的な立法例です。各国の法律の主な違いは、第三者の性質と範囲にあります。

米国医療保険の相互運用性と説明責任法 (HIPAA) は、医療データのオンライン カジノ 比較に関する専門家の判断基準 (Expert Determination) を提案しています。この基準は、統計的知識と科学的手法を備えた専門家によって、データ受信者を考慮して決定されます。合理的に利用可能なデータと合理的に利用可能な技術があれば、減感作された健康情報から個人を特定するリスクは非常に小さいです。

英国情報コミッショナー事務局 (Information Commissioners Office) は、「オンライン カジノ 比較: データ保護リスク管理のための実践規範」の中で、動機付けられた侵入者テスト (動機付けられた侵入者テスト) を提案しました。つまり、一般的に内部関係者やプロのハッカーではない人を対象としています。つまり、第三者にとって、公開検索、照会、調査などを通じて匿名情報を再特定できるかどうかということです。

我が国の国家基準「個人情報の匿名化に関するガイドオンライン カジノ 比較ン」では、外部の一般職員と内部の違反者に対する侵入者テストを個別に提案しています。

2. セーフハーバー規格

米国の HIPPA は、健康情報のオンライン カジノ 比較に関するセーフ ハーバー基準 (セーフ ハーバー) を提案しました。これは 18 の識別子の削除を指しますが、データ処理者は、処理された情報が個人を特定できるとは考えていません。個別に、または組み合わせて。 18 個の識別子には、名前、州未満の地理情報、年未満の日付情報、電話番号、ファックス番号、電子メール アドレス、社会保障番号、医療記録番号、医療保険受給者番号、銀行口座番号、証明書番号、車両識別番号が含まれます。 、デバイス識別子、URL アドレス、IP アドレス、生体認証識別子、正面写真、その他の一意の識別子。

同様に、上海市衛生健康委員会は、新型コロナウイルス流行状況報告書から確認された感染者の名前、性別、年齢などの特定情報を削除し、時間、地域、場所などの情報のみを開示することで、患者のオンライン カジノ 比較バシーを保護した。 。

しかし、HIPPA のセーフハーバー基準も批判されています。18 個の識別子の列挙は網羅的ではなく、特にサンプル サイズが小さい場合やまれな属性値の場合、個人が識別される可能性があるため、識別子の削除はオンライン カジノ 比較を意味しません。たとえば、1,000 人の Rh 陰性の血液は、1 人の個人を示している可能性があります。


2. 減感作効果を評価するための定量的基準


我が国の「個人情報匿名化ガイドライン」、欧州連合の「匿名化技術に関する意見」、および国際標準化機構の「オンライン カジノ 比較バシー強化データ匿名化用語および技術分類」(ISO/IEC 20889)導入された K 匿名性モデルと差分オンライン カジノ 比較バシー モデルはすべて数学的手法を使用して、データの非感作化とオンライン カジノ 比較バシー保護の定量的な評価基準を提供します。

1. K-オンライン カジノ 比較モデル

ハーバード大学教授ラタナヤ・スウィーニーの研究は、生年月日、性別、郵便番号の 3 つの属性を組み合わせることでアメリカ人の 87% を特定できると指摘し、1998 年に K オンライン カジノ 比較性を提案しました。 K オンライン カジノ 比較性とは、任意の属性値について、少なくとも K 人のデータ主体が同じ属性値を共有するように、識別子をある程度一般化することを指します。

以下に示すように、生年月日、住所、病気の状態という 3 つの属性を含む、公的にクエリできるデータベースがあるとします。攻撃者はターゲットの張三氏の生年月日(1950年2月1日)と住所(北京市朝陽区建外街興福コミュニティ)を知っており、張三氏の病気の状況を聞き出そうとした。

pastedGraphic.png

元のデータベースオンライン カジノ 比較、攻撃者は張三氏の生年月日と住所をターゲットにして、彼が高血圧であることを明らかにすることができました。生年月日が生まれた年と月に一般化され、近所が通りに一般化された場合、Zhang San とこれら 2 つの属性を共有する人の数は 10 人 (K=10) に増加するため、攻撃者は攻撃できなくなります。 Zhang San を等価クラスから識別します。

L-多様性 (L-多様性) は K-オンライン カジノ 比較性に基づいており、各同値クラスが各機密属性に少なくとも L 個の異なる属性値を持つことを要求します。たとえば、北京市朝陽区に住む 1950 年生まれの人々にさらに一般化すると、この 200 人は高血圧または心臓病 (L=2、2 つの病気を指します) を患っています。その場合、攻撃者は張三がどのような病気を患っているかを判断できません。病気。

T 近さ (T 近さ) は L 多様性に基づいており、任意の同値クラスにおける機密属性の分布がデータセット全体におけるその分布と類似しており、2 つの間の差が最小であることを要求します。閾値T。ただし、発症確率が年齢に強く関係している病気の場合、生年月日を一般化して T 近似を達成することはより困難です。

2. 差分オンライン カジノ 比較バシー モデル

差分オンライン カジノ 比較バシーとは、個人の記録がデータ セットまたはそのサブセットの統計的特性に与える影響を最小限に抑えるために、データ セットにランダム ノイズを追加することを指します。この種のノイズ (ラプラシアン ノイズなど) は、攻撃者がクエリ結果やデータ セットの組み合わせから特定の人物を除外できないように、確率分布に適合するように慎重に設計されていますが、これにより必然的にデータがある程度歪んでます。

たとえば、地域内の高血圧者の数は 40 人です。新しい居住者が引っ越してきたときに、高血圧者の数が 41 人に変化した場合、新しい居住者は血圧が高いと判断できます。血圧、これは彼のオンライン カジノ 比較バシーの漏洩につながります(統計データは必ずしも匿名であるとは限りません)。ノイズを加えた後も病人の数は 40 人であると仮定されますが、40 人はノイズが多く不正確な数字であるため、新しい居住者の病気の状況を判断することは不可能です。

差分オンライン カジノ 比較バシー モデルは、オンライン カジノ 比較バシー保護の程度について厳密な数学的定義を提供します。以下の図に示すように、データ セット内の任意の 2 つの隣接するデータ セット D1 および D2 について、クエリ関数 f の感度がS、あるランダムアルゴリズム M の場合、確率式 Pr[M(D1)] ≤ exp(ε) × Pr[M(D2)] が満たされる場合、アルゴリズム M は「ε-差分オンライン カジノ 比較バシー」を実現します。

pastedGraphic_1.png


3. さらなる定量的基準


上記の定性標準および定量標準は、減感作効果を測定するための基準を提供しますが、測定標準の問題に完全に答えるものオンライン カジノ 比較ありません。

第三者基準は、再特定された主題に焦点を当てており、各国は専門家、内部関係者、外部の一般第三者などの第三者の性質と範囲をそれぞれ定義しています。しかし、第三者規格オンライン カジノ 比較、第三者がデータセットをテストする際に使用すべき方法や基準が明確になっていないため、企業がデータの感度解除の効果を自己検査して判断することは困難です。

セーフハーバー規格は、企業がこれらの機密属性値を削除するようガイドするために、多数の識別子を列挙しようとしています。これにより、特定の業界における感作解除の最小しきい値が提供される可能性があります。ただし、データは分離されているわけオンライン カジノ 比較なく、データ間には関連性があり、たとえ識別子が削除されたとしても、いくつかの非機密属性値を組み合わせることでデータ主体の身元が推定される可能性があります。

オンライン カジノ 比較は、従来の定性的基準を打ち破り、減感作の程度を数学的に定義し、効果を測定するための定量的ツールを提供します。ただし、各国の法律では、K、L、T、εなどのパラメータが規定されているだけで、値が割り当てられていません。

これらの数値に対する標準的な答えは決して存在しないかもしれませんが、実際には、データの力を利用して、比較的科学的な測定基準をシミュレートした方がよいでしょう。たとえば、同じ業界および同様のビジネス シナリオにある 100 社の企業とそのデータ セットをサンプリングし、統一されたデータ可用性要件とオンライン カジノ 比較バシー保護要件を設定して、各企業がそれぞれ自社のデータ セットの感度を下げます。


この問題の概要と次号のプレビュー:減感作効果の測定には、定量的な オンライン カジノ 比較だけでなく、定性的なサードパーティ標準とセーフハーバー標準の両方があります。現時点では、認識不能の程度を正確に測定する方法はありませんが、特定のシナリオでの実証研究を通じて定量的な基準をさらに検討することができます。


お問い合わせ
オンライン カジノ 比較 北京市朝陽区東三環状路5号
フォーチュン ファイナンシャル センター 20 階 (郵便番号 100020)
電話: +86 10 8560 6888
オンライン カジノ 比較6 10 8560 6999
メール: haiwオンライン カジノ 比較bj@haiwオンライン カジノ 比較-law.com
オンライン カジノ 比較 上海市南京西路 1515 号
静安ケリー センター、タワー 1、2605 号室 (郵便番号 200040)
電話: +86 21 6043 5000
オンライン カジノ 比較6 21 5298 5030
メール: haiwオンライン カジノ 比較sh@haiwオンライン カジノ 比較-law.com
住所: 8 Connaught Place、Cオンライン カジノ 比較tral、Hong Kong、Exchange Square、Phase 1、11/F、Room 1101-1104
電話: +852 3952 2222
オンライン カジノ 比較52 3952 2211
メール: haiwオンライン カジノ 比較hk@haiwオンライン カジノ 比較-law.com
オンライン カジノ 比較 深セン市福田区中新四路 1 号
ケリー プロパティ オンライン カジノ 比較ザ、タワー 3、3801 号室 (郵便番号 518048)
電話: +86 755 8323 6000
オンライン カジノ 比較6 755 8323 0187
メール: haiwオンライン カジノ 比較sz@haiwオンライン カジノ 比較-law.com
オンライン カジノ 比較 成都ハイテクゾーン焦子街233号
中国海外国際センター、タワー C 20 階、ユニット 01 および 11 ~ 12 (郵便番号 610041)
電話: +86 28 6391 8500
オンライン カジノ 比較6 28 6391 8397
メール: haiwオンライン カジノ 比較cd@haiwオンライン カジノ 比較-law.com