Geheimhaltung statistischer Ergebnisse und Anonymisierung statistischer Einzeldaten

Modul 7











7.6 An den Ergebnissen ansetzen: Post-tabulare Verfahren

Inhalt

Post-tabulare Verfahren

Untertitel anzeigen
{ "video":"video/m07/m07-6-a", "vidw":"485", "vidh":"273" }

Damit es in den Randsummen nicht zu gravierenden Verzerrungen kommt, werden diese unabhängig von den Werten der Innenfelder gerundet. Deswegen weicht die Summe der gerundeten Innenfelder meist vom Wert des gerundeten Randfelds ab.

Dadurch kommt es leider zu einem Problem: Der durch die Rundung bewirkte primäre Geheimhaltungsschutz lässt sich in manchen Konstellationen mithilfe der theoretisch gültigen Summenbeziehungen zwischen Innen- und Randfeldern – also mithilfe der Tabellengleichungen – aufbrechen. Auch hier bestehen also sekundäre Enthüllungsrisiken. Bei kleinerer Rundungsbasis, besonders bei der 3er-Rundung, sind diese recht hoch.

Sekundäres Enthüllungsrisiko bei der 3er-Rundung:


Bei der 3er-Rundung werden zwei Tabelleninnenfelder, die jeweils den Wert 1 haben, auf 0 abgerundet. Der Wert 2 (= 1 + 1) des gerundeten Randfelds (ergibt sich aus der Summe der ungerundeten Innenfelder) wird auf 3 gerundet. Es gibt jedoch nur eine Kombination aus drei (ungerundeten) Zahlen, die bei der 3er-Rundung als 0, 0 und 3 dargestellt werden und für die die Tabellengleichung gilt: Die Originalwerte der beiden Innenfelder können höchstens 1 sein (denn sonst würden sie nicht zu 0 abgerundet). Wäre aber eines der Innenfelder 0, wäre ihre Summe höchstens 1 und der Wert im Randfeld würde auch zu 0 abgerundet. Beide Innenfelder müssen also den Wert 1 haben. Es kann eindeutig auf die Originalwerte zurückgeschlossen werden.

Zusätzliche Risiken, dass Originalwerte aufgedeckt werden, ergeben sich, wenn nicht nur der Zusammenhang einzelner Zeilen oder Spalten, sondern auch jener von zwei- oder mehrdimensionalen Tabellen berücksichtigt wird. Als alleiniges Geheimhaltungsverfahren ist diese Form der Rundung deshalb nicht zu empfehlen.


Im Hinblick auf die Genauigkeit der dargestellten Ergebnisse lassen sich auch mit anderen in der Fachliteratur diskutierten Methoden ganz ähnliche Effekte wie mit Rundung erzielen (siehe z. B. Handbuch, 2.5.1.2 und 2.5.1.3). Besonders hervorzuheben sind dabei Verfahren, bei denen zu den Ergebnissen eine Zufallszahl addiert wird. Diese stochastische Überlagerung (siehe Handbuch, 2.5.2) kann so umgesetzt werden, dass sekundäre Enthüllungsrisiken im Vergleich zur Rundung deutlich reduziert werden. Dabei ist es wichtig, durch geeignete Mechanismen beim „Ziehen“ der Zufallszahlen für ein gewisses Maß an Konsistenz zu sorgen: Logisch identische Tabellenfelder sollten – zumindest im Mittel – identisch überlagert werden.


Geeignete Ansätze hierfür (siehe Handbuch, 2.5.3) werden vom australischen Statistikamt entwickelt und genutzt. Sie müssen in den Kern der Auswertungsinstrumente integriert werden.