Project Details
Projekt Print View

Weiterentwicklung nicht-parametrischer Imputationsverfahren zur Erstellung anonymisierter synthetischer Datensätze

Subject Area Statistics and Econometrics
Term Funded in 2010
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 171106931
 
Die Nachfrage nach direktem Zugang zu Mikrodaten ist den letzten Jahren deutlich gestiegen. Allerdings ist eine Herausgabe der Daten nur möglich, wenn sichergestellt ist, dass durch die Bereitstellung der Datenschutz nicht verletzt wird. Ein innovativer Ansatz um dies zu gewährleisten, ist die Erzeugung synthetischer Datensätze. Bei diesem Verfahren werden die Originalwerte durch künstliche Werte ersetzt, wobei versucht wird, die gemeinsame Verteilung der im Datensatz enthaltenen Variablen zu erhalten. Allerdings ist die Erstellung dieser Datensätze sehr zeitaufwendig und komplex, so dass viele Institutionen nicht die Kapazitäten bereitstellen können, um diesen Ansatz für ihre eigenen Datensätze einzusetzen. Nicht-parametrische Verfahren, die eine weitgehend automatisierte Erzeugung synthetischer Datensätze ermöglichen, könnten diesen Aufwand deutlich reduzieren. Erste Ideen dazu wurden bereits in den Arbeiten von Reiter (2005d) dargelegt. Ziel des Forschungsvorhabens ist es, andere nicht-parametrische Prognoseverfahren so weiter zu entwickeln, dass sie sich zur Erstellung synthetischer Datensätze eignen und die Möglichkeiten einer automatisierten Anonymisierung anhand eines komplexen Datensatzes zu testen.
DFG Programme Research Fellowships
International Connection USA
 
 

Additional Information

Textvergrößerung und Kontrastanpassung