Detailseite
Projekt Druckansicht

Datenschutz in Graph Generierung

Fachliche Zuordnung Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung Förderung seit 2025
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 550302673
 
Viele Forschungsrichtungen, beispielsweise die Untersuchung und Vorhersage der Ausbreitung von Infektionskrankheiten, hängen entscheidend von der Verfügbarkeit von echten Graphen ab. Jedoch können solche Graphen sensible Informationen wie Gesundheitsinformationen enthalten. Wenn man beispielsweise ein soziales Netzwerk betrachtet, das die Ausbreitung einer Krankheit charakterisiert, weiß man, welche Knoten die Krankheit übertragen haben. Es hat sich gezeigt, dass selbst wenn die Knoten nicht explizit realen Identitäten zugeordnet sind, diese Identitäten oft abgeleitet werden können. Frühere Forschungen zur Veröffentlichung von Graphen unter Wahrung der Privatsphäre konzentrieren sich fast ausschließlich auf die Veröffentlichung realer Graphen und lassen die Möglichkeit der Verwendung synthetischer Diagramme außer Acht, obwohl seit einigen Jahren graphgenerativen Modelle verfügbar sind. Oberflächlich betrachtet sieht es so aus, als ob die Verwendung synthetischer Graphen Datenschutzprobleme überwinden würde, aber Arbeiten an anderen synthetischen Daten wie Tabellen zeigen, dass generative Modelle immer noch vertrauliche Informationen über die Trainingsdaten enthalten, es sei denn, der Trainingsprozess trifft angemessene Datenschutzmaßnahmen. Das Fehlen jeglicher Berücksichtigung von Datenschutzaspekten bei graphgenerativen Modellen ist eine schwerwiegende Lücke der aktuellen Forschung auf diesem Gebiet. Darüber hinaus sind die bestehenden graphgenerativen Modelle nur begrenzt in der Lage, sowohl die Graphenstruktur als auch die Knoten-/Kantenattribute gleichzeitig zu erfassen, und außerdem fehlt ihnen die Verallgemeinerung auf großräumige und zeitliche Graphen. Um sicherzustellen, dass graphgenerative Modelle eine äußerst nützliche und datenschutzfreundliche Alternative zur Veröffentlichung realer Graphen darstellen, sind umfangreiche Forschungsarbeiten erforderlich. In diesem Antrag wollen wir zwei grundlegende Forschungsfragen beantworten: i) Wie können wir die Datenschutzrisiken synthetischer Graphen quantifizieren und verteidigen? und ii) wie können wir synthetische Graphen erstellen, die einen optimalen Kompromiss zwischen Datenschutz und Nutzen erzielen? Wir entwerfen sechs Arbeitspakete, von denen drei sich mit der Modellierung von Datenschutz, Datenschutzangriffen und der Verteidigung synthetischer Graphen befassen und die anderen drei sich auf die Erweiterung der generativen Modelle aus bedingte und zeitliche Graphen konzentrieren, die auch verteilt trainiert werden können. Unsere Ergebnisse werden das Bewusstsein für die Bedeutung des Datenschutzes in graphgenerierenden Modellen schärfen und Methoden und Werkzeuge zur sicheren Veröffentlichung von Graphen bereitstellen. Konkret werden wir Algorithmen entwickeln, die die Beziehungen zwischen Knoten- und Kantenattributen bei der Graphen-Generierung besser erfassen und gleichzeitig Anforderungen des Datenschutzes genügen.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Schweiz
Kooperationspartnerin Professorin Lydia Y. Chen, Ph.D.
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung