Detailseite
Projekt Druckansicht

Hyperbolische Stochastische Nachbarschafts-Einbettungen

Antragsteller Dr. Martin Skrodzki
Fachliche Zuordnung Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Mathematik
Förderung Förderung von 2021 bis 2023
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 455095046
 
Das Ziel des vorgeschlagenen Projekts ist die Entwicklung neuer Methoden zur Visualisierung hochdimensionaler Daten. Solche Daten werden durch Vektoren in einem hochdimensionalen Raum repräsentiert. Sie finden Anwendung in einer Vielzahl von verschiedenen Bereichen, zum Beispiel in Untersuchungen von Zellpopulationen, medizinischen Bilddaten oder globalen Klimamustern. Darstellungen dieser Daten machen sie Menschen visuell zugänglich und unterstützen somit deren Analyse.Der Algorithmus t-distributed Stochastic Neighbor Embedding (t-SNE) konstruiert Einbettungen der Daten in zwei- oder dreidimensionale Räume so, dass die Struktur der Daten erhalten bleibt. Durch die visuelle Analyse der Einbettung können Experten Einblicke in die Struktur des Datensatzes gewinnen. Dieser Ansatz hat sich in verschiedenen Anwendungen bewährt, so wurden beispielsweise seltene Zellpopulationen im Immunsystem identifiziert.In dem vorgeschlagenen Projekt werden wir den t-SNE-Ansatz in drei Arbeitspaketen weiterentwickeln. Das erste Paket betrifft die Skalierbarkeit des Algorithmus für große Datensätze. Dies ist wichtig, da die Datensätze, mit denen Experten arbeiten, ständig wachsen. Wir planen, einen hierarchischen Optimierungsansatz für t-SNE zu entwickeln, von dem wir erwarten, dass er große Datensätze effizienter verarbeiten kann als die derzeit verwendeten Algorithmen.Das zweite Arbeitspaket befasst sich mit der Geometrie des Einbettungsraums. Anstelle der üblichen euklidischen Geometrie werden wir Einbettungen in den hyperbolischen Raum untersuchen. Hyperbolische und euklidische Geometrie unterscheiden sich grundlegend, z.B. wächst die in einem Kreis enthaltene Fläche in der hyperbolischen Ebene exponentiell mit dem Kreisradius, während sie in der euklidischen Ebene nur polynomiell wächst. Analysen haben ergeben, dass viele Netzwerke der realen Welt, wie das Internet oder große soziale Netzwerke, eine hyperbolische Struktur haben. Neue Ergebnisse des multidimensional Scaling zeigen, dass auch hochdimensionale Daten eine solche Struktur besitzen. Daher werden wir einen neuen t-SNE Algorithmus entwickeln, der in den hyperbolischen Raum eingebettet. Die Herausforderungen liegen in der Modellierung des Optimierungsproblems für hyperbolisches t-SNE und im Design eines Algorithmus zur effizienten Berechnung der Einbettungen.Im dritten Arbeitspaket werden wir Techniken für die Interaktion mit dem hyperbolischen t-SNE erstellen. Das Ziel ist ein Focus+Context-Ansatz, der es Benutzenden erlaubt, durch eine aktuelle Teilmenge der Daten zu untersuchen (Fokus), während die umgebenden Daten (Kontext) in der gleichen Visualisierung verfügbar sind.Ein gemeinsames Ziel für alle drei Arbeitspakete ist es, die Ergebnisse, Algorithmen und Verbesserungen in die Software Cytosplore zu integrieren. Dies wird es uns ermöglichen, Rückmeldungen von Experten zu erhalten, die die Software derzeit verwenden. Dieses Feedback wird direkt in unsere Forschung einfließen.
DFG-Verfahren WBP Stipendium
Internationaler Bezug Niederlande
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung