Detailseite
Semantische Clusteranalyse im Information Retrieval
Antragsteller
Professor Dr. Norbert Fuhr; Professor Dr. Benno Stein
Fachliche Zuordnung
Sicherheit und Verlässlichkeit, Betriebs-, Kommunikations- und verteilte Systeme
Förderung
Förderung von 2009 bis 2016
Projektkennung
Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 91548218
Der Fortsetzungsantrag behandelt, wie der Erstantrag, Forschungsfragen der Clusteranalyse im Information Retrieval (IR). Ausgangspunkt des Erstantrags ist die Beobachtung, dass das Optimierungs- und Anpassungspotenzial der Clusteranalyse im IR wenig erforscht ist und für relevante Retrievalprobleme oft nicht ausgeschöpft wird. Um diese Lücke zu schließen, wurden im Rahmen des Erstantrags unter dem Stichwort "semantische Clusteranalyse" u.a. theoretische Grundlagen einer Clusteranalyse im IR geschaffen (Vorbild: das probabilistisches Retrievalmodell), spezialisierte Retrievalmodelle erforscht (Basis: Modelle für Indexing und Repräsentation), neue Strategien und Algorithmen für Web-Anwendungen entwickelt sowie entsprechende Nutzerstudien durchgeführt. Während der Erstantrag durch Retrievalmodelle, Domänenwissen und der kombinierten Anwendung von Fusionierungsprinzipien den Schwerpunkt auf die Einbringung von Semantik in den Clusteringprozess legt, fokussiert der Fortsetzungsantrag darauf, möglichst viel Semantik aus einem durchgeführten Clusteringprozess heraus zu bekommen. Neben der Weiterentwicklung theoretischer Grundlagen behandelt der Fortsetzungsantrag insbesondere die Schnittstelle zwischen Clusteringergebnissen und dem Nutzer (Stichwort: "Menschlicher Zugang"). Ziel ist es, Clusteranalyseprozesse im Information Retrieval für Nutzer verständlicher und leichter interpretierbar zu machen. Auf Seiten der Theorie stehen das Soft- und das Online-Clustering im Mittelpunkt; auf Seiten der Semantik und Clusterinterpretation wurde unter Berücksichtigung aktueller Erkenntnisse ein Arbeitsprogramm mit Forschungsfragen u.a. zum Faceted Clustering, zum semi-supervised Clustering und zur Bewertung von Clusteringergebnissen entwickelt.
DFG-Verfahren
Sachbeihilfen