Project Details
Empirisch und auf menschlichen Urteilen basierende Analyse der Qualität von Internet-Seiten mit Methoden des Web-Mining
Applicant
Professor Dr. Thomas Mandl
Subject Area
Security and Dependability, Operating-, Communication- and Distributed Systems
Term
from 2003 to 2005
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 5404131
Die Bewertung von Dokumenten nach ihrer Qualität wird im Zeitalter verteilten und in großen Mengen vorliegenden Wissens zunehmend an Software delegiert. Dies gilt besonders bei der Suche nach Informationen etwa mit Internet-Suchmaschinen, bei der Qualitätsbewertungssysteme als Filter einsetzbar sind. Die starke Heterogenität der Qualität von Internet-Dokumenten lässt hier einen besonderen Mehrwert erwarten.Experimentelle Systeme behandeln verschiedene Aspekte und nutzen unterschiedliche Definitionen von Qualität. Im Einsatz befindliche Systeme nutzen zur Zeit einzelne und begrenzte Aspekte von Qualität. Insbesondere die Analyse der Verlinkungsstruktur des Internets bietet einen Ansatzpunkt für existierende Systeme.Die Komplexität des Qualitätskonzepts und der Dokumente erfordert jedoch auf mehreren Aspekten beruhende Definitionen. Das beantragte Projekt will die bisherige Forschung unter dem Qualitätsaspekt interpretieren und komplexere Qualitätsdefinitionen aus menschlichen Urteilen ableiten. Formale Eigenschaften von Internet-Seiten sollen automatisch extrahiert werden. Menschliche Qualitätsurteile unterschiedlichster Art bilden die Grundlage für Verfahren des maschinellen Lernens. So entstehen Klassifikationssysteme, welche die menschlichen Urteile so weit wie möglich simulieren. Diese sollen in prototypischen Suchund Filtersystemen integriert werden. Wichtige Herausforderungen stellen dabei das Auswerten vorliegender Qualitätsurteile und die Evaluierung der Qualitätsfilter dar.Im Rahmen des Projektes soll eine Habilitationsschrift in der Informationswissenschaft entstehen.
DFG Programme
Research Grants