Project Details
Effiziente und effektive Data-Mining Lösungen für hochdimensionale Daten
Applicant
Professor Dr. Hans-Peter Kriegel
Subject Area
Security and Dependability, Operating-, Communication- and Distributed Systems
Term
from 2005 to 2010
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 14823303
Die fortschreitende Automatisierung und Vernetzung der modernen Informationsgesellschaft führt zu einem drastischen Anstieg sowohl des Volumens als auch der Komplexität der erfassten Daten. Bei der semiautomatischen Analyse mittels Data Mining Verfahren, insbesondere im Bereich Cluster-Analyse, ergibt sich hieraus das folgende, aus Praxissicht sehr wichtige Problemfeld: Es werden immer mehr Merkmale automatisch erfasst, von denen aber viele für die jeweils betrachtete Data Mining Aufgabe irrelevant, weil etwa verrauscht oder redundant sind. Methoden zur globalen Merkmalsreduktion oder -extraktion führen in der Regel nur sehr eingeschränkt zum Ziel, da in Realdaten typischerweise verschiedene Merkmalsmengen für unterschiedliche Objektgruppen relevant sein können. Deshalb sollen Verfahren zum subspace- und Correlation Clustering entwickelt und untersucht werden, die hochdimensionale Merkmalsräume flexibel und individuell (pro Cluster) auf niedrige Dimensionen skalieren. Das Hauptziel dieses Antrages ist also, innovative Data Mining Verfahren für hochdimensionale Merkmalsräume zu entwickeln.
DFG Programme
Research Grants
Participating Person
Professor Dr. Christian Böhm