Paralleles Data-Mining

Applicant Professor Dr.-Ing. Peter C. Lockemann
Subject Area Security and Dependability, Operating-, Communication- and Distributed Systems
Term from 1997 to 2002
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 5463915
 

Project Description

..Der Schwerpunkt der nächsten Förderperiode verbleibt bei der Parallelisierung der Vorverarbeitung. Von den klassischen Ansätzen übernehmen wir das Datenflußprinzip, das in*Richtung einer stärkeren Nutzung von Pipelining verbunden mit einer Einbettung effizienzsteigernder Materialisierungsstrategien weiterentwickelt werden soll. Als Grundlage hierfür ist das Informationsmodell aus Abschnitt 2.4.1 zu integrieren. Die bereits genannten Forderungen nach der Erzielung eines hohen Maßes an Pipelining und der Integration von Pipelining und paralleler Materialisierung stellen die besonderen Herausforderungen dar. Erst in einem zweiten Schritt werden wir uns den Lernverfahren zuwenden und auf Basis der gewonnenen Erkenntnisse eine geignete teilmenge auswählen und in das System integrieren. Dabei wollen wir die ParaStation-Plattform nutzen, um gerade die Verfahren zu unterstützen, die sich bisher aufgrund der Beschränkungen gängiger Rechnerverbindungen einer effizienten Parallelisierung verschlossen. Aus datenbanktechnischer Sicht ergibt sich weiteres Optimierungspotential durch die Möglichkeit, Vorverarbeitung und Lernverfahren in einem gemeinsamen Operatorgraphen als ganzes zu optimieren, sowie duch die Ausdehnung der Materialisierungstechnik auf die Operatoren der Lernalgorithmen.
DFG Programme Research Units
Subproject of FOR 270:  Vernetzte Arbeitsstationen und Personalcomputer als Plattform für Hochleistungsrechnen und Hochleistungsdatenbanken