Detailseite
Projekt Druckansicht

Methoden und Werkzeuge zur Verbesserung des Zugriffs auf mathematisches Wissen in Digitalen Bibliotheken für Such-, Empfehlungs- und Assistenzsysteme

Fachliche Zuordnung Datenmanagement, datenintensive Systeme, Informatik-Methoden in der Wirtschaftsinformatik
Förderung Förderung von 2017 bis 2022
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 350192710
 
Ziel unseres Vorhabens ist die Erforschung von grundlegenden Methoden und Werkzeugen, die es ermöglichen, die in mathematischen Formeln und Konzepten kodierten Informationen für diverse Anwendungsgebiete zu erschließen und zu nutzen. In der Natürlichen Sprachverarbeitung (NLP) haben sich bereits seit längerer Zeit Methoden und Werkzeuge etabliert, die auf den Text angewendet werden, bevor die anwendungsspezifische Informationsextraktion erfolgt. Vergleichbar mit dem Stanford Natural Language Processing Toolkit, dem Standardannotationstool für natürliche Sprache, zeigen wir wie korrespondierende Werkzeuge für die Verarbeitung mathematischer Sprache entwickelt werden können.Unser Ansatz ist es, das Prinzip des Mathematical Language Processing (MLP), dessen Machbarkeit durch unseren Beitrag zur ACM SIGIR 2016 belegt wurde, weiter auszubauen, sodass zukünftige Forschungsprojekte die im vorliegenden Projekt erforschten Methoden für neue Einsatzzwecke anwenden können. Konkret sollen durch die Weiterentwicklung des MLP folgende Ziele erreicht werden:1. Die Identifizierung von mathematischen Formeln und Ausdrücken sowie deren Abgrenzung gegenüber anderen Strukturen.2. Die Typisierung und Tokenisierung von mathematischen Ausdrücken.3. Die Extraktion mathematischer Konzepte aus den identifizierten und tokenisierten mathematischen Ausdrücken.Wir werden die entwickelten Methoden und Werkzeuge in Kooperation mit unseren Partnern, dem National Institute of Standards and Technology, USA und der Wikimedia Foundation erproben. Hierdurch soll unter anderem die Vorteilhaftigkeit der Technologie demonstriert und ihre Bekanntheit gesteigert werden. Damit legen wir die Grundlage für andere Wissenschaftler unsere Methoden und Werkzeuge für Mathematische Sprachverarbeitung weiterzuentwickeln und für neue Probleme einzusetzen, wie dies auch mit den Methoden und Werkzeugen für die Natürliche Sprachverarbeitung in der Vergangenheit der Fall war.Die möglichen Anwendungsgebiete der in diesem Projekt erforschten Methoden liegen verstärkt im MINT Bereich und umfassen zum Beispiel eine verbesserte Literaturempfehlung, Plagiatsprävention und Expertensuche. Auch außerhalb des wissenschaftlichen Arbeitens in den MINT-Fächern bestehen zahlreiche Anwendungsmöglichkeiten. Beispielsweise können die verbesserte Empfehlung von Buchabschnitten oder Wikipedia-Artikeln einen selbstständigen Lern- und Arbeitsprozess von Schülerinnen und Studierenden unterstützen. Weiterhin kann der Einbezug mathematischer Formeln bei der Patentsuche oder bei der unternehmensinternen Informationssuche zu enormen finanziellen und zeitlichen Einsparungen führen.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug USA
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung