Project Details
Projekt Print View

FADeBaC Sentiment Analysis - Fully Automatic DEnsity-BAsed Clustering applied to Sentiment Analysis

Subject Area Image and Language Processing, Computer Graphics and Visualisation, Human Computer Interaction, Ubiquitous and Wearable Computing
Term from 2012 to 2018
Project identifier Deutsche Forschungsgemeinschaft (DFG) - Project number 219327280
 
Viele wissenschaftliche Disziplinen wenden Clustering zur explorativen Datenanalyse, Theoriebildung und statistischen Inferenz an. Dennoch sind wesentliche Aspekte der verwendeten Algorithmen heuristisch und haben oft schlecht verstandene statistische Eigenschaften. Wir wollen diese Probleme durch die Entwicklung und Analyse neuer Clusteringalgorithmen angehen. Diese Algorithmen sollen die Clusteranzahl und andere algorithmusspezifische Hyperparameter vollautomatisch wählen, so dass für hinreichend große Datenmengen statistische Garantien im Hinblick auf ein mathematisch präzises und praktisch bedeutsames Clusteringziel gegeben werden können. Wir setzen diese neuen Clusteringalgorithmen zur Sentimentanalyse ein, einem Problem aus der maschinellen Sprachverarbeitung, bei dem die Bestimmung der unterschiedlichen Meinungen im Wesentlichen eine Clusteringaufgabe ist. Da alle Hyperparameter der Clusteringalgorithmen automatisch bestimmt werden, sind Metrik (bzw. Ähnlichkeitsmaß) und Datenrepräsentation die einzigen domänenspezifischen Eingaben. Als größte Herausforderung bleiben dann Polaritätsmodifikatoren, z.B. Wörter wie nicht, die die Polarität umkehren. Wir werden Methoden entwickeln, um Polaritätsmodifikatoren automatisch zu lernen und so zu repräsentieren, dass ein präzises Ähnlichkeitsmaß für Sätze definiert und dann für erfolgreiches Clustering genutzt werden kann.
DFG Programme Research Grants
 
 

Additional Information

Textvergrößerung und Kontrastanpassung