Detailseite
Projekt Druckansicht

Effiziente tiefe neuronale Netze für eingebettete Systeme

Fachliche Zuordnung Rechnerarchitektur, eingebettete und massiv parallele Systeme
Bild- und Sprachverarbeitung, Computergraphik und Visualisierung, Human Computer Interaction, Ubiquitous und Wearable Computing
Förderung Förderung von 2016 bis 2020
Projektkennung Deutsche Forschungsgemeinschaft (DFG) - Projektnummer 285966169
 
Tiele neuronale Netze sind für viele Problemstellungen aus den Bereichen der Signal-, Sprach- und Bildverarbeitung der Hauptgrund für eine signifikante Leistungssteigerung. Das gilt insbesondere bei einer Verfügbarkeit von großen Datenmengen und unbeschränkten Rechenressourcen. Bei vielen realen Anwendungsfällen gibt es aber diesbezüglich oft Einschränkungen. Diese Problematik wird hier addressiert und Methoden entwickelt, um die Rechenkomplexität und den Ressourcenbedarf bei minimalen Verlust der Leistungsfähigkeit zu reduzieren. Dies ermöglicht die Anwendbarkeit von tiefen neuronalen Netzen in eingebetteten System mit begrenzter Energieversorgung und Rechenkapazität bei gleichbleibender Qualität.Eingebettete Prozessoren verfügen mittlerweile über architektonische Eigenschaften die eine native Kreuzkompilierung von numerischen Algorithmen ermöglicht. Eine der am häufigsten genutzten eingebetteten CPUs ist der ARM Cortex-A9. Erste hybride Implementierungen verbinden ARM-Kerne mit rekonfigurabler Logic (FPGAs). Für ausgewählte Anwendungen kann dies die Leistungsfähigkeit signifikant steigern, allerdings ist noch weitestgehend unklar wie existierende Software-Stacks diese Heterogenität nutzen können. Hierfür sind neue Methoden und Tools gefragt.Diese zwei Forschungsrichtungen in Kombination ermöglichen die Anwendung von tiefen neuronalen Netzen in eingebetteten Systemen. Der vorliegende Projektvorschlag stützt sich auf folgende Aspekte:(1) Dünnbesetzte Konnektivität und Aktivität in den tiefen Modellen: Durch die Nutzung von dünnbesetzten Gewichtsmatrizen und Aktivierungsfunktionen kann die Anzahl von arithmetischen Operationen reduziert werden.(2) Reduzierte Genauigkeit von tiefen Modellen: Zum Beispiel in Hörgeräten sind qualitativ hochwertige einfache Klassifikatoren notwendig um eine akustische Szene zu erfassen. Wir werden diese Leistungsfähigkeit der Klassifikatoren analysieren und das Lernverhalten bei reduzierten Genauigkeiten untersuchen. Ein weiterer Aspekt ist die Analyse der Auswirkung von Ganzzahlberechnungen auf die Klassifikationsqualität.(3) Automatisierte Codesynthese für eingebettete System wie hybride ARM+FPGA Architekturen basierend auf integrierten, domänenspezifischen Sofware-Stacks wie Theano. Ziel ist die Ausnutzung von vorigen Aspekten wie dünnbesetzte Matrizen und Aktivierungsfunktionen, reduzierter Genauigkeit aber auch asynchronen Berechnungen für die Synthese von effizienten Modellen, sowie eine automatisierte Nutzung hybrider Architekturen mittels integrierter Partitionierung, Kompilation und Synthese.(4) Die entwickelten Methoden werden empirisch evaluiert und anhand mehrerer Anwendungen analysiert. Diese Anwendungen beinhalten Probleme aus dem Bereich der Bild- und Sprachklassifikation. Kernaspekte sind die Auswirkungen der o.g. Optimierungen in Bezug auf Ausführungszeit, Energieeffizienz und Ressourcenverbrauch, bei gleichzeitiger automatisierter Kompilation für eingebettete heterogene Systeme.
DFG-Verfahren Sachbeihilfen
Internationaler Bezug Österreich
Mitverantwortlich Professor Dr. Franz Pernkopf
 
 

Zusatzinformationen

Textvergrößerung und Kontrastanpassung