Project Details
A computerized corpus of English in the south-eastern Welsh mining valleys
Applicant
Professor Dr. Magnus Huber
Subject Area
Individual Linguistics, Historical Linguistics
Term
from 2001 to 2003
Project identifier
Deutsche Forschungsgemeinschaft (DFG) - Project number 5321126
Ziel des Vorhabens ist die Erstellung einer computergestützten Textsammlung (Korpus) des englischen Dialekts in den südost-walisischen Bergbautälern, die als Datenbasis für linguistische Analysen v.a. in den Bereichen Korpuslinguistik, Dialektologie und Soziolinguistik dienen soll. In Zusammenarbeit mit dem Centre for Language and Communication Research, Cardiff University, werden 380 Interviews aus den Jahren 1969-87 (460 Stunden gesprochenes Wort), die in der South Wales Miners´ Library, Swansea, auf Audiokassetten vorliegen, digitalisiert und orthographisch transkribiert, wobei auch anonymisierte Sprecherdaten gespeichert werden. Der transkribierte Text wird einer automatischen Satzanalyse (part-of-speech tagging) unterzogen. Die Audiodateien erlauben Untersuchungen etwa in den Bereichen der Phonetik und Phonologie oder Intonation, während die Textdateien z.B. morphologische syntaktische Analysen ermöglichen und mithilfe spezieller Korpussoftware auch statistisch untersucht werden können. Die Sprecherdaten lassen weiterhin Untersuchungen zur soziolinguistischen Variation zu.
DFG Programme
Research Grants