Leitung und konzeptionelle Entwicklung:Thomas Krefeld | Stephan Lücke | Emma MagesTranskription:Grete Klaster-Ungureanu | Ute Maurer | Christian Punk | Horst Schuller | Johannes SiftMorphosyntaktische Etikettierung:Heide Ewerth | Johannes SiftEntwurf einer Ontologie und ontologische Erschließung:Johannes SiftDOI und URN |
Dieses Portal macht eine sehr umfangreiche Tondokumentation siebenbürgisch-sächsischer Dialekte zugänglich; dabei handelt es sich insgesamt um über 360 Stunden gesprochener Sprache aus ca. 250 verschiedenen Ortschaften, gespeichert in insgesamt 2274 Audiodateien. Dieses einzigartige, bislang unveröffentlichte Material wurde im Wesentlichen in den späten 60er und frühen 70er Jahren des letzten Jahrhunderts von Sprachforschern verschiedener rumänischer Universitäten (Bukarest, Hermannstadt, Klausenburg) erhoben und auf Tonbändern aufgenommen; daraus wurden die digitalen Versionen (in den Formaten ‘wav’ und ‘mp3’) mit durchweg guter akustischer Qualität erstellt. Diese digitalen Versionen wurden im Jahr 2009 unter Vermittlung und mit Unterstützung von Prof. Dr. Stefan Sienerth, dem damaligen Direktor des Instituts für deutsche Kultur und Geschichte Südosteuropas (IKGS), an die LMU übergeben und können nun hier in akustischer Form abgerufen werden. Die Dokumentation umfasst unterschiedliche Erhebungsstrategien und Diskursformen: Einerseits wurden in den meisten Orten die berühmten, geradezu ‘klassischen’ Wenker-Sätze der germanistischen Dialektologie abgefragt; andererseits sind auch Märchen, Lieder und – vor allem – zahlreiche, mehr oder weniger freie Erzählungen vertreten. Deshalb werden neben sprachwissenschaftlichen auch ethnographische und zeitgeschichtliche Interessen bedient. Mit dem sehr unterschiedlichen Alter der Informanten kommt eine weitere Dimension der Variation ins Spiel, die ebenfalls bereits gezielt angesteuert werden kann.
| Gesamtbestand |
Diese Funktion erschließt das Audiomaterial nach den Kriterien Ort, Jahr, Alter, Subcorpus und Inhalt und verlinkt zu den einzelnen Dateien. Die einzelnen Kriterien können über Auswahl in der Trefferliste miteinander kombiniert werden. Verwendet man das Dropdown-Menü zur Auswahl, werden bereits vorhandene Filter entfernt. Einzelne Kriterien können im Dropdown-Menü abgewählt werden (Filter entfernen).
Durch Auswahl des Audiosymbols in der Filtermaske gelangt man zum Abspielen der ausgewählten Datei. Ist für die Aufnahme eine orthographische Transkription vorhanden, erscheint eine tag cloud aus ontologischen Begriffen, deren Größe ihre Häufigkeit in der Datei widerspiegelt. Ein Klick auf einen Begriff in der tag cloud führt zu einer entsprechenden Schlagwortsuche im Gesamtbestand.
Angemeldeten Benutzern wird je nach Bearbeitungsstand der Datei außerdem die phonetische und/oder orthographische Transkription angezeigt. Das Anhören der Datei ist sowohl als Ganzes über den integrierten Player oder intervallweise über die Playbuttons neben der Transkription möglich.
| Suche |
Hier kann sowohl mit Stichwörtern direkt im Transkriptionstext als auch über die Schlagwörter der eigens entwickelten Ontologie thematisch gesucht werden. Über die Sprachauswahl lassen sich gezielt fremdsprachliche Elemente finden (z.B. rumänisch, ungarisch).
Die verschiedenen Suchmethoden können miteinander kombiniert werden. Das Ergebnis zeigt den Kontext der Treffer an (1 Transkriptionsintervall) und bietet die Möglichkeit, die betreffenden Ausschnitte anzuhören. Mit Klick auf die Dateinummer erscheint die Gesamtbestandsansicht mit tag cloud der Datei und Transkriptionen (für angemeldete Benutzer).
| Analyse |
1) Die Wenkersatzanalyse stellt die Wenkersätze aller erfassten Ortschaften in Listen-, Karten- und Matrixform dar.
2) Die Diagrammanalyse veranschaulicht ausgewählte Relationen (z.B. Type-Token-Verhältnis) in Diagrammform.
3) Die Analyse der rumänischen Elemente kartiert deren Häufigkeit in Relation zu Datei bzw. Ort. Je dunkler ein Kästchen, desto höher der Anteil rumänischer Tokens. Bei Verweilen der Maus auf einer Ortsmarkierung erscheint ein Infofenster zur Anzahl der rumänischen Tokens am ausgewählten Punkt. Ein Diagramm gibt darüber hinaus Aufschluss über die Häufigkeit der Rumänismen in Bezug auf das Sprecheralter.
Die Funktion Tokenumgebung untersucht anhand der orthographischen Transkriptionstexte die an die rumänischen Elemente angrenzenden Tokens und gibt einen Überblick über die Vorkommen der Rumänismen in Einzel- oder Gruppenstellung.
In den Jahren (2010-2013) wurde ein repräsentativer Teil des Materials in digitaler Form (mit dem Programm Praat) transkribiert und gleichzeitig sprachwissenschaftlich annotiert, so dass es möglich ist, alle erfassten Formen zu suchen und in ihren jeweiligen syntaktischen Kontexten zu belegen. Diese Erschließung wurde durch die Förderung vom Beauftragten der Bundesregierung für Kultur und Medien aufgrund eines Beschlusses des Deutschen Bundestages ermöglicht. Auch nach Auslaufen dieser Förderung haben die Nutzer des Portals jedoch in mediengerechter Konsequenz die Möglichkeit, Materialien zur Ergänzung der Dokumentation um weitere Orte, Sprecher und womöglich die Kontaktsprachen Rumänisch und Ungarisch beizusteuern. Interessenten sind gebeten, sich mit den Projektleitern in Verbindung zu setzen.
Im Sinne der Nachhaltigkeit und Nachnutzbarkeit ist das ASD-Korpus seit Anfang 2017 auch im Clarin-Repositorium (persistenter Link: http://hdl.handle.net/11022/1009-0000-0001-27B9-3) verfügbar (Validierungsreport und Clarin-Korpusbeschreibung). Der freie Zugriff ist dort auf die Metadaten beschränkt. Bei Interesse an Vollzugriff auch auf die Audiodateien und Transkriptionen wird darum gebeten, sich an die o.a. Projektleiter bzw. an deren Einrichtungen zu wenden. Der Vollzugriff kann nur für wissenschaftliche Zwecke gewährt werden.