Volltextdigitalisierung

In einem ersten Arbeitsschritt werden alle Bände der vier genannten Dialektwörterbücher manuell im sog. Double-keying Verfahren in China erfasst, d. h. die Textvorlage wird von zwei Teams von Datentypisten unabhängig voneinander mit MS Word eingegeben. Bei der Erfassung der Dialektwörterbücher werden alle typographischen Merkmale und alle vorkommenden Sonderzeichen nach TUSTEP-Konventionen kodiert. Für die vorliegenden Wörterbücher ist dies vor allem für die Lautform der Wörter, die in phonetischer Schrift angegeben wird, von besonderer Bedeutung.

Als Ergebnis der Dateneingabe entstehen zwei Word-Dateien, die in Trier nach TUSTEP (TÜbinger System von TextverarbeitungsProgrammen) konvertiert werden. Die beiden Fassungen werden dann mittels des TUSTEP-Moduls VERGLEICHE automatisch miteinander verglichen, und es wird ein Vergleichsprotokoll generiert, das manuell abgearbeitet wird. Als Ergebnis entsteht eine weitestgehend fehlerfreie elektronische Fassung des gesamten Wörterbuchtextes.