Volltextdigitalisierung

In einem ersten Arbeitsschritt wurden alle Bände der vier genannten Dialektwörterbücher manuell im sog. Double-keying Verfahren in China erfasst, d. h. die Textvorlage wurde von zwei Teams von Datentypisten unabhängig voneinander mit MS Word eingegeben. Bei der Erfassung der Dialektwörterbücher wurden alle typographischen Merkmale und alle vorkommenden Sonderzeichen nach TUSTEP-Konventionen kodiert. Für die vorliegenden Wörterbücher war dies vor allem für die Lautform der Wörter, die in phonetischer Schrift angegeben wird, von besonderer Bedeutung.

Als Ergebnis der Dateneingabe entstanden zwei Word-Dateien, die in Trier nach TUSTEP (TÜbinger System von TextverarbeitungsProgrammen) konvertiert wurden. Die beiden Fassungen wurden dann mittels des TUSTEP-Moduls VERGLEICHE automatisch miteinander verglichen, ein Vergleichsprotokoll generiert, das manuell abgearbeitet wurde. Als Ergebnis entstand eine weitestgehend fehlerfreie elektronische Fassung des gesamten Wörterbuchtextes.