Schweizer Textkorpus

Das Schweizer Textkorpus widmet sich der deutschen Standardsprache der Schweiz des 20. und 21. Jahrhunderts. Die digitale Sammlung ist anhand formaler, inhaltlicher und zeitlicher Kriterien aufgebaut und umfasst aktuell 23.5 Millionen Textwörter. Sie stellt eine ausgewogene Repräsentation des Deutschschweizer Wortschatzes dar und kann als Grundlage für spezifisch schweizerische lexikografische Fragestellungen dienen. Das Textkorpus wird bis 2025 um weitere Texte aus dem 21. Jahrhundert angereichert.

Das Schweizer Textkorpus entstand als Teilprojekt des internationalen Forschungsvorhabens Korpus C4. Ziel dieser Vereinigung mit Partnerprojekten aus Deutschland, Österreich und Italien war es, die deutsche Standardsprache des 20. Jahrhunderts möglichst ausgewogen zu erfassen und online zugänglich zu machen. Zu diesem Zweck wurden deutschsprachige Texte aller Art digitalisiert (Zeitungsartikel, Werbung, Formulare, Anleitungen, Ratgeber, populäre Fachliteratur, Jugend- und Trivialliteratur, Belletristik etc.). Seit April 2009 ist eine erste Version des Korpus C4 veröffentlicht, die allerdings noch nicht den vollständigen Bestand an Textwörtern enthält. Für die deutsche Sprache des 20. Jahrhunderts steht damit erstmals ein ausgewogenes und regionale Varianten berücksichtigendes Textkorpus bereit, das sich für verschiedene linguistische Fragestellungen verwenden lässt.

Das Schweizer Textkorpus wurde von einer Forschungsgruppe des Deutschen Seminars der Universität Basel aufgebaut und in dieser Phase zur Hauptsache vom Schweizerischen Nationalfonds finanziert. Seit 2014 wird es am Schweizerischen Idiotikon betreut und von der Schweizerischen Akademie für Geistes- und Sozialwissenschaften finanziell unterstützt.

Informationen

Projekt

Footer