Home Korpus

Das Schweizer Textkorpus setzt schwergewichtig auf Zusammenarbeit und offene Standards, um für seine Zwecke die bestmöglichen Technologien einsetzen zu können.

Offene Standards sind in der Text- und Korpustechnologie unverzichtbar, damit nachhaltig verfügbare Ressourcen bereitgestellt werden können. Wie viele andere Korpora kodiert das Schweizer Textkorpus die XML-Versionen seiner Dokumente nach den Vorgaben der Text Encoding Initiative (TEI). Die Scans mit hinterlegtem Text werden als archivierbare PDFs (PDF/A nach ISO 19005-1) aufbewahrt.

Für die Verarbeitung der Texte und die Publikation des Korpus im Internet wird, wo möglich und sinnvoll, quelloffene Software und/oder Software unserer Partnerprojekte eingesetzt. So basiert die Suchoberfläche des Schweizer Textkorpus auf dem Webframework Django, die linguistische Suchmaschine für die Indexierung der Korpustexte im Hintergrund ist DDC, das von unserem Berliner Partnerprojekt DWDS entwickelt wurde.

Das Schweizer Textkorpus ist auch sehr offen für Erfahrungsaustausch im Bereich Korpustechnologie.