Home Korpus

Der Korpusaufbau beim Schweizer Textkorpus war von Anfang an darauf angelegt, den standarddeutschen Wortschatz des zwanzigsten Jahrhunderts in der Schweiz möglichst breit zu erfassen. Das Korpus besteht daher aus gedruckten und maschinengeschriebenen Texten jeglicher Produktions- und Publikationsform, möglichst ausgewogen zusammengestellt nach zeitlichen (ganzes 20. Jh.) und inhaltlich-sachlichen Kriterien:

  • Textsorte: formales Kriterium
  • Jahrhundertviertel: zeitliches Kriterium
  • Sachgruppe: inhaltliches Kriterium

Dieser ausgewogene und strukturierte Aufbau macht das Schweizer Textkorpus zu einer ausgewogenen Datenbasis für linguistische Fragestellungen.

Das Schweizer Textkorpus ist nach den genannten Kriterien folgendermassen strukturiert:

 

Werke/ Textwörter 1900-1924

Werke/ Textwörter 1925-1949

Werke/ Textwörter 1950-1974

Werke/ Textwörter 1975-1999

Werke/ Textwörter 2000-2018

 

gesamt

Gebrauchstexte

1'042

1'170'099

1'465

1'267'731

969

1'193'200

1'417

1'087'395

1'238

962'316

6'131

Sachtexte

167

1'450'562

433

2'052'909

804

1'954'529

276

1'891'373

898

980'125

2'578

Belletristik

188

1'116'820

50

1'248'911

159

1'122'447

59

1'149'111

40

944'405

496

Journalistische Prosa

833

513'728

1'107

1'020'160

993

982'098

1'929

1'135'426

1'267

970'559

6'129

gesamt

2'230

4'251'209

3'055

5'589'711

2'925

5'252'274

3'681

5'263'305

3'443

3'857'405

15'334