Giuliano Merz |
http://www.a-ch-d.eu |
BUNT IST DIE SPRACHE
Wörter & Wortformen
Aus einem Korpus[1] von genau 3 Millionen Sätzen, welche 50.190.175 Wortformen ergeben, wurden die 5000 häufigsten für die Zwecke dieser Sektion des Portals ermittelt.
Hier werden die Listen - in Tausender eingeteilt - zur Verfügung gestellt[2].
1 - 1000 | 1001 - 2000 | 2001 - 3000 | 3001 - 4000 | 4001 - 5000 |
[1] Der hier erwähnte und benutzte Sprachausschnitt ist Teil eines Korpus der Universität Leipzig, welches z.Zt. rund 1,5 Mrd. laufende Wörter (entspricht ca. 100 Mio. Sätzen) umfaßt; S. http://wortschatz.uni-leipzig.de/. Dort wurden verschiedene Quellen digitalisiert; nachfolgend die wichtigsten Daten dazu:
PRINTMEDIEN:
|
ONLINE-MEDIEN
|
[2] Hinweis: Wenn synsemantische Elemente (diese werden auch Funktionswort, grammatisches Wort, Strukturwort genannt; also Artikel, Konjunktion, Partikel, Präposition, Pronomen...) mit Großbuchstaben beginnen und so in der Auflistung stehen, heißt es, daß sie in den Texten am Anfang eines Satzes oder einer direkten Rede bzw. nach Doppelpunkt gestanden haben.