Sprachstatistik (auch: Statistische Linguistik) kann auf zweierlei Weise verstanden werden: Man meint damit einerseits die Statistik der Sprachen [1], andererseits jede Art statistischer Untersuchung beliebiger sprachlicher Eigenschaften oder Gegenstände und ihrer Veränderungen.
Inhaltsverzeichnis |
Sprachstatistische Erhebungen dienen in vielen Fällen praktischen oder auch wissenschaftlichen Zwecken. Wenn man z.B. weiß, wie häufig Buchstaben in einer Sprache vorkommen, kann man verschlüsselte Texte lesbar machen. Bei stilistischen Untersuchungen (Quantitative Stilistik) geht es darum, Besonderheiten der Ausdrucksweisen einzelner Autoren, Textklassen, Epochen oder verschiedener Kommunikationsbereiche (Stil der Presse und Publizistik, Stil der Alltagssprache etc.) zu charakterisieren. Wendet man statistische Methoden auf literarische Texte an, so betreibt man nach einem Vorschlag von Fucks (1968: 77, 88) Quantitative Literaturwissenschaft. Die Möglichkeiten der Statistik bei Stiluntersuchungen skizziert Crystal (1993: 67). Auch für die Feststellung, wie schwierig ein Text gestaltet ist, kann die Sprachstatistik wesentliche Hilfe leisten. So dienen die sog. Lesbarkeitsindizes dazu, die Lesbarkeit, d.h. den Schwierigkeitsgrad von Texten, zu messen. Auch der Wortschatz der Sprachen ist unter dem Begriff Lexikostatistik in vielfältiger Weise Gegenstand der Sprachstatistik: Hier geht es u.a. um die Erstellung von Häufigkeitswörterbüchern und um die Verfallsraten, denen der Wortschatz unterliegt (Glottochronologie).
Es gibt also viele Einsatzmöglichkeiten für die Sprachstatistik. Oft geht es aber auch lediglich um die Befriedigung der Neugier: Man will einfach wissen, was wie häufig vorkommt oder wie seine Häufigkeiten sich mit der Zeit ändern, ohne dass damit unmittelbar weitergehende Ziele verfolgt werden.
Zur Sprachstatistik des Deutschen: Daten zur Sprachstatistik des Deutschen (Buchstaben- und Lauthäufigkeiten, Grammatik, Wortschatz) findet man bei Meier (1967). Einige Daten stellt auch König (2005) zusammen [2]. Zu vielen Themen finden sich in Untersuchungen zur Quantitativen Linguistik ebenfalls statistische Daten zum Deutschen. [3]
Von der Sprachstatistik ist die Quantitative Linguistik zu unterscheiden, die auf der Sprachstatistik aufbaut, indem sie sich statistischer Methoden bedient, um Sprachgesetze wie das Menzerathsche Gesetz und das Zipfsche Gesetz und damit letztlich eine Sprachtheorie zu entwickeln. Ihre Ziele gehen also über das Erheben statistischer Daten zu sprachlichen Phänomenen hinaus.
Statistische (und z.T. wissenschaftstheoretische) Grundlagen für Linguisten stellen Altmann (1995), von Essen (1979), Hoffmann & Piotrowski (1979), Nikitopoulos (1973) und Schlobinski (1996) für unterschiedliche Ansprüche dar.
| Wiktionary: Sprachstatistik – Bedeutungserklärungen, Wortherkunft, Synonyme und Übersetzungen |