Wie viele Wörter braucht der Mensch?

Grundwortschatz

Mein Ziel bei der Erstellung dieser Vokabelliste war es, etwa 1.000 Vokabeln zu finden, mit denen man im Alltag ganz gut zurechtkommt.

Dahinter steht der Gedanke, dass ein Sprachanfänger erst einmal mit einen kleinen Vokabelschatz beginnt und diese Vokabeln einen möglichst großen Nutzen bieten müssen, um die Motivation aufrecht zu erhalten. Das gilt insbesondere für eine als schwierig geltende Sprache wie Koreanisch.

Ich hatte gehofft, dass ich auf den vielzitierten Grundwortschatz zurückgreifen könnte. Natürlich ging ich davon aus, dass ein Grundwortschatz wohlbekannt und frei verfügbar wäre. Das erwies sich als großer Irrtum, denn der Grundwortschatz ist ein ziemlich willkürliches Konstrukt.

Laut Wikipedia ist eine mögliche Definition des Grundwortschatzes die Menge von Wörtern, die nötig ist, um circa 85% eines beliebigen Textes zu verstehen. Die besondere Bedeutung liegt darin, dass er eine Wortmenge definiert, die nötig ist, um mit möglichst wenig Lernaufwand zu einem hohen Sprachverständnis zu kommen. Für Deutsch beträgt der Grundwortschatz etwa 1.300 Wörter. Prima! Das war genau das, wonach ich gesucht hatte, wenn auch für Koreanisch.

Die Suche nach einem konkreten Grundwortschatz führt schnell vom Internet in die Buchhandlungen. Dort gibt es viele Wörterbücher zu Grundwortschätzen in verschiedenen Sprachen. Umfang: 5.000 bis 10.000 Wörter. Laut Wikipedia beträgt der Sprachumfang eines 15-jährigen Muttersprachlers etwa 12.000 Wörter. Ich denke, die meisten Menschen werden meine Auffassung teilen, dass solche "Grundwortschätze" nicht als Ausganspunkt für Sprachanfänger geeignet sind und schon gar nicht als Basis für einen Koreanisch-Kurs.

Wie viele Wörter sind nun wirklich notwendig, um mit einer Sprache den Alltag zu bewältigen? Ich stieß auf folgende Fakten:

  1. Viele Bücher bestehen aus etwa 6.000 verschiedenen Wörtern.

  2. 1000 Wörter decken etwa 80% der meisten längeren Texte ab.

  3. In der Regel bestehen etwa 50% eines Textes aus nur 100 Wörtern.

  4. Die Plansprache toki pona kommt mit 123 Wörtern aus. toki pona beschränkt sich auf elementare menschliche Kommunikation und entspricht in etwa dem Kauderwelsch, das entstand, wenn verschiedene historische Kulturen miteinander in Kontakt kamen.

  5. Basic English ist auf einen Wortschatz von 850 Wörtern reduziert. Basic English ist ein stark vereinfachtes Englisch, mit dem sich trotzdem über 20.000 englische Wörter umschreiben lassen.

  6. Der Wortschatz eines Erwachsenen beträgt etwa 3.000 bis 216.000 Wörter. Die Aussage bezieht sich offenbar auf den rezeptiven (passiven) Wortschatz.

Ermittlung des Grundwortschatzes

Um den Nutzen verschiedener Grundwortschätze einschätzen zu können, ist es nötig, zu wissen, wie diese ermittelt wurden. Hier stößt man für gewöhnlich auf zwei Kriterien.

  1. Häufigkeit

  2. Wichtigkeit

Häufigkeit

Insbesondere die modernen Wörterbücher scheinen sich stark an der Häufigkeit von Wörtern zu orientieren. Das Verfahren ist simpel (und billig): Man füttere ein Computerprogramm mit einigen Texten und lasse den Computer die verschiedenen Wörter zählen. Besonders häufige Wörter kommen in den Grundwortschatz. Sie decken rein statistisch einen großen Teil der Texte ab. Das Ganze nennt sich auch Wortfrequenzanalyse.

So bestechend einfach dieses Verfahren auch erscheint, die Wortfrequenzanalyse besitzt schwerwiegende Nachteile:

  1. Die ermittelten Worthäufigkeiten hängen stark vom zugrunde liegenden Textmaterial ab. Jeder Mensch gehört verschiedenen soziologischen Gruppen an, was den individuellen Grundwortschatz schnell aufgebläht. Wer einmal eine Bahnfahrt inmitten einer Schulklasse verbracht hat, weiß, dass hier eine andere Sprache gesprochen wird als im Rentnerabteil nebenan. In der Linguistik findet man deshalb schnell Grundwortschätze zu verschiedenen Fachgebieten, Dialekten, Soziolekten...

    Auf dem freien Markt sind die Angaben verschiedener Autoren zu den Quellen ihrer Vokabelsammlungen eher dürftig.

  2. Häufige Wörter sind nicht unbedingt wichtige Wörter. Im Deutschen kommen beispielsweise Personalpronomen, Bindewörter und Artikel sehr häufig vor. Im Koreanischen fehlen die Artikel völlig und Personalpronomen werden selten benutzt. Probieren wir doch einmal aus, was passiert, wenn in deutschen Sätzen Personalpronomen, Bindewörter, Artikel und sogar noch einige andere häufige Wörter weggelassen werden.

    Ich bin zu spät gekommen.Zu spät gekommen.
    Möchten Sie Tee oder Kaffee?Tee? Kaffee?
    Gib mir bitte die Butter!Gib Butter!
    Ich habe Hunger!Hunger!

    Ich habe über 50% der häufigen Worte gestrichen und die Sätze sind immer noch verständlich. Die Häufigkeit eines Wortes ist kein Maß für seine semantische Bedeutung.

    Wer Spaß daran hat, kann gerne testweise in Sätzen aus aus diesem Text Personalpronomen, Bindewörter und Artikel streichen, um zu sehen, was passiert.

Es ist also kein Wunder, dass Grundwortschätze, die mit der Wortfrequenzanalyse erstellt wurden, häufig aufgebläht sind. Schließlich möchte man auch die wichtigen Wörter erfassen.

Wichtigkeit

Gil Dong:Was heißt "Willst du sterben?" auf chinesisch?
Yi Nok:Das weiß ich nicht.
Gil Dong:Du sagst, du kannst Chinesisch, und kennst nicht einmal die wichtigsten Wörter?

- Aus: Hong Gil Dong (der Fernsehserie) -

Wichtigkeit ist nur eine leeres Wort, solange nicht angegeben wird, mit welchem Maß sie bestimmt wird.

Viele Verlage scheinen Wichtigkeit mit Häufigkeit gleichzusetzen. Das ist richtig, wenn die Häufigkeit als Wichtigkeit definiert wird. Für das Verständnis eines Textes ist es aber falsch. Auch den Satz Hinter dir steht ein großer Löwe wird man nicht allzu häufig im Leben hören, ihm aber dann eine immense Bedeutung beimessen.

In Basic English wurden Redundanzen entfernt. In diesem Fall sind die wichtigen Wörter die, mit denen sich möglichst viele andere ersetzen lassen. Der Basic-English-Wortschatz ist also wichtig in dem Sinne, dass sich damit sehr viel ausdrücken läßt. Er ist nicht unbedingt auf das Verständnis der Sprache optimiert, weil unter Umständen häufig verwendete, aber redundante Vokabeln fehlen.

Der Wortschatz von toki pona beschränkt sich auf elementare überlebensnotwendige Kommunikation. Dazu gehören Wasser, Nahrung, Menschen, geben, nehmen, gut, schlecht... Die Wörter von toki pona sind in dem Sinne wichtig, dass sie für das Überleben hilfreich sind.

Die Vokabeln aus Sprachlehrbüchern sind gewöhnlich situationsbezogen wichtig. Ein typisches Sprachlehrbuch enthält eine Reihe von Alltagssituationen und dazu die passenden Vokabeln. Natürlich ist die Auswahl der Alltagssituationen willkürlich. Vokabeln für Touristensituationen werden im Alltag eines Einheimischen oft nicht gebraucht. Typisch sind Sätze wie: Wo ist die Gepäckausgabe? Haben Sie etwas zu verzollen? Ihren Reisepaß bitte!

In Reisewörterbüchern sind Vokabeln normalerweise in Kategorien angeordnet, beispielsweise Städte, Geschäfte, Hotel, Verkehr, Krankheiten, Natur, Essen, Wochentage. Oft sind die Kategorien auch situationsbezogen, wie Am Strand oder Beim Arzt. Hier sind die Wörter dann wichtig, wenn sie gut in die vorgegebenen Kategorien passen.

Ein absolutes Maß für die Wichtigkeit eines Wortes gibt es also nicht. Das macht es praktisch unmöglich, einen Grundwortschatz aufgrund der Wichtigkeit zu ermitteln. Wer das tut, sollte genau angeben, wie die Wichtigkeit einer Vokabel ermittelt wurde.

Koreanisch-Vokabelliste

Ziele

Mein Ziel war es, eine Vokabelsammlung aufzustellen, mit der sich eine hohe Gebrauchstauglichkeit erreichen läßt. Die Vokabeln sollten helfen, im koreanischen Alltag zurechtzukommen und sich mit Freunden zu unterhalten. Die Anzahl der Vokabeln sollte auf etwa 1.000 begrenzt sein, damit sie schnell erlernt werden können.

Es war nicht das Ziel, ein Wörterbuch aufzustellen oder typische Touristensituationen abzudecken. Vielmehr sollte die Vokabelsammlung ein Einstiegspunkt für Menschen sein, die ernsthaft vorhaben, Koreanisch zu erlernen.

Der erste Schritt war die Suche nach etwa 300 Wörtern für die wichtigste Alltagskommunikation. Diese enthalten:

  1. etwa 100 Wörter, die etwa 50% von Texten abdecken. Ohne diese Wörter fühlt man sich einfach hilflos und kann sich nur äußerst beschränkt ausdrücken.

  2. etwa 100 Wörter für elementare Kommunikation, ähnlich dem Sprachumfang von toki pona, aber an das moderne Leben angepaßt (kein Soldat, Krieg,...)

  3. etwa 100 Wörter als Zugeständnis an das wahre Leben, weil reale Kommunikation weder elementar noch ideal ist. Das sind Wörter, die irgendwie ständig gebraucht werden.

Tatsächlich kann man mit 300 Wörtern schon eine Menge ausdrücken. Es reicht aus, um im Alltag verblüffend weit zu kommen. Zum Verständnis einer Sprache reichen diese 300 Wörter allerdings bei weitem nicht aus.

Methoden der Vokabelfindung

  1. Wortfrequenzanalyse: Texte wurden auf Worthäufigkeiten untersucht. Die Texte stammen aus frei verfügbaren Quellen im Web, beispielsweise der Wikipedia, Online-Medien oder Untertitel-Dateien zu Fernsehserien.

    Aus dieser Analyse stammen die 100 häufigsten Wörter sowie eine gewisse Basismenge.

  2. Orientierung an der Maslowschen Bedürfnispyramide: Man suche zuerst die Wörter heraus, die sich mit Überleben, Essen und Trinken beschäftigen. Danach Wörter, die für soziale Interaktion notwendig sind. Es entsteht eine Wortliste ähnlich der von toki pona.

  3. Mensch und Umgebung: Man nehme einen Menschen und benenne zuerst Körperteile und grundlegende Fähigkeiten und Tätigkeiten. Danach benennt man die typischen Umgebungen, die mit diesen Aktivitäten assoziiert werden können.

  4. Situationsorientierung: Man nehme Alltagssituationen und schreibe die verwendeten Wörter auf.

    Klingt einfach, führt aber häufig dazu, dass sehr lange Vokabellisten entstehen.

  5. Kategorisierung: Wortsuche in typischen Kategorien, wie Essen, Menschen, Kleidung, Berufe,...

  6. Grammatik: Man erstelle Wortlisten anhand grammatikalischer Kategorien.

  7. Nachvollziehen der Kindheit: Man überlege sich, wie ein Kind aufwächst und benenne, was es lernt. Das sind zuerst die Personen und Gegenstände der täglichen Umgebung und, wahrscheinlich weiß kein Mensch warum, Tierbezeichnungen wie Tiger und Bär.

  8. Vereinfachung eines großen Sprachumfangs: Diese Methode ist mir aufgrund meiner dürftigen Koreanisch-Kenntnis weitgehend verwehrt. Ich versuche aber mit ziemlich viel Google-Suche Variationen derselben Aussage immer wieder auf einfache Beispiele zu reduzieren.

Da jede Methode ihre spezifischen Nachteile besitzt, habe ich mich für einen intuitiv gemischten Ansatz entschieden. Das bedeutet, ich habe nach jeder Methode Wörter zusammengesucht und die Relevanz sowohl subjektiv als auch nach Internethäufigkeit bewertet.

Bei der Häufigkeitsauswertung kommt es immer wieder zu Überraschungen. So sind zum Beispiel Cheerleader im Internet sehr populär, sie sind viel häufiger anzutreffen als Schwiegermütter (was vielleicht keine Überraschung ist), während der Friseur noch weit dahinter rangiert. Aber für jemanden, der seine ersten Monate in Korea verbringt, ist wahrscheinlich Friseur das wichtigere Wort. Das kann sich selbstverständlich ändern. Einige Monate später ist es vielleicht Cheerleader und nach einigen Jahren Schwiegermutter.

Inzwischen (Juli 2010) beträgt die Anzahl der Vokabeln bereits über 1.300 und es kommen immer noch mehr hinzu. Ich habe in meiner Datenbank die Vokabeln bereits in Grundwortschatz und Aufbauwortschatz eingeteilt, aber dieser Unterschied ist im Internet noch nicht sichtbar.

Im täglichen Leben drücken sich Muttersprachler recht vielfältig aus, das heißt, sie benutzen viel mehr Vokabeln als rein theoretisch nötig wären. In der Praxis bedeutet das, dass der passive Wortschatz deutlich größer sein muß als der aktive. Meine Vokabelsammlung wird also weiter wachsen und ich hoffe, dass es mir gelingt, einen überschaubaren Grundwortschatz beizubehalten.

Qualität der Übersetzungen

Wer schon einmal längere Zeit mit einem Deutsch-Koreanisch-Wörterbuch, einem Koreanisch-Lehrbuch oder gar einem automatischen Internet-Übersetzungsdienst gearbeitet hat, weiß, dass die Qualität der Übersetzungen häufig zu wünschen übrig läßt.

Die Gründe dafür sind vielfältig. Oftmals entstammen die Übersetzungen aus dem Umweg über die englische Sprache oder sie sind schlicht veraltet, fehlerhaft und niemand hatte je die Zeit oder das Geld sie zu überprüfen. Auch lassen sich koreanische Ausdrücke nicht immer 1:1 ins Deutsche übertragen. Die Abschreibekultur im Internet tut das Übrige. Falsche Übersetzungen werden fröhlich hundertfach kopiert und finden so ihren Weg in die Suchmaschinen und automatischen Übersetzer.

Ich möchte mit dieser Vokabelsammlung auch den Qualitätsstandard wieder etwas anheben und verwende relativ viel Zeit darauf, gute und korrekte Übersetzungen zu finden. Natürlich haben sich auch dabei Fehler eingeschlichen. Ich bin jedesmal froh, wenn mir jemand einen Fehler meldet und ich ihn korrigieren kann.

Die Beispiele sind fast alle in der informellen Höflichkeitsform gehalten, weil diese Form relativ universell verwendbar ist. Sie läßt sich sowohl für Freunde als auch für Fremde verwenden. Die Übersetzungen sind deshalb manchmal in der Du-Form und manchmal in der Sie-Form gehalten. Die meisten Lehrwerke verwenden nur die Sie-Form. Das finde ich insofern irreführend als dass die koreanischen Höflichkeitsformen nicht so einfach auf das deutsche Du und Sie übertragbar sind. Am besten, man merkt sich einfach, dass alles mit am Ende höflich ist.

Jo!

Viel Spaß damit!

Dirk Struve