Wortschatz : FAQ : Sprache : Kollokationen

Zwischen den lexikalischen Einheiten eines Satzes oder eines Textes bestehen eine Vielzahl semantischer Zusammenhänge, die in ihrer Gesamtheit die Semantik des Satzes oder Textes formen. Eine (automatische) Extraktion dieser Zusammenhänge setzt normalerweise die Kenntnis der Semantik der einzelnen Bestandteile voraus. Diese ist aber insbesondere bei statistischen oder korpuslinguistischen Verfahren nicht oder nur unzureichend bekannt.

Ein "einfacher" Ansatz baut auf der Annahme auf, daß semantisch in Beziehung stehende Einheiten in verschiedenen Umgebungen vermehrt gemeinsam auftauchen. Dieses Eigenschaft wird als Kollokation bezeichnet.

Der Begriff Kollokation geht auf das lateinische collocatio zurück, der auf deutsch Stellung oder Anordnung bedeutet. Franz-Josef Hausmann definiert ihn als "typische, spezifische und charakteristische Zweierkombinationen von Wörtern". Bei dem Versuch einer präziseren Definition des Kollokationsbegriffes stößt man auf die Schwierigkeit, daß der Kollokationsbegriff in der Sprachwissenschaft geteilt ist: Kollokationen werden zum einen auf syntaktisch-semantischer Ebene und zum anderen auf statistischer Ebene untersucht. Kollokationen, die mit Hilfe von statistischen Methoden gefunden werden, umfassen beliebige Wortkombinationen ungeachtet ihrer grammatischen Wohlgeformtheit, während Kollokationen nach dem syntaktischen Ansatz auf die Kombination bestimmter Wortarten (z. B. Substantiv-Adjektiv-Kollokationen) beschränkt sind.

Wir gehen vom statistischen Ansatz aus und verstehen unter der Kollokation eines Wortes die Wörter, die signifikant häufig mit diesem Wort in einer gewissen Umgebung - dem Kontext des Wortes - erscheinen. Im Rahmen des Wortschatzprojektes wurde die Größe der Umgebung auf einen Satz festgelegt, da zu den Wörtern Beispielsätze gespeichert werden und in den Sätzen semantisch verwandte Wörter auch weit entfernt voneinander auftreten können. Dies tritt in der deutschen Sprache besonders häufig bei Präfixverben und mehrfach verschachtelten Sätzen auf. Durch die Beschränkung der Umgebung auf einen Satz werden die Kollokationen eingegrenzt. Die Kollokationen im gleichen Satz besitzen eine höhere Aussagekraft als solche, die sich über Satzgrenzen hinaus erstrecken.