Suche in über 30 Millionen Sätzen deutschsprachigem Zeitungstext

Willkommen beim Wortschatz-Portal

einem Projekt der Universität Leipzig, der Sächsischen Akademie der Wissenschaften zu Leipzig und des Instituts für Angewandte Informatik.


Das internationale Korporaportal bietet Zugriff auf mehr als 900 Korpora der Leipzig Corpora Collection (LCC) in über 250 Sprachen.

Zum Korporaportal

Im CURL-Portal können Sie uns helfen Textmaterial für Sprachen zu sammeln, für die derzeit wenige digitale Ressourcen vorliegen.

Zum CURL-Portal

Die tagesaktuellen Begriffe ausgewählt aus Tageszeitungen und Newsdiensten. Seit April 2002 und auch als RSS! RSS 2.0 RSS Feed Icon

Zu den Wörtern des Tages

Unser neues Buch stellt dar wie digitaler Text mit Hilfe von Text Mining aufbereitet, verarbeitet und in Anwendungen genutzt werden kann. Download Glossar.

Daten und Informationen zum Buch

Die ASV Toolbox ist eine modulare Kollektion verschiedener Werkzeuge zur Auswertung geschriebener Sprache.

Zur Online Toolbox

Die Korpus- und Sprachstatistiken enthalten vielfältige Analysen zu diversen Facetten natürlicher Sprache auf Basis unserer Korpora.

Zu den Korpusstatistiken

Unsere REST Webservices bieten einen direkten Zugriff auf unsere Korpora aus einer beliebigen Software heraus.

Zu den RESTful Webservices

Verschiedene Werkzeuge und umfangreiche Teile unserer Daten können heruntergeladen werden.

Zur Downloadseite

Teile unserer Daten sind auch in RDF verfügbar.

Zum RDF-Portal

Die Daten werden aus sorgfältig ausgewählten öffentlich zugänglichen Quellen automatisch erhoben. Die Beispielsätze werden automatisch ausgewählt und stellen keine Meinungsäußerung des Projektes Deutscher Wortschatz dar. Für die darin enthaltenen Inhalte und Meinungen sind ausschließlich die Autoren verantwortlich. Auch ohne besondere Kennzeichnung unterliegen im Wortschatz wiedergegebene Marken wie Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. den gesetzlichen Bestimmungen. Die synonyme Verwendung eines Trademarks beschreibt nicht notwendigerweise produktspezifische Eigenschaften sondern kennzeichnet stattdessen die Verwendung des Begriffs im allgemeinsprachlichen Kontext.