Projekt Deutscher Wortschatz: WebServices

[Wortschatz:SOAP] Mit den Webservices ist ein direkter Zugriff auf die Daten des Projektes Deutscher Wortschatz aus einer beliebigen Software heraus möglich. Dazu gehören nicht nur Java-Programme, sondern auch Programme beliebiger anderer Sprachen, da die Schnittstelle (SOAP) standardisiert und offengelegt ist. Nach und nach werden mehr und komplexere Daten, Datenzusammenhänge und sogar Algorithmen von uns über diese Schnittstelle angeboten.

Es gibt mehrere verschiedene Zugangsarten:

Unser Service

Zu jedem einzelnen Webservice wird auch ein generischer Beispielclient mitsamt den Quellen zur Verfügung gestellt, welcher zwei Zwecke erfüllen soll:

  1. Er soll es dem normalen Nutzer erlauben, die Services einfach auszuprobieren.
  2. Die Quelltexte sollen Programmierern zeigen, wie sie die Webservices in ihre Programme einbauen können. Handelt es sich dabei um Javaprogramme ist die Integration sogar sehr einfach - einfach die Klasse aus der heruntergeladenen .jar so modifizieren, wie es für die eigene Applikation benötigt wird.

Natürlich heißt das nicht, dass jeder Webservice für sich allein benutzt werden muss. Programmierer können die Services in beliebigen Zusammenstellungen und Reihenfolgen aufrufen und die Daten miteinander kombinieren.

Für die prominentesten Webservices gibt es auch jeweils eine eigene Webseite mit Beispielen und Erklärungen.

Die Liste der Services

Die automatisch generierte und somit stets aktuelle Liste der derzeitig verfügbaren Webservices läßt sich unter diesem Link einsehen: http://wortschatz.uni-leipzig.de/axis/servlet/ServiceOverviewServlet

Um einen einfachen Überblick zu erlangen, reicht es, sich diese Tabelle anzuschauen:
ServiceOverview Gibt einen Überblick über die momentan verfügbaren Services.
Cooccurrences Liefert die als statistisch signifikant errechneten Kookkurrenzen.
Grundform Liefert zu einem Wort die Grundform, sowie die Wortklasse.
SentencesToWord Liefert zu einem Wort Beispielsätze.
RightOccurrences Gibt zu einem Eingabewort die als statistisch signifikant errechneten rechten Nachbarn.
LeftOccurrences Gibt zu einem Eingabewort die als statistisch signifikant errechneten linken Nachbarn.
Frequency Gibt die Frequenz, sowie die Häufigkeitsklasse eines Services.
Synonyms Gibt Synonyme zu einem Eingabewort.

Externe Implementierungen

Um unsere Webservices von Perl aus einzusetzen, können Sie "Lingua-DE-Wortschatz" von Daniel Schröer einsetzen. Das dazu nötige Paket gibt es via CPAN.

Nicolas Zimmer hat in seinem Klassifikator Blog beschrieben, wie die Wortschatz Webservices mit einer von ihm entwickelten PHP-Bibliothek genutzt werden können. Die Bibliothek steht unter der GPLv3.

Der Klassifikator Blog ist leider nicht mehr verügbar. Die Inhalte können jedoch noch im Webarchiv" eingesehen werden.

Eine Erweiterung dieser Bibliothek wurde von Markus Siebeneicher vorgenommen und steht hier zum Download bereit. Auch diese Erweiterung steht unter der GPLv3.

Wer lieber mit Python arbeitet, kann die von Robert Lehmann entwickelte Bibliothek libleipzig-python benutzen.

Eine Implementierung der Wortschatz-Webservices API für Ruby von Andrej Belenkow

Eine Implementierung für C# von Raffael Herrmann steht ebenfalls bereit (Lizenz: MIT).

Valid XHTML 1.0!