Die Datenbasis für die Worthäufigkeit (Frequenzbarometer) bilden gegenwartssprachliche Korpora (DWDS-Kernkorpus und Zeitungen).
Die bibliografische Datenbank des DWDS-Kernkorpus finden Sie hier: https://dwds.de/r/bibl.
Zeitungen sind:
Die Worthäufigkeit errechnet sich wie folgt (Perl-Code):
# $hits == Anzahl der Treffer in Korpora # $total == Gesamtzahl der Tokens in Korpora $frequency = log10( $hits / $total * 1_000_000 ); sub log10 { my $n = shift; return -2 unless $n; my $log = log($n) / log(10); return $log < -2 ? -2 : $log >= 4 ? 4 : sprintf('%.0f', $log); }
Um an die Daten für das Frequenzbarometer zu kommen, können Sie die Schnittstelle unter https://dwds.de/api/frequency nutzen. Der Parameter "q" ist dabei das Lemma, dessen Frequenz angezeigt werden soll. Beispiel: https://dwds.de/api/frequency?q=Haus.
Die Schnittstelle liefert JSON mit folgenden Feldern:
q |
Eingabelemma |
total |
Gesamtanzahl der Tokens in den Korpora |
hits |
Anzahl Treffer passend zum Eingabelemma |
frequency |
Frequenzangabe (Integer zwischen 0 und 6) |
Auch wenn wir viele der Daten im Wortauskunftssystem des DWDS aus rechtlichen
Gründen nicht für eine API öffnen dürfen, so können doch zumindest rudimentäre
Informationen über Wörterbucheinträge abgerufen werden. Der URL
https://dwds.de/api/wb/snippet bietet die
Möglichkeit, die Existenz von Wörterbucheinträgen und (falls vorhanden) Informationen
über die Wortart eines Eintrages abzufragen. Der Parameter "q" ist dabei das Lemma,
über das Informationen abfragt werden wollen. Mehrere Lemmata können mittels Trennung
durch |
(Pipe-Symbol) gleichzeitig abgefragt werden.
Beispiele:
https://dwds.de/api/wb/snippet?q=Haus | einfacher Eintrag mit allen Informationen |
https://dwds.de/api/wb/snippet?q=Haus|Baum | Abfrage mehrere Lemmata |
https://dwds.de/api/wb/snippet?q=Bank | mehrere Wörterbucheinträge (bei Homografen) |
https://dwds.de/api/wb/snippet?q=Ablaß | Abfrage mit nicht (mehr) gültiger Schreibung |
https://dwds.de/api/wb/snippet?q=Industrieholz | Eintrag ohne verzeichnete Wortart |
https://dwds.de/api/wb/snippet?q=Krmbmbl | kein Eintrag im DWDS-Wörterbuch |
Die Schnittstelle liefert eine JSON-Liste mit folgenden Feldern pro entsprechendem Wörterbucheintrag:
input |
Eingabe |
wortart |
Wortart (Substantiv, Verb etc.), falls verzeichnet (sonst null ) |
lemma |
(erste) gültige Schreibung des Eingabelemmas |
url |
URL zur Wortinformationsseite im DWDS |
Korpusergebnisse lassen sich in verschiedenen Formaten exportieren. Als Basis gilt der URL https://dwds.de/r, welcher folgende Parameter akzeptiert:
Parameter | |||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
q |
DDC-Abfrage (obligatorisch) | ||||||||||||||||||||||
corpus |
abzufragendes Korpus (Default: kern) | ||||||||||||||||||||||
date-start |
Datumseinschränkung Treffer (Beginn), als Jahreszahl | ||||||||||||||||||||||
date-end |
Datumseinschränkung Treffer (Ende), als Jahreszahl | ||||||||||||||||||||||
genre |
Textklassen (wenn nicht angegeben, werden Treffer aller Textklassen geliefert) | ||||||||||||||||||||||
format |
Format der Treffer:
|
||||||||||||||||||||||
sort |
Sortierung der Treffer:
|
||||||||||||||||||||||
limit |
Anzahl der Treffer (max. 5 000, Default: 50) | ||||||||||||||||||||||
p |
nte Ergebnisseite (beginnend mit 1) | ||||||||||||||||||||||
view |
|
Beispiele:
https://dwds.de/r?q=Haus&view=csv | Treffer 1 bis 50 für "Haus" aus dem DWDS-Kernkorpus nach Datum absteigend sortiert als CSV |
https://dwds.de/r?q=Haus&p=2&view=csv | Treffer 51 bis 100 für "Haus" aus dem DWDS-Kernkorpus nach Datum absteigend sortiert als CSV |
https://dwds.de/r?q=Haus&limit=100&view=tsv | Treffer 1 bis 100 für "Haus" aus dem DWDS-Kernkorpus nach Datum absteigend sortiert als TSV |
Das Wort des Tages im DWDS können Sie als Atom-Feed unter der Adresse https://dwds.de/api/feed/adt abonnieren.
Viele weitere Möglichkeiten zur Recherche und APIs finden Sie in unserer Korpusplattform dstar.
Bitte beachten Sie, dass dort manche Korpora zugangsgeschützt sind. Alle Korpora, die wir frei zur Verfügung stellen können, sind auch auf der Webseite dwds.de zugänglich (z. T. erst nach Login).