Arithmetisches Kodieren
Das arithmetische Kodieren ist eine Form der Entropiekodierung, die unter anderem zur verlustfreien Datenkompression eingesetzt wird. Dieser Artikel beschreibt nur, wie man mit einem gegebenen Satz von Zeichen-Wahrscheinlichkeits-Paaren einzelne Zeichen so kodieren kann, dass man eine möglichst kleine mittlere Wortlänge benötigt. Dabei ist durch die Entropie (mittlerer Informationsgehalt) eine untere Schranke gegeben (Quellencodierungstheorem). Das immer zu einem Entropiekodierer gehörende Modell der Zeichen-Wahrscheinlichkeiten ist unter Entropiekodierung#Modell beschrieben. Zu den Begründern zählt Jorma Rissanen Ende der 1970er und Anfang der 1980er Jahre.
Wörter
Diese Tabelle zeigt das Beispiel für die Verwendung von Wortlisten zum Extrahieren von Stichwörtern aus dem obigen Text.
Wort | Häufigkeit | Anzahl der Artikel | Relevanz |
---|---|---|---|
kodieren | 3 | 88 | 0.355 |
arithmetische | 2 | 126 | 0.228 |
entropiekodierer | 1 | 4 | 0.155 |
rissanen | 1 | 10 | 0.144 |
wortlänge | 1 | 13 | 0.141 |