Unicode
Unicode (Aussprachen: am. Englisch [ˈjuːnikoʊd], brit. Englisch [ˈjuːnikəʊd]; dt. [ˈjuːnikoːt]) ist ein internationaler Standard, in dem langfristig für jedes sinnvolle Schriftzeichen oder Textelement aller bekannten Schriftkulturen und Zeichensysteme ein digitaler Code festgelegt wird. Ziel ist es, die Verwendung unterschiedlicher und inkompatibler Kodierungen in verschiedenen Ländern oder Kulturkreisen zu beseitigen. Unicode wird ständig um Zeichen weiterer Schriftsysteme ergänzt. ISO 10646 ist die von ISO verwendete, praktisch bedeutungsgleiche Bezeichnung des Unicode-Zeichensatzes; er wird dort als Universal Coded Character Set (UCS) bezeichnet.
Wörter
Diese Tabelle zeigt das Beispiel für die Verwendung von Wortlisten zum Extrahieren von Stichwörtern aus dem obigen Text.
Wort | Häufigkeit | Anzahl der Artikel | Relevanz |
---|---|---|---|
unicode | 4 | 265 | 0.407 |
iso | 2 | 1908 | 0.159 |
schriftkulturen | 1 | 2 | 0.157 |
unicode-schriftart | 1 | 3 | 0.153 |
unicode-zeichensatzes | 1 | 5 | 0.147 |