Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende Überarbeitung | ||
faecher:informatik:oberstufe:codierung:utf8:start [13.10.2021 16:40] – [Beispiele:] Mareike Nutz | faecher:informatik:oberstufe:codierung:utf8:start [Unbekanntes Datum] (aktuell) – gelöscht - Externe Bearbeitung (Unbekanntes Datum) 127.0.0.1 | ||
---|---|---|---|
Zeile 1: | Zeile 1: | ||
- | ====== Zeichendarstellung mit Unicode und UTF-8 ====== | ||
- | |||
- | ===== ASCII – American Standard Code for Information Interchange ===== | ||
- | |||
- | |||
- | {{ : | ||
- | |||
- | In der [[: | ||
- | |||
- | In einem früheren, hauptsächlich in Amerika benutzten Standard waren lediglich die Zeichen von 0 bis 127 definiert, das letzte, achte Bit wurde zur Fehlerüberprüfung verwendet. Erst später wurde das 8. Bit dazu genommen, um weitere Zeichen, wie z.B. die deutschen Umlaute codieren zu können. | ||
- | |||
- | |||
- | ---- | ||
- | {{: | ||
- | === (A1) === | ||
- | |||
- | Wandle die nachfolgenden Wörter, die in Hexadezimal-Darstellung vorliegen, in lesbaren Text um: | ||
- | |||
- | - '' | ||
- | - '' | ||
- | - '' | ||
- | |||
- | Mit einer 8-Bit-Codierung lassen sich nicht mehr Zeichen darstellen, was insbesondere bei anderen Sprachen – wie z.B. griechisch – andere Codierungen nötig machte. Da in diesen Sprachen jedoch die bei uns gebräuchlichen Umlaute nicht benötigt werden, wurde der durch das 8. Bit hinzugekommene Block vom Zeichen 128 bis 255 für die dortigen Zeichen verwendet. Diese und andere länderspezifischen Codierungen lassen sich z.B. unter https:// | ||
- | |||
- | ---- | ||
- | {{: | ||
- | === (A2) === | ||
- | |||
- | Welche der obigen Wörter würden mit den griechischen Zeichensatz falsch dargestellt werden und warum? | ||
- | |||
- | |||
- | ===== Unicode - UTF-8 ===== | ||
- | |||
- | Um Probleme, die sich zum einen mit unterschiedlichen Zeichensätzen, | ||
- | |||
- | * Ist das erste Bit eine 0, so besteht das Zeichen lediglich aus einem Byte, die 128 verbleibenden Möglichkeiten entsprechen dabei genau dem ASCII-Code. | ||
- | * Ansonsten beginnt das erste Byte mit so vielen 1en, wie viele Bytes das Zeichen umfasst. Alle weiteren Bytes beginnen mit '' | ||
- | |||
- | ==== Beispiele: ==== | ||
- | |||
- | y = 79< | ||
- | |||
- | |||