Unterschiede
Hier werden die Unterschiede zwischen zwei Versionen angezeigt.
Beide Seiten der vorigen Revision Vorhergehende Überarbeitung Nächste Überarbeitung | Vorhergehende ÜberarbeitungLetzte ÜberarbeitungBeide Seiten der Revision | ||
faecher:informatik:oberstufe:codierung:utf8:start [13.10.2021 17:24] – [Beispiele:] sbel | faecher:informatik:oberstufe:codierung:utf8:start [21.09.2022 19:37] – [Beispiele:] sbel | ||
---|---|---|---|
Zeile 49: | Zeile 49: | ||
* Ist die Binärdarstellung des Unicode-Codes nicht länger als ein Byte und das das erste Bit eine 0, werden die restlichen 7 Bit gemäß des ASCII Codes verwendet, die 128 verbleibenden Möglichkeiten entsprechen also genau dem ASCII-Code. | * Ist die Binärdarstellung des Unicode-Codes nicht länger als ein Byte und das das erste Bit eine 0, werden die restlichen 7 Bit gemäß des ASCII Codes verwendet, die 128 verbleibenden Möglichkeiten entsprechen also genau dem ASCII-Code. | ||
- | * Ist die Binärdarstellung des Unicode-Codes länger als ein Byte oder der Code ist ein Byte lang und beginnt mit einer '' | + | * Ist die Binärdarstellung des Unicode-Codes länger als ein Byte oder der Code ist ein Byte lang und beginnt mit einer '' |
==== Beispiele: ==== | ==== Beispiele: ==== | ||
Zeile 76: | Zeile 76: | ||
**(3)** | **(3)** | ||
- | {{ : | + | |
- | '' | + | {{: |
+ | |||
+ | '' | ||
* 16 Bit Daten zu codieren, dafür braucht man 3 Byte ( 3 x 6 = 18) | * 16 Bit Daten zu codieren, dafür braucht man 3 Byte ( 3 x 6 = 18) | ||
- | * Der UTF-8 Code beginnt also mit der Startsequenz '' | + | * Der UTF-8 Code beginnt also mit der Startsequenz '' |
- | * Dann von rechst | + | * Dann von rechts |
* Die nächsten 6 Bit analog: | * Die nächsten 6 Bit analog: | ||
* Die fehlenden 4 Bit '' | * Die fehlenden 4 Bit '' | ||
- | Die UTF-8 Codierung des Unicode-Zeichens 乔 ist also 3 Byte lang und sieht so aus: '' | + | Die UTF-8 Codierung des Unicode-Zeichens 乔 ist also 3 Byte lang und sieht so aus: '' |
---- | ---- | ||
Zeile 99: | Zeile 101: | ||
- '' | - '' | ||
- '' | - '' | ||
- | ---- | + | |
+ | ---- | ||
++++ Lösung 1 | | ++++ Lösung 1 | | ||
Zeile 113: | Zeile 116: | ||
1111**0000** 10**011111** 10**011000** 10**001010** | 1111**0000** 10**011111** 10**011000** 10**001010** | ||
++++ | ++++ | ||
+ | |||
+ | |||
+ | ---- | ||
+ | {{: | ||
+ | === (A4) === | ||
+ | |||
+ | Wie viele unterschiedliche Unicode-Zeichen lassen sich theoretisch mit 1 Byte, 2 Bytes, 3 Bytes und 4 Bytes unter Beachtung der UTF-8-Regeln darstellen? | ||
+ | |||
+ | ++++ Lösung | | ||
+ | * 1 Byte: 7 nutzbare Bits -> 2< | ||
+ | * 2 Bytes: 5+6 = 11 nutzbare Bits -> 2< | ||
+ | * 3 Bytes: 4+6+6 = 16 nutzbare Bits -> 2< | ||
+ | * 4 Bytes: 3+6+6+6 = 21 nutzbare Bits -> 2< | ||
+ | ++++ | ||
+ | |||
+ | ==== Material ==== | ||
+ | |||
+ | {{simplefilelist> | ||
+ | |||
+ | |||
---- | ---- | ||
//CC-BY-SA Frank Schiebel, mit Material von Kimmig, ZPG Informatik BW// | //CC-BY-SA Frank Schiebel, mit Material von Kimmig, ZPG Informatik BW// |