faecher:informatik:oberstufe:codierung:utf8:start

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
Nächste Überarbeitung
Vorhergehende Überarbeitung
Letzte ÜberarbeitungBeide Seiten der Revision
faecher:informatik:oberstufe:codierung:utf8:start [15.10.2021 12:04] sbelfaecher:informatik:oberstufe:codierung:utf8:start [21.09.2022 19:37] – [Beispiele:] sbel
Zeile 76: Zeile 76:
  
 **(3)** **(3)**
-{{ :faecher:informatik:oberstufe:codierung:utf8:cs.png?300|}}+ 
 +{{:faecher:informatik:oberstufe:codierung:utf8:cs.png?160|}} 
 ''乐 -> U+4E50 -> 4E50<sub>16</sub> -> 0100 1110 0101 0000<sub>2</sub>'' ''乐 -> U+4E50 -> 4E50<sub>16</sub> -> 0100 1110 0101 0000<sub>2</sub>''
  
   * 16 Bit Daten zu codieren, dafür braucht man 3 Byte ( 3 x 6 = 18)   * 16 Bit Daten zu codieren, dafür braucht man 3 Byte ( 3 x 6 = 18)
-  * Der UTF-8 Code beginnt also mit der Startsequenz ''111'' +  * Der UTF-8 Code beginnt also mit der Startsequenz ''1110'' 
-  * Dann von rechst beginnend 6 Bit (01 000), das Byte beginnt mit 10 (Regel) also ist das dritte Byte ''1010 1000''+  * Dann von rechts beginnend 6 Bit (01 000), das Byte beginnt mit 10 (Regel) also ist das dritte Byte ''1001 1000''
   * Die nächsten 6 Bit analog:  ''1110 01'' -> ''1011 1001''   * Die nächsten 6 Bit analog:  ''1110 01'' -> ''1011 1001''
   * Die fehlenden 4 Bit ''0100'' mit Padding + Startsequenz (''111'')ergeben das erste Byte ''1110 0100''   * Die fehlenden 4 Bit ''0100'' mit Padding + Startsequenz (''111'')ergeben das erste Byte ''1110 0100''
  
-Die UTF-8 Codierung des Unicode-Zeichens 乔 ist also 3 Byte lang und sieht so aus:  ''1110 0100 1011 1001 1010 0000''+Die UTF-8 Codierung des Unicode-Zeichens 乔 ist also 3 Byte lang und sieht so aus:  ''1110 0100 1011 1001 1001 0000''
  
 ---- ----
Zeile 128: Zeile 130:
   * 4 Bytes: 3+6+6+6 = 21 nutzbare Bits ->  2<sup>21</sup> = 2 097 152 Zeichen   * 4 Bytes: 3+6+6+6 = 21 nutzbare Bits ->  2<sup>21</sup> = 2 097 152 Zeichen
 ++++ ++++
 +
 +==== Material ====
 +
 +{{simplefilelist>.:*}}
 +
 +
  
 ---- ----
 //CC-BY-SA Frank Schiebel, mit Material von Kimmig, ZPG Informatik BW// //CC-BY-SA Frank Schiebel, mit Material von Kimmig, ZPG Informatik BW//