Endian
Zur Erkennung wird die Byte Order Magnitude (BOM) verwendet.
Little Endian BOM: FFFE Big Endian BOM: FFFF
BMP
Der Codepoint ist zwischen 0000 und FFFF
Innerhalb des BMPs
wird der Codepoint 1:1 übersetzt
z.B. U+0062 (b) = UTF16BE 0062
Außerhalb der BMPs
- Codepoint in Binär umrechnen
- 65536 bzw. 0001 0000 0000 0000 0000 abziehen
- in 2 Zehn Bit Zahlen aufteilen
- erste Hälfte D800 bzw. 1101 1000 00 addieren
- zweite Hälfte DC00 bzw. 11 0111 0000 addieren
- Die Hälften wieder zusammenfügen und in Hex umwandeln