UTF-16: Różnice pomiędzy wersjami

Dodane 500 bajtów ,  5 lat temu
m
drobne merytoryczne
m (meryt)
m (drobne merytoryczne)
* wartość tworzona przez najstarsze 10 bitów tej liczby jest dodawana do 0xD800 i otrzymuje się bardziej znaczące 16-bitowe słowo z zakresu od 0xD800 do 0xDBFF;
* pozostałe 10 młodszych bitów jest dodawane do 0xDC00, co daje mniej znaczące 16-bitowe słowo z zakresu od 0xDC00 do 0xDFFF.
 
Kodowanie to przedstawia poniższa tabela:
{| class="wikitable" style="text-align: center"
|+
|'''KOD'''
!{{kolor|#0070FF|DC00}}
!{{kolor|#0070FF|DC01}}
!{{kolor|#0070FF|   …   }}
!{{kolor|#0070FF|DFFF}}
|-
!{{kolor|#00AA00|D800}}
|010000||010001||…||0103FF
|-
!{{kolor|#00AA00|D801}}
|010400||010401||…||0107FF
|-align="center"
!{{kolor|#00AA00|  ⋮}}
|⋮||⋮||⋱||⋮
|-
!{{kolor|#00AA00|DBFF}}
|10FC00||10FC01||…||10FFFF
|}
 
Na przykład znak o kodzie U+10000 zostanie zamieniony na sekwencję 0xD800 0xDC00, zaś znak o kodzie 0x10FFFF (górna granica unikodu) na 0xDBFF 0xDFFF. W standardzie [[Unicode]] pozycjom z przedziału od U+D800 do U+DFFF nie są przypisane żadne [[symbol|znaki]], zatem każda sekwencja słów kodowych jest interpretowana jednoznacznie.