UTF-9 i UTF-18: Różnice pomiędzy wersjami

[wersja przejrzana][wersja przejrzana]
Usunięta treść Dodana treść
nowa strona
 
m dr. tech.
Linia 4:
__NOTOC__
==Szczegóły==
UTF-9 (Unicode Transformation Format-9) jest formatem kodowania znaków o zmiennej długości. Najstarszy bit każdego nonetu (tj. 9-bitowego bajtu) używany jest jako flaga kontynuacji, pozostały oktet to kod znaku w standardzie ISO-10646. Dla znaków 0x0-0xFF oznacza to pełną wsteczną kompatybilność. W UTF-9 możliwe jest zakodowanie wszystkich znaków Unikodu, więc nie ma potrzeby stosowania kodów zastępczych z przedziału U+D800 - U+DBFF
 
{| class="wikitable"
|- style="background-color: silver ; width: 100%; color: black; text-align: center; font-weight:bold"
| colspan="4" | Przykłady kodowań UTF-9
|-
! Znak !! Kod UNICODE !! kod UTF-9 [[Ósemkowy system liczbowy|(hexoct)]] !! kod UTF-8 (dla porównania)
|-
| A || U+0041||101||101
|-
| Ą || U+0104 ||401- 004||304-204
|-
| 가 ||U+AC00 || 654- 000<ref>UWAGA: te zera nie są błędem, i nie oznaczają "końca łańcucha"</ref>||352- 260- 200
|-
| 𝌌 ||U+1D30C || 401- 323- 014|| 360- 235- 214- 214
|}
 
 
==Zalety i wady==
'''Zalety:'''