Kodowanie polskich znaków
(Przekierowano z Sposób kodowania polskich znaków)
Początkowo stosowanie polskich znaków było ograniczone technicznymi możliwościami urządzeń wejścia-wyjścia, potem również nieprzystosowaniem zagranicznego oprogramowania do języka polskiego. Z czasem pojawiły się Polskie Normy, były one jednak mało praktyczne, podobnie jak normy międzynarodowe. W konsekwencji w użyciu było wiele nieoficjalnych standardów. Problem można uznać obecnie za rozwiązany przez standard Unicode.
Kodowanie polskich liter ze znakami diakrytycznymi w różnych standardach:
Standard | Ą | Ć | Ę | Ł | Ń | Ó | Ś | Ź | Ż | ą | ć | ę | ł | ń | ó | ś | ź | ż |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ISO-8859-2 (ISO Latin-2, PN-93 T-42118) | 161 | 198 | 202 | 163 | 209 | 211 | 166 | 172 | 175 | 177 | 230 | 234 | 179 | 241 | 243 | 182 | 188 | 191 |
#A1 | #C6 | #CA | #A3 | #D1 | #D3 | #A6 | #AC | #AF | #B1 | #E6 | #EA | #B3 | #F1 | #F3 | #B6 | #BC | #BF | |
Windows-1250 (Windows CE) | 165 | 198 | 202 | 163 | 209 | 211 | 140 | 143 | 175 | 185 | 230 | 234 | 179 | 241 | 243 | 156 | 159 | 191 |
#A5 | #C6 | #CA | #A3 | #D1 | #D3 | #8C | #8F | #AF | #B9 | #E6 | #EA | #B3 | #F1 | #F3 | #9C | #9F | #BF | |
CP852 (DOS Latin II) | 164 | 143 | 168 | 157 | 227 | 224 | 151 | 141 | 189 | 165 | 134 | 169 | 136 | 228 | 162 | 152 | 171 | 190 |
#A4 | #8F | #A8 | #9D | #E3 | #E0 | #97 | #8D | #BD | #A5 | #86 | #A9 | #88 | #E4 | #A2 | #98 | #AB | #BE | |
Mac OS Central Europe | 132 | 140 | 162 | 252 | 193 | 238 | 229 | 143 | 251 | 136 | 141 | 171 | 184 | 196 | 151 | 230 | 144 | 253 |
#84 | #8C | #A2 | #FC | #C1 | #EE | #E5 | #8F | #FB | #88 | #8D | #AB | #B8 | #C4 | #97 | #E6 | #90 | #FD | |
Mazovia | 143 | 149 | 144 | 156 | 165 | 163 | 152 | 160 | 161 | 134 | 141 | 145 | 146 | 164 | 162 | 158 | 166 | 167 |
#8F | #95 | #90 | #9C | #A5 | #A3 | #98 | #A0 | #A1 | #86 | #8D | #91 | #92 | #A4 | #A2 | #9E | #A6 | #A7 | |
bazowe litery łacińskie | 65 | 67 | 69 | 76 | 78 | 79 | 83 | 90 | 90 | 97 | 99 | 101 | 108 | 110 | 111 | 115 | 122 | 122 |
#41 | #43 | #45 | #4C | #4E | #4F | #53 | #5A | #5A | #61 | #63 | #65 | #6C | #6E | #6F | #73 | #7A | #7A | |
Unicode | 260 | 262 | 280 | 321 | 323 | 211 | 346 | 377 | 379 | 261 | 263 | 281 | 322 | 324 | 243 | 347 | 378 | 380 |
#104 | #106 | #118 | #141 | #143 | #D3 | #15A | #179 | #17B | #105 | #107 | #119 | #142 | #144 | #F3 | #15B | #17A | #17C | |
Unicode w transformacji UTF-8 | #C4 #84 |
#C4 #86 |
#C4 #98 |
#C5 #81 |
#C5 #83 |
#C3 #93 |
#C5 #9A |
#C5 #B9 |
#C5 #BB |
#C4 #85 |
#C4 #87 |
#C4 #99 |
#C5 #82 |
#C5 #84 |
#C3 #B3 |
#C5 #9B |
#C5 #BA |
#C5 #BC |
ISO 8859-13 (ISO Latin-7) | 192 | 195 | 198 | 217 | 209 | 211 | 218 | 202 | 221 | 224 | 227 | 230 | 249 | 241 | 243 | 250 | 234 | 253 |
#C0 | #C3 | #C6 | #D9 | #D1 | #D3 | #DA | #CA | #DD | #E0 | #E3 | #E6 | #F9 | #F1 | #F3 | #FA | #EA | #FD | |
ISO 8859-16 (ISO Latin-10) | 161 | 197 | 221 | 163 | 209 | 211 | 215 | 172 | 175 | 162 | 229 | 253 | 179 | 241 | 243 | 247 | 174 | 191 |
#A1 | #C5 | #DD | #A3 | #D1 | #D3 | #D7 | #AC | #AF | #A2 | #E5 | #FD | #B3 | #F1 | #F6 | #F7 | #AE | #BF | |
Windows-1257 (Windows Baltic) | 192 | 195 | 198 | 217 | 209 | 211 | 218 | 202 | 221 | 224 | 227 | 230 | 249 | 241 | 243 | 250 | 234 | 253 |
#C0 | #C3 | #C6 | #D9 | #D1 | #D3 | #DA | #CA | #DD | #E0 | #E3 | #E6 | #F9 | #F1 | #F3 | #FA | #EA | #FD | |
CP775 (DOS Baltic) | 181 | 128 | 183 | 173 | 227 | 224 | 151 | 141 | 163 | 208 | 135 | 210 | 136 | 231 | 162 | 152 | 165 | 164 |
#B5 | #80 | #B7 | #AD | #E0 | #E3 | #97 | #8D | #A3 | #D0 | #87 | #D2 | #88 | #E7 | #A2 | #98 | #A5 | #A4 | |
POL 1 | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 167 | 168 |
#80 | #81 | #82 | #83 | #84 | #85 | #86 | #87 | #88 | #A0 | #A1 | #A2 | #A3 | #A4 | #A5 | #A6 | #A7 | #A8 | |
ATM | 196 | 199 | 203 | 208 | 209 | 211 | 214 | 218 | 220 | 228 | 231 | 235 | 240 | 241 | 243 | 246 | 250 | 252 |
AmigaPL (system Amiga OS) | 194 | 202 | 203 | 206 | 207 | 211 | 212 | 218 | 219 | 226 | 234 | 235 | 238 | 239 | 243 | 244 | 250 | 251 |
xJP (system Amiga OS) | 198 | 199 | 202 | 206 | 209 | 211 | 213 | 219 | 222 | 230 | 231 | 234 | 238 | 241 | 243 | 245 | 251 | 254 |
Atari-Calamus | 193 | 194 | 195 | 196 | 197 | 198 | 199 | 200 | 201 | 209 | 210 | 211 | 212 | 213 | 214 | 215 | 216 | 217 |
CSK | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 136 | 135 | 160 | 161 | 162 | 163 | 164 | 165 | 166 | 168 | 167 |
CorelDraw | 197 | 242 | 201 | 163 | 209 | 211 | 255 | 225 | 237 | 229 | 236 | 230 | 198 | 241 | 243 | 165 | 170 | 186 |
Cyfromat | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 136 | 135 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 152 | 151 |
DHN | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 136 | 135 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 145 | 144 |
ELWRO-Junior | 193 | 195 | 197 | 204 | 206 | 207 | 211 | 218 | 217 | 225 | 227 | 229 | 236 | 238 | 239 | 243 | 250 | 249 |
IEA-Świerk | 143 | 128 | 144 | 156 | 165 | 153 | 235 | 157 | 146 | 160 | 155 | 130 | 159 | 164 | 162 | 135 | 168 | 145 |
IINTE-ISIS | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 144 | 145 | 146 | 147 | 148 | 149 | 150 | 151 | 152 |
Logic | 128 | 129 | 130 | 131 | 132 | 133 | 134 | 135 | 136 | 137 | 138 | 139 | 140 | 141 | 142 | 143 | 144 | 145 |
Microvex | 143 | 128 | 144 | 156 | 165 | 147 | 152 | 157 | 146 | 160 | 155 | 130 | 159 | 164 | 162 | 135 | 168 | 145 |
TeXPL | 129 | 130 | 134 | 138 | 139 | 211 | 145 | 153 | 155 | 161 | 162 | 166 | 170 | 171 | 243 | 177 | 185 | 187 |
Ventura Publisher | 151 | 153 | 165 | 166 | 146 | 143 | 142 | 144 | 128 | 150 | 148 | 164 | 167 | 145 | 162 | 132 | 130 | 135 |
CP870 (IBM EBCDIC) | #B1 | #69 | #72 | #BA | #BB | #EE | #AA | #B9 | #B4 | #A0 | #49 | #52 | #9A | #9B | #CE | #8A | #B7 | #B2 |
Nazwane encje HTML | Ą | Ć | Ę | Ł | Ń | Ó | Ś | Ź | Ż | ą | ć | ę | ł | ń | ó | ś | ź | ż |
Legenda:
#xx – zapis w systemie szesnastkowym
Zobacz też
edytujBibliografia
edytuj- Janusz S. Bień: Wybrane standardy przetwarzania tekstów. 1993, s. 8. [dostęp 2016-12-11].
- Janusz S. Bień. Kodowanie tekstów polskich w systemach komputerowych. „Postscriptum”, 1999. ISSN 1427-0501. [dostęp 2016-12-26].
Linki zewnętrzne
edytuj- ConvPL i QueryPL – konwersja i rozpoznawanie polskich znaków. ipsec.pl. [zarchiwizowane z tego adresu (2013-01-26)]., kopia na Sourceforge (programy Pawła „kravietZa” Krawczyka, brak obsługi Unicode/UTF)