Karakterkészletek
A teljesség igénye nélkül, a weben leggyakrabban használt nyelvek és karakterkészletek felsorolása.
| Nyelv | Karakterkészlet |
|---|---|
| Afrikaans (af) | iso-8859-1, windows-1252 |
| Albanian (sq) | iso-8859-1, windows-1252 |
| Arabic (ar) | iso-8859-6 |
| Basque (eu) | iso-8859-1, windows-1252 |
| Bulgarian (bg) | iso-8859-5 |
| Byelorussian (be) | iso-8859-5 |
| Catalan (ca) | iso-8859-1, windows-1252 |
| Croatian (hr) | iso-8859-2 |
| Czech (cs) | iso-8859-2 |
| Danish (da) | iso-8859-1, windows-1252 |
| Dutch (nl) | iso-8859-1, windows-1252 |
| English (en) | iso-8859-1, windows-1252 |
| Esperanto (eo) | iso-8859-3* |
| Estonian (et) | iso-8859-15 |
| Faroese (fo) | iso-8859-1, windows-1252 |
| Finnish (fi) | iso-8859-1, windows-1252 |
| French (fr) | iso-8859-1, windows-1252 |
| Galician (gl) | iso-8859-1, windows-1252 |
| German (de) | iso-8859-1, windows-1252 |
| Greek (el) | iso-8859-7 |
| Hebrew (iw) | iso-8859-8 |
| Hungarian (hu) | iso-8859-2 |
| Icelandic (is) | iso-8859-1, windows-1252 |
| Inuit (Eskimo) languages | iso-8859-10* |
| Irish (ga) | iso-8859-1, windows-1252 |
| Italian (it) | iso-8859-1, windows-1252 |
| Japanese (ja) | shift_jis, iso-2022-jp, euc-jp |
| Lapp | iso-8859-10* |
| Latvian (lv) | iso-8859-13, windows-1257 |
| Lithuanian (lt) | iso-8859-13, windows-1257 |
| Macedonian (mk) | iso-8859-5 |
| Maltese (mt) | iso-8859-3* |
| Norwegian (no) | iso-8859-1, windows-1252 |
| Polish (pl) | iso-8859-2 |
| Portuguese (pt) | iso-8859-1, windows-1252 |
| Romanian (ro) | iso-8859-2 |
| Russian (ru) | koi-8-r, iso-8859-5 |
| Scottish (gd) | iso-8859-1, windows-1252 |
| Serbian (sr) | iso-8859-5 |
| Slovak (sk) | iso-8859-2 |
| Slovenian (sl) | iso-8859-2 |
| Spanish (es) | iso-8859-1, windows-1252 |
| Swedish (sv) | iso-8859-1, windows-1252 |
| Turkish (tr) | iso-8859-9, windows-1254 |
| Ukrainian (uk) | iso-8859-5 |
* = böngészők által gyengén támogatott
Megjegyzendő, hogy az UTF-8 karakterkódolás minden nyelvhez használható – ez az internet ajánlott karakterkészlete. Támogatottsága rohamosan emelkedik.
A HTML héber szövegei esetén az iso-8859-8 használata és az iso-8859-8-i használata felcserélhető (`implicit szövegirány’). Ez eltér az e-mail szabványtól, ahol a kettő élesen különbözik.
Leggyakrabban használt karakterkészletek
Egy, a Babel team által 1997 első félévében elvégzett
felmérés szerint, amelyben 3239 honlapot vizsgáltak meg, a karakterkészletek eloszlási gyakorisága a következő:
| Karakterkészlet | Nyelvek előfordulási gyakorisága | ||
|---|---|---|---|
| iso-8859-2 | 1 | 0.031% | Czech |
| iso-8859-5 | 2 | 0.062% | Russian |
| macintosh | 3 | 0.093% | 1 German, 1 French, 1 Italian |
| windows-850 | 4 | 0.12% | 1 French, 2 German |
| windows-1251 | 6 | 0.19% | Russian |
| windows-1250 | 10 | 0.31% | Czech |
| euc-jp | 12 | 0.37% | Japanese |
| iso-2022-jp | 38 | 1.2% | Japanese |
| shift_jis | 51 | 1.6% | Japanese |
| windows-1252 (includes iso-8859-1) | 3112 | 96% | 4 Malay, 9 Danish, 14 Finnish, 19 Norwegian, 20 Dutch, 21 Portugese, 30 Italian, 35 Swedish, 38 Spanish, 57 French, 143 German, 2722 English |
(A számolás nem a charset attribútumok alapján történt, hanem automatikus vizsgálat segítségével, mivel a charset attribútumok gyakran hiányoztak, vagy hibásak voltak.)



Szólj hozzá!