HTML Info

Webről, magyarul, mindenkinek

Karakterkészletek

nincs megjegyzés

A teljesség igénye nélkül, a weben leggyakrabban használt nyelvek és karakterkészletek felsorolása.

Nyelv Karakterkészlet
Afrikaans (af) iso-8859-1, windows-1252
Albanian (sq) iso-8859-1, windows-1252
Arabic (ar) iso-8859-6
Basque (eu) iso-8859-1, windows-1252
Bulgarian (bg) iso-8859-5
Byelorussian (be) iso-8859-5
Catalan (ca) iso-8859-1, windows-1252
Croatian (hr) iso-8859-2
Czech (cs) iso-8859-2
Danish (da) iso-8859-1, windows-1252
Dutch (nl) iso-8859-1, windows-1252
English (en) iso-8859-1, windows-1252
Esperanto (eo) iso-8859-3*
Estonian (et) iso-8859-15
Faroese (fo) iso-8859-1, windows-1252
Finnish (fi) iso-8859-1, windows-1252
French (fr) iso-8859-1, windows-1252
Galician (gl) iso-8859-1, windows-1252
German (de) iso-8859-1, windows-1252
Greek (el) iso-8859-7
Hebrew (iw) iso-8859-8
Hungarian (hu) iso-8859-2
Icelandic (is) iso-8859-1, windows-1252
Inuit (Eskimo) languages iso-8859-10*
Irish (ga) iso-8859-1, windows-1252
Italian (it) iso-8859-1, windows-1252
Japanese (ja) shift_jis, iso-2022-jp, euc-jp
Lapp iso-8859-10*
Latvian (lv) iso-8859-13, windows-1257
Lithuanian (lt) iso-8859-13, windows-1257
Macedonian (mk) iso-8859-5
Maltese (mt) iso-8859-3*
Norwegian (no) iso-8859-1, windows-1252
Polish (pl) iso-8859-2
Portuguese (pt) iso-8859-1, windows-1252
Romanian (ro) iso-8859-2
Russian (ru) koi-8-r, iso-8859-5
Scottish (gd) iso-8859-1, windows-1252
Serbian (sr) iso-8859-5
Slovak (sk) iso-8859-2
Slovenian (sl) iso-8859-2
Spanish (es) iso-8859-1, windows-1252
Swedish (sv) iso-8859-1, windows-1252
Turkish (tr) iso-8859-9, windows-1254
Ukrainian (uk) iso-8859-5

*   = böngészők által gyengén támogatott

Megjegyzendő, hogy az UTF-8 karakterkódolás minden nyelvhez használható – ez az internet ajánlott karakterkészlete. Támogatottsága rohamosan emelkedik.

A HTML héber szövegei esetén az iso-8859-8 használata és az iso-8859-8-i használata felcserélhető (`implicit szövegirány’). Ez eltér az e-mail szabványtól, ahol a kettő élesen különbözik.

Leggyakrabban használt karakterkészletek

Egy, a Babel team által 1997 első félévében elvégzett
felmérés szerint, amelyben 3239 honlapot vizsgáltak meg, a karakterkészletek eloszlási gyakorisága a következő:

Karakterkészlet Nyelvek előfordulási gyakorisága
iso-8859-2 1 0.031% Czech
iso-8859-5 2 0.062% Russian
macintosh 3 0.093% 1 German, 1 French, 1 Italian
windows-850 4 0.12% 1 French, 2 German
windows-1251 6 0.19% Russian
windows-1250 10 0.31% Czech
euc-jp 12 0.37% Japanese
iso-2022-jp 38 1.2% Japanese
shift_jis 51 1.6% Japanese
windows-1252 (includes iso-8859-1) 3112 96% 4 Malay, 9 Danish, 14 Finnish, 19 Norwegian, 20 Dutch, 21 Portugese,
30 Italian, 35 Swedish, 38 Spanish, 57 French, 143 German, 2722 English

(A számolás nem a charset attribútumok alapján történt, hanem automatikus vizsgálat segítségével, mivel a charset attribútumok gyakran hiányoztak, vagy hibásak voltak.)


w3c_home Bert Bos, i18n coordinator

Írta: htmlinfo

2009. 04 02 at 7:26 pm

Kategória:

Megjegyzés hozzáfűzése