HTML karakterkódolás, karakterkészlet megadása (HTML meta charset)
Ahhoz, hogy a weboldalunk megfelelően jelenjen meg a böngészőben, nagyon fontos megadnunk a megfelelő karakterkódolást. A karakterkódolás angolul charset-ként hivatkoznak. Bár ez valójában nem karakterkódolást, hanem karakterkészletet jelent. A charset, illetve a karakterkészlet arra utal, hogy milyen karakterek használhatóak.
Milyen karakterkódolást használjak?
Az UTF-8 tartalmazza az összes magyar betűt és karaktert. A HTML5 alapértelmezett karakterkészlete az UTF-8, amely tartalmazza szinte a világ összes karakterét és szimbólumát.
Karakterkészlet megadása
Ha szeretnénk a HTML dokumentumunkban meghatározni a karakterkódolást, akkor az alábbi kódot kell elhelyeznünk a HTML dokumentum fej, azaz HEAD részében:
<meta charset="UTF-8">
Code language: HTML, XML (xml)
Ha nem UTF-8-as karakterkódolást szeretnénk használni, akkor a charset= attribútum után adjuk meg a számunkra megfelelő karakterkódolást. Például ASCII, ANSI stb.
HTML karakterhivatkozások
A HTML karakterhivatkozások (vagy entitások) olyan speciális karakterek, amelyek azért lettek kitalálva, mert vannak olyan speciális karakterek, amelyek alkalmasak arra, hogy a böngésző összekeverje őket egy HTML tag nyitó vagy zárókarakterével. Például egy „kisebb, mint” (<) jel esetében a böngésző gondolhatja úgy, hogy ez egy HTML tag kezdőkaraktere, ebben az esetben a HTML kód értelmezhetetlenné válna onnantól, vagy legjobb esetben is csak szétcsúszna az oldal. A karakterhivatkozásokkal különböző fenntartott HTML karaktereket tudunk a böngésző számára is könnyen értelmezhetővé és megjeleníthetővé tenni.
Karakter | Megnevezés | Entitás név | Entitás szám |
---|---|---|---|
nem törhető szóköz | |   | |
< | kisebb, mint | < | < |
> | nagyobb, mint | > | > |
& | és | & | & |
„ | dupla idézőjel | " | " |
‘ | aposztróf | ' | ' |
¢ | cent | ¢ | ¢ |
£ | font | £ | £ |
¥ | jen | ¥ | ¥ |
€ | euró | &euro | € |
© | copyright | © | © |
® | bejegyzett védjegy | ® | ® |