HTML хуудсыг зөв харуулахын тулд вэб хөтөч аль тэмдэгтийн тохиргоог ашиглахаа мэддэг байх ёстой.
From ASCII to UTF-8 #
ASCII нь тэмдэгт кодчиллын анхны стандарт байв. ASCII нь интернэтэд ашиглаж болох 128 өөр тэмдэгтийг тодорхойлсон: тоонууд (0-9), англи үсгүүд (A-Z) онцгой тэмдэгт ! $ + – () @ <>.
ISO-8859-1 бол HTML 4-ийн анхдагч тэмдэгтийн багц байсан. Энэ тэмдэгтийн багц нь 256 өөр тэмдэгтийн кодыг дэмждэг. HTML 4 нь мөн UTF-8-ийг дэмждэг байсан.
ANSI (Windows-1252) нь Windows-ийн анхны тэмдэгтүүд байсан. ANSI нь ISO-8859-1-тэй ижил бөгөөд зөвхөн ANSI нь 32 нэмэлт тэмдэгттэй байдаг.
HTML5 тодорхойлолт нь вэб хөгжүүлэгчдийг дэлхийн бараг бүх тэмдэгт, тэмдэгтүүдийг багтаасан UTF-8 тэмдэгтийн багцыг ашиглахыг уриалдаг!
HTML charset Шинж чанар #
HTML хуудсыг зөв харуулахын тулд вэб хөтөч тухайн хуудсанд ашигласан тэмдэгтүүдийн багцыг мэддэг байх ёстой.
This is specified in the <meta> tag:
Энэ нь <meta> тэмдэглэгээгээр тодорхойлогдоно
<meta charset="UTF-8">
Тэмдэгтийн багц хоорондын ялгаа #
Дараах хүснэгтэн дээр тэмдэгтүүдийн хоорондох ялгааг харуулав.
| Numb | ASCII | ANSI | 8859 | UTF-8 | Description |
|---|---|---|---|---|---|
| 32 | Хоосон зай | ||||
| 33 | ! | ! | ! | ! | анхаарлын тэмдэг |
| 34 | “ | “ | “ | “ | хашилт |
| 35 | # | # | # | # | тооны тэмдэг |
| 36 | $ | $ | $ | $ | долларын тэмдэг |
| 37 | % | % | % | % | хувь тэмдэг |
| 38 | & | & | & | & | амперсанд |
| 39 | ‘ | ‘ | ‘ | ‘ | апостроф |
| 40 | ( | ( | ( | ( | зүүн хаалт |
| 41 | ) | ) | ) | ) | Баруун хаалт |
| 42 | * | * | * | * | од |
| 43 | + | + | + | + | нэмэх тэмдэг |
| 44 | , | , | , | , | Таслал |
| 45 | – | – | – | – | Хасах тэмдэг |
| 46 | . | . | . | . | Цэг |
| 47 | / | / | / | / | Баруун налуу зураас |
| 48 | 0 | 0 | 0 | 0 | тэг |
| 49 | 1 | 1 | 1 | 1 | Нэгийн тоо |
| 50 | 2 | 2 | 2 | 2 | Хоёрын тоо |
| 51 | 3 | 3 | 3 | 3 | Гуравын тоо |
| 52 | 4 | 4 | 4 | 4 | Дөрөвийн тоо |
| 53 | 5 | 5 | 5 | 5 | digit five |
| 54 | 6 | 6 | 6 | 6 | digit six |
| 55 | 7 | 7 | 7 | 7 | Тавийн тоо |
| 56 | 8 | 8 | 8 | 8 | намын тоо |
| 57 | 9 | 9 | 9 | 9 | есийн тоо |
| 58 | : | : | : | : | хоёр цэг |
| 59 | ; | ; | ; | ; | цэг таслал |
| 60 | < | < | < | < | Багын тэмдэг |
| 61 | = | = | = | = | Тэнцүүгийн тэмдэг |
| 62 | > | > | > | > | Ихийн тэмдэг |
| 63 | ? | ? | ? | ? | Асуултын тэмдэг |
| 64 | @ | @ | @ | @ | commercial at |
| 65 | A | A | A | A | Латин том үсэг A |
| 66 | B | B | B | B | Латин том үсэг B |
| 67 | C | C | C | C | Латин том үсэг C |
| 68 | D | D | D | D | Латин том үсэг D |
| 69 | E | E | E | E | Латин том үсэг E |
| 70 | F | F | F | F | Латин том үсэг F |
| 71 | G | G | G | G | Латин том үсэг G |
| 72 | H | H | H | H | Латин том үсэг H |
| 73 | I | I | I | I | Латин том үсэг I |
| 74 | J | J | J | J | Латин том үсэг J |
| 75 | K | K | K | K | Латин том үсэг K |
| 76 | L | L | L | L | Латин том үсэг L |
| 77 | M | M | M | M | Latin capital letter M |
| 78 | N | N | N | N | Латин том үсэг N |
| 79 | O | O | O | O | Латин том үсэг O |
| 80 | P | P | P | P | Латин том үсэг P |
| 81 | Q | Q | Q | Q | Латин том үсэг Q |
| 82 | R | R | R | R | Латин том үсэг R |
| 83 | S | S | S | S | Латин том үсэг S |
| 84 | T | T | T | T | Латин том үсэг T |
| 85 | U | U | U | U | Латин том үсэг U |
| 86 | V | V | V | V | Латин том үсэг V |
| 87 | W | W | W | W | Латин том үсэг W |
| 88 | X | X | X | X | Латин том үсэг X |
| 89 | Y | Y | Y | Y | Латин том үсэг Y |
| 90 | Z | Z | Z | Z | Латин том үсэг Z |
| 91 | [ | [ | [ | [ | зүүн дөрвөлжин хаалт |
| 92 | \ | \ | \ | \ | Зүүн налуу хаалт |
| 93 | ] | ] | ] | ] | баруун дөрвөлжин хаалт |
| 94 | ^ | ^ | ^ | ^ | Circumflex өргөлт |
| 95 | _ | _ | _ | _ | Доогуур зураас |
| 96 | ` | ` | ` | ` | ноцтой өргөлт |
| 97 | a | a | a | a | Латин жижиг үсэг a |
| 98 | b | b | b | b | Латин жижиг үсэг b |
| 99 | c | c | c | c | Латин жижиг үсэг c |
| 100 | d | d | d | d | Латин жижиг үсэг d |
| 101 | e | e | e | e | Латин жижиг үсэг e |
| 102 | f | f | f | f | Латин жижиг үсэг f |
| 103 | g | g | g | g | Латин жижиг үсэг g |
| 104 | h | h | h | h | Латин жижиг үсэг h |
| 105 | i | i | i | i | Латин жижиг үсэг i |
| 106 | j | j | j | j | Латин жижиг үсэг j |
| 107 | k | k | k | k | Латин жижиг үсэг k |
| 108 | l | l | l | l | Латин жижиг үсэг l |
| 109 | m | m | m | m | Латин жижиг үсэг m |
| 110 | n | n | n | n | Латин жижиг үсэг n |
| 111 | o | o | o | o | Латин жижиг үсэг o |
| 112 | p | p | p | p | Латин жижиг үсэг p |
| 113 | q | q | q | q | Латин жижиг үсэг q |
| 114 | r | r | r | r | Латин жижиг үсэг r |
| 115 | s | s | s | s | Латин жижиг үсэг s |
| 116 | t | t | t | t | Латин жижиг үсэг t |
| 117 | u | u | u | u | Латин жижиг үсэг u |
| 118 | v | v | v | v | Латин жижиг үсэг v |
| 119 | w | w | w | w | Латин жижиг үсэг w |
| 120 | x | x | x | x | Латин жижиг үсэг x |
| 121 | y | y | y | y | Латин жижиг үсэгy |
| 122 | z | z | z | z | Латин жижиг үсэг z |
| 123 | { | { | { | { | зүүн буржгар хаалт |
| 124 | | | | | | | | | босоо шугам |
| 125 | } | } | } | } | баруун буржгар хаалт |
| 126 | ~ | ~ | ~ | ~ | tilde |
| 127 | DEL | ||||
| 128 | € | евро тэмдэг | |||
| 129 | | | | NOT USED | |
| 130 | ‚ | single low-9 quotation mark | |||
| 131 | ƒ | Latin small letter f with hook | |||
| 132 | „ | double low-9 quotation mark | |||
| 133 | … | horizontal ellipsis | |||
| 134 | † | dagger | |||
| 135 | ‡ | double dagger | |||
| 136 | ˆ | modifier letter circumflex accent | |||
| 137 | ‰ | per mille sign | |||
| 138 | Š | Latin capital letter S with caron | |||
| 139 | ‹ | single left-pointing angle quotation mark | |||
| 140 | Œ | Latin capital ligature OE | |||
| 141 | | | | NOT USED | |
| 142 | Ž | Latin capital letter Z with caron | |||
| 143 | | | | NOT USED | |
| 144 | | | | NOT USED | |
| 145 | ‘ | left single quotation mark | |||
| 146 | ’ | right single quotation mark | |||
| 147 | “ | left double quotation mark | |||
| 148 | ” | right double quotation mark | |||
| 149 | • | bullet | |||
| 150 | – | en dash | |||
| 151 | — | em dash | |||
| 152 | ˜ | small tilde | |||
| 153 | ™ | trade mark sign | |||
| 154 | š | Latin small letter s with caron | |||
| 155 | › | single right-pointing angle quotation mark | |||
| 156 | œ | Latin small ligature oe | |||
| 157 | | | | NOT USED | |
| 158 | ž | Latin small letter z with caron | |||
| 159 | Ÿ | Latin capital letter Y with diaeresis | |||
| 160 | no-break space | ||||
| 161 | ¡ | ¡ | ¡ | inverted exclamation mark | |
| 162 | ¢ | ¢ | ¢ | cent sign | |
| 163 | £ | £ | £ | pound sign | |
| 164 | ¤ | ¤ | ¤ | currency sign | |
| 165 | ¥ | ¥ | ¥ | yen sign | |
| 166 | ¦ | ¦ | ¦ | broken bar | |
| 167 | § | § | § | section sign | |
| 168 | ¨ | ¨ | ¨ | diaeresis | |
| 169 | © | © | © | copyright sign | |
| 170 | ª | ª | ª | feminine ordinal indicator | |
| 171 | « | « | « | left-pointing double angle quotation mark | |
| 172 | ¬ | ¬ | ¬ | not sign | |
| 173 | | | | soft hyphen | |
| 174 | ® | ® | ® | registered sign | |
| 175 | ¯ | ¯ | ¯ | macron | |
| 176 | ° | ° | ° | degree sign | |
| 177 | ± | ± | ± | plus-minus sign | |
| 178 | ² | ² | ² | superscript two | |
| 179 | ³ | ³ | ³ | superscript three | |
| 180 | ´ | ´ | ´ | acute accent | |
| 181 | µ | µ | µ | micro sign | |
| 182 | ¶ | ¶ | ¶ | pilcrow sign | |
| 183 | · | · | · | middle dot | |
| 184 | ¸ | ¸ | ¸ | cedilla | |
| 185 | ¹ | ¹ | ¹ | superscript one | |
| 186 | º | º | º | masculine ordinal indicator | |
| 187 | » | » | » | right-pointing double angle quotation mark | |
| 188 | ¼ | ¼ | ¼ | vulgar fraction one quarter | |
| 189 | ½ | ½ | ½ | vulgar fraction one half | |
| 190 | ¾ | ¾ | ¾ | vulgar fraction three quarters | |
| 191 | ¿ | ¿ | ¿ | inverted question mark | |
| 192 | À | À | À | Latin capital letter A with grave | |
| 193 | Á | Á | Á | Latin capital letter A with acute | |
| 194 | Â | Â | Â | Latin capital letter A with circumflex | |
| 195 | Ã | Ã | Ã | Latin capital letter A with tilde | |
| 196 | Ä | Ä | Ä | Latin capital letter A with diaeresis | |
| 197 | Å | Å | Å | Latin capital letter A with ring above | |
| 198 | Æ | Æ | Æ | Latin capital letter AE | |
| 199 | Ç | Ç | Ç | Latin capital letter C with cedilla | |
| 200 | È | È | È | Latin capital letter E with grave | |
| 201 | É | É | É | Latin capital letter E with acute | |
| 202 | Ê | Ê | Ê | Latin capital letter E with circumflex | |
| 203 | Ë | Ë | Ë | Latin capital letter E with diaeresis | |
| 204 | Ì | Ì | Ì | Latin capital letter I with grave | |
| 205 | Í | Í | Í | Latin capital letter I with acute | |
| 206 | Î | Î | Î | Latin capital letter I with circumflex | |
| 207 | Ï | Ï | Ï | Latin capital letter I with diaeresis | |
| 208 | Ð | Ð | Ð | Latin capital letter Eth | |
| 209 | Ñ | Ñ | Ñ | Latin capital letter N with tilde | |
| 210 | Ò | Ò | Ò | Latin capital letter O with grave | |
| 211 | Ó | Ó | Ó | Latin capital letter O with acute | |
| 212 | Ô | Ô | Ô | Latin capital letter O with circumflex | |
| 213 | Õ | Õ | Õ | Latin capital letter O with tilde | |
| 214 | Ö | Ö | Ö | Latin capital letter O with diaeresis | |
| 215 | × | × | × | multiplication sign | |
| 216 | Ø | Ø | Ø | Latin capital letter O with stroke | |
| 217 | Ù | Ù | Ù | Latin capital letter U with grave | |
| 218 | Ú | Ú | Ú | Latin capital letter U with acute | |
| 219 | Û | Û | Û | Latin capital letter U with circumflex | |
| 220 | Ü | Ü | Ü | Latin capital letter U with diaeresis | |
| 221 | Ý | Ý | Ý | Latin capital letter Y with acute | |
| 222 | Þ | Þ | Þ | Latin capital letter Thorn | |
| 223 | ß | ß | ß | Latin small letter sharp s | |
| 224 | à | à | à | Latin small letter a with grave | |
| 225 | á | á | á | Latin small letter a with acute | |
| 226 | â | â | â | Latin small letter a with circumflex | |
| 227 | ã | ã | ã | Latin small letter a with tilde | |
| 228 | ä | ä | ä | Latin small letter a with diaeresis | |
| 229 | å | å | å | Latin small letter a with ring above | |
| 230 | æ | æ | æ | Latin small letter ae | |
| 231 | ç | ç | ç | Latin small letter c with cedilla | |
| 232 | è | è | è | Latin small letter e with grave | |
| 233 | é | é | é | Latin small letter e with acute | |
| 234 | ê | ê | ê | Latin small letter e with circumflex | |
| 235 | ë | ë | ë | Latin small letter e with diaeresis | |
| 236 | ì | ì | ì | Latin small letter i with grave | |
| 237 | í | í | í | Latin small letter i with acute | |
| 238 | î | î | î | Latin small letter i with circumflex | |
| 239 | ï | ï | ï | Latin small letter i with diaeresis | |
| 240 | ð | ð | ð | Latin small letter eth | |
| 241 | ñ | ñ | ñ | Latin small letter n with tilde | |
| 242 | ò | ò | ò | Latin small letter o with grave | |
| 243 | ó | ó | ó | Latin small letter o with acute | |
| 244 | ô | ô | ô | Latin small letter o with circumflex | |
| 245 | õ | õ | õ | Latin small letter o with tilde | |
| 246 | ö | ö | ö | Latin small letter o with diaeresis | |
| 247 | ÷ | ÷ | ÷ | division sign | |
| 248 | ø | ø | ø | Latin small letter o with stroke | |
| 249 | ù | ù | ù | Latin small letter u with grave | |
| 250 | ú | ú | ú | Latin small letter u with acute | |
| 251 | û | û | û | Latin small letter with circumflex | |
| 252 | ü | ü | ü | Диерезтэй латин жижиг у үсэг | |
| 253 | ý | ý | ý | Latin small letter y with acute | |
| 254 | þ | þ | þ | Латин жижиг үсэг өргөс | |
| 255 | ÿ | ÿ | ÿ | Latin small диерезис бүхий у үсэг |
ASCII тэмдэгтийн багц #
ASCII нь хяналтын тэмдэгтүүдийн хувьд 0-ээс 31 (ба 127) хүртэлх утгыг ашигладаг.
ASCII нь үсэг, цифр, тэмдгийн хувьд 32-аас 126 хүртэлх утгыг ашигладаг.
ASCII нь 128-аас 255 хүртэлх утгыг ашигладаггүй.
ANSI тэмдэгтийн багц (Windows-1252) #
ANSI нь 0-ээс 127 хүртэлх утгын хувьд ASCII-тэй ижил байна.
ANSI нь 128-аас 159 хүртэлх утгын өмчийн олонлогтой байна.
ANSI нь 160-аас 255 хүртэлх утгын хувьд UTF-8-тэй ижил байдаг.
ISO-8859-1 тэмдэгтийн багц #
ISO-8859-1 нь 0-ээс 127 хүртэлх утгын хувьд ASCII-тэй ижил байна.
ISO-8859-1 нь 128-аас 159 хүртэлх утгыг ашигладаггүй.
ISO-8859-1 нь 160-аас 255 хүртэлх утгын хувьд UTF-8-тэй ижил байна.
UTF-8 тэмдэгтийн багц #
UTF-8 нь 0-ээс 127 хүртэлх утгын хувьд ASCII-тэй ижил байна.
UTF-8 нь 128-аас 159 хүртэлх утгыг ашигладаггүй.
UTF-8 нь ANSI ба 8859-1 хоёулаа 160-255 хооронд ижил утгатай.
UTF-8 нь 256-аас 10 000 гаруй янзын тэмдэгтээс үргэлжилнэ.