HTML एन्कोडिंग (वर्ण समूह)
एक HTML पृष्ठ को सही ढंग से प्रदर्शित करने के लिए, एक वेब ब्राउज़र को पता होना चाहिए कि किस वर्ण का उपयोग करना है।
ASCII से UTF-8 तक
ASCII पहला वर्ण एन्कोडिंग मानक था। ASCII ने 128 विभिन्न वर्णों को परिभाषित किया है जिनका उपयोग इंटरनेट पर किया जा सकता है: संख्याएँ (0-9), अंग्रेज़ी अक्षर (AZ), और कुछ विशेष वर्ण जैसे ! $ + - ( ) @ < > ।
ISO-8859-1 HTML 4 के लिए डिफ़ॉल्ट वर्ण सेट था। यह वर्ण सेट 256 विभिन्न वर्ण कोड का समर्थन करता है। HTML 4 ने UTF-8 का भी समर्थन किया।
एएनएसआई (विंडोज-1252) मूल विंडोज कैरेक्टर सेट था। ANSI ISO-8859-1 के समान है, सिवाय इसके कि ANSI में 32 अतिरिक्त वर्ण हैं।
HTML5 विनिर्देश वेब डेवलपर्स को UTF-8 वर्ण सेट का उपयोग करने के लिए प्रोत्साहित करता है, जो दुनिया के लगभग सभी वर्णों और प्रतीकों को कवर करता है!
HTML वर्णसेट विशेषता
एक HTML पृष्ठ को सही ढंग से प्रदर्शित करने के लिए, एक वेब ब्राउज़र को पृष्ठ में प्रयुक्त वर्ण सेट को जानना चाहिए।
यह <meta>
टैग में निर्दिष्ट है:
<meta charset="UTF-8">
चरित्र सेट के बीच अंतर
निम्न तालिका ऊपर वर्णित वर्ण सेट के बीच अंतर प्रदर्शित करती है:
सुन्न | एएससीआईआई | एएनएसआई | 8859 | यूटीएफ -8 | विवरण |
---|---|---|---|---|---|
32 | स्थान | ||||
33 | ! | ! | ! | ! | विस्मयादिबोधक चिह्न |
34 | " | " | " | " | उद्धरण चिन्ह |
35 | # | # | # | # | संख्या चिह्न |
36 | $ | $ | $ | $ | डॉलर का चिह्न |
37 | % | % | % | % | प्रतिशत चिह्न |
38 | और | और | और | और | एम्परसेंड |
39 | ' | ' | ' | ' | apostrophe |
40 | ( | ( | ( | ( | बायां कोष्ठक |
41 | ) | ) | ) | ) | सही कोष्ठक |
42 | * | * | * | * | तारांकन |
43 | + | + | + | + | अधिक संकेत |
44 | , | , | , | , | अल्पविराम |
45 | - | - | - | - | हाइफ़न-माइनस |
46 | . | . | . | . | पूर्ण विराम |
47 | / | / | / | / | सोलिडस |
48 | 0 | 0 | 0 | 0 | अंक शून्य |
49 | 1 | 1 | 1 | 1 | अंक एक |
50 | 2 | 2 | 2 | 2 | अंक दो |
51 | 3 | 3 | 3 | 3 | अंक तीन |
52 | 4 | 4 | 4 | 4 | अंक चार |
53 | 5 | 5 | 5 | 5 | अंक पांच |
54 | 6 | 6 | 6 | 6 | अंक छह |
55 | 7 | 7 | 7 | 7 | अंक सात |
56 | 8 | 8 | 8 | 8 | अंक आठ |
57 | 9 | 9 | 9 | 9 | अंक नौ |
58 | : | : | : | : | पेट |
59 | ; | ; | ; | ; | सेमीकोलन |
60 | < | < | < | < | कम से कम संकेत |
61 | = | = | = | = | बराबर चिह्न |
62 | > | > | > | > | अधिक से अधिक संकेत |
63 | ? | ? | ? | ? | प्रश्न चिह्न |
64 | @ | @ | @ | @ | कमर्शियल एट |
65 | ए | ए | ए | ए | लैटिन कैपिटल लेटर A |
66 | बी | बी | बी | बी | लैटिन कैपिटल लेटर B |
67 | सी | सी | सी | सी | लैटिन कैपिटल लेटर C |
68 | डी | डी | डी | डी | लैटिन कैपिटल लेटर D |
69 | इ | इ | इ | इ | लैटिन कैपिटल लेटर E |
70 | एफ | एफ | एफ | एफ | लैटिन कैपिटल लेटर F |
71 | जी | जी | जी | जी | लैटिन कैपिटल लेटर G |
72 | एच | एच | एच | एच | लैटिन कैपिटल लेटर H |
73 | मैं | मैं | मैं | मैं | लैटिन कैपिटल लेटर I |
74 | जे | जे | जे | जे | लैटिन कैपिटल लेटर J |
75 | क | क | क | क | लैटिन कैपिटल लेटर K |
76 | ली | ली | ली | ली | लैटिन कैपिटल लेटर L |
77 | एम | एम | एम | एम | लैटिन कैपिटल लेटर M |
78 | एन | एन | एन | एन | लैटिन कैपिटल लेटर N |
79 | हे | O | O | O | लैटिन कैपिटल लेटर O |
80 | पी | पी | पी | पी | लैटिन कैपिटल लेटर P |
81 | क्यू | क्यू | क्यू | क्यू | लैटिन कैपिटल लेटर Q |
82 | आर | आर | आर | आर | लैटिन कैपिटल लेटर R |
83 | एस | एस | एस | एस | लैटिन कैपिटल लेटर S |
84 | टी | टी | टी | टी | लैटिन कैपिटल लेटर T |
85 | यू | यू | यू | यू | लैटिन कैपिटल लेटर U |
86 | वी | वी | वी | वी | लैटिन कैपिटल लेटर V |
87 | वू | वू | वू | वू | लैटिन कैपिटल लेटर W |
88 | एक्स | एक्स | एक्स | एक्स | लैटिन कैपिटल लेटर X |
89 | यू | यू | यू | यू | लैटिन कैपिटल लेटर Y |
90 | साथ | साथ | साथ | साथ | लैटिन कैपिटल लेटर Z |
91 | [ | [ | [ | [ | बायां वर्ग ब्रैकेट |
92 | \ | \ | \ | \ | रिवर्स सॉलिडस |
93 | ] | ] | ] | ] | दायां वर्ग ब्रैकेट |
94 | ^ | ^ | ^ | ^ | सर्कमफ्लेक्स एक्सेंट |
95 | _ | _ | _ | _ | नीची रेखा |
96 | ` | ` | ` | ` | गंभीर उच्चारण |
97 | ए | ए | ए | ए | लैटिन छोटा अक्षर a |
98 | बी | बी | बी | बी | लैटिन स्माल लेटर b |
99 | सी | सी | सी | सी | लैटिन छोटा अक्षर c |
100 | डी | डी | डी | डी | लैटिन छोटा अक्षर d |
101 | इ | इ | इ | इ | लैटिन छोटा पत्र ई |
102 | एफ | एफ | एफ | एफ | लैटिन छोटा अक्षर f |
103 | जी | जी | जी | जी | लैटिन छोटा पत्र जी |
104 | एच | एच | एच | एच | लैटिन छोटा अक्षर h |
105 | मैं | मैं | मैं | मैं | लैटिन छोटा अक्षर i |
106 | जे | जे | जे | जे | लैटिन स्माल लेटर j |
107 | क | क | क | क | लैटिन छोटा अक्षर k |
108 | मैं | मैं | मैं | मैं | लैटिन छोटा अक्षर l |
109 | एम | एम | एम | एम | लैटिन छोटा पत्र एम |
110 | एन | एन | एन | एन | लैटिन छोटा अक्षर n |
111 | हे | o | o | o | लैटिन छोटा पत्र ओ |
112 | पी | पी | पी | पी | लैटिन स्माल लेटर p |
113 | क्यू | क्यू | क्यू | क्यू | लैटिन छोटा अक्षर q |
114 | आर | आर | आर | आर | लैटिन छोटा अक्षर r |
115 | एस | एस | एस | एस | लैटिन स्माल लेटर s |
116 | टी | टी | टी | टी | लैटिन छोटा पत्र टी |
117 | तुम | तुम | तुम | तुम | लैटिन छोटा पत्र यू |
118 | वी | वी | वी | वी | लैटिन छोटा अक्षर v |
119 | वू | वू | वू | वू | लैटिन छोटा अक्षर w |
120 | एक्स | एक्स | एक्स | एक्स | लैटिन छोटा अक्षर x |
121 | यू | यू | यू | यू | लैटिन छोटा अक्षर y |
122 | साथ | साथ | साथ | साथ | लैटिन छोटा अक्षर z |
123 | { | { | { | { | बायां घुंघराले ब्रैकेट |
124 | | | | | | | | | ऊर्ध्वाधर रेखा |
125 | } | } | } | } | सही घुंघराले ब्रैकेट |
126 | ~ | ~ | ~ | ~ | टिल्ड |
127 | का | ||||
128 | € | यूरो चिह्न | |||
129 | | | | उपयोग नहीं किया | |
130 | मैं | सिंगल लो -9 कोटेशन मार्क | |||
131 | मैं | हुक के साथ लैटिन छोटा अक्षर f | |||
132 | मैं | डबल लो -9 कोटेशन मार्क | |||
133 | … | क्षैतिज दीर्घवृत्त | |||
134 | मैं | कटार | |||
135 | मैं | डबल डैगर | |||
136 | मैं | संशोधक पत्र सर्कमफ्लेक्स एक्सेंट | |||
137 | मैं | एक हजार चिन्ह के लिए | |||
138 | एस | कैरन के साथ लैटिन कैपिटल लेटर S | |||
139 | मैं | सिंगल लेफ्ट-पॉइंटिंग एंगल कोटेशन मार्क | |||
140 | ँ | लैटिन राजधानी संयुक्ताक्षर OE | |||
141 | | | | उपयोग नहीं किया | |
142 | Z | कैरन के साथ लैटिन कैपिटल लेटर Z | |||
143 | | | | उपयोग नहीं किया | |
144 | | | | उपयोग नहीं किया | |
145 | ' | बायां एकल उद्धरण चिह्न | |||
146 | ' | सही एकल उद्धरण चिह्न | |||
147 | " | दोहरा उद्धरण चिह्न छोड़ दिया | |||
148 | " | दायां दोहरा उद्धरण चिह्न | |||
149 | • | गोली | |||
150 | - | और डैश | |||
151 | - | आप डैश | |||
152 | मैं | छोटा टिल्ड | |||
153 | ™ | व्यापार चिह्न चिह्न | |||
154 | एस | कैरन के साथ लैटिन छोटा अक्षर एस | |||
155 | › | सिंगल राइट-पॉइंटिंग एंगल कोटेशन मार्क | |||
156 | ँ | लैटिन छोटा संयुक्ताक्षर OE | |||
157 | | | | उपयोग नहीं किया | |
158 | Z | कैरन . के साथ लैटिन छोटा अक्षर z | |||
159 | मैं | डायरेसिस के साथ लैटिन कैपिटल लेटर Y | |||
160 | नो-ब्रेक स्पेस | ||||
161 | मैं | मैं | मैं | उलटा विस्मयादिबोधक चिह्न | |
162 | मैं | मैं | मैं | शत चिह्न | |
163 | £ | £ | £ | पाउन्ड चिन्ह | |
164 | मैं | मैं | मैं | मुद्रा चिन्ह | |
165 | मैं | मैं | मैं | येन संकेत | |
166 | मैं | मैं | मैं | टूटा हुआ बार | |
167 | मैं | मैं | मैं | खंड चिह्न | |
168 | मैं | मैं | मैं | डाएरेसिस | |
169 | © | © | © | कॉपीराइट साइन | |
170 | मैं | मैं | मैं | स्त्री क्रमसूचक संकेतक | |
171 | « | « | « | बाएं ओर इशारा करते हुए दोहरे कोण उद्धरण चिह्न | |
172 | मैं | मैं | मैं | हस्ताक्षर नहीं | |
173 | | | | नरम हाइफ़न | |
174 | ® | ® | ® | पंजीकृत संकेत | |
175 | मैं | मैं | मैं | MACRON | |
176 | ° | ° | ° | डिग्री चिन्ह | |
177 | ± | ± | ± | प्लस-माइनस साइन | |
178 | मैं | मैं | मैं | सुपरस्क्रिप्ट दो | |
179 | मैं | मैं | मैं | सुपरस्क्रिप्ट तीन | |
180 | मैं | मैं | मैं | तीव्र उच्चारण | |
181 | μ | μ | μ | सूक्ष्म संकेत | |
182 | मैं | मैं | मैं | पिलक्रो साइन | |
183 | · | · | · | मध्य बिंदु | |
184 | मैं | मैं | मैं | सिडील | |
185 | मैं | मैं | मैं | सुपरस्क्रिप्ट एक | |
186 | मैं | मैं | मैं | मर्दाना क्रमसूचक संकेतक | |
187 | » | » | » | राइट-पॉइंटिंग डबल एंगल कोटेशन मार्क | |
188 | मैं | मैं | मैं | अश्लील अंश एक चौथाई | |
189 | साढ़े | साढ़े | साढ़े | अश्लील अंश एक आधा | |
190 | मैं | मैं | मैं | अश्लील अंश तीन चौथाई | |
191 | मैं | मैं | मैं | उल्टा प्रश्न चिह्न | |
192 | पर | पर | पर | कब्र के साथ लैटिन कैपिटल लेटर ए | |
193 | ए | ए | ए | एक्यूट . के साथ लैटिन कैपिटल लेटर ए | |
194 | ए | ए | ए | सर्कमफ्लेक्स के साथ लैटिन कैपिटल लेटर ए | |
195 | ए | ए | ए | टिल्डे के साथ लैटिन कैपिटल लेटर ए | |
196 | ए | ए | ए | डायएरिसिस के साथ लैटिन कैपिटल लेटर ए | |
197 | ओह | ओह | ओह | लैटिन कैपिटल लेटर ए ऊपर रिंग के साथ | |
198 | मैं | मैं | मैं | लैटिन कैपिटल लेटर AE | |
199 | सी | सी | सी | सेडिला के साथ लैटिन कैपिटल लेटर सी | |
200 | है | है | है | कब्र के साथ लैटिन कैपिटल लेटर E | |
201 | यह है | यह है | यह है | एक्यूट . के साथ लैटिन कैपिटल लेटर E | |
202 | इ | इ | इ | सर्कमफ्लेक्स के साथ लैटिन कैपिटल लेटर E | |
203 | इ | इ | इ | डायएरिसिस के साथ लैटिन कैपिटल लेटर ई | |
204 | मैं | मैं | मैं | कब्र के साथ लैटिन कैपिटल लेटर I | |
205 | मैं | मैं | मैं | एक्यूट के साथ लैटिन कैपिटल लेटर I | |
206 | मैं | मैं | मैं | सर्कमफ्लेक्स के साथ लैटिन कैपिटल लेटर I | |
207 | मैं | मैं | मैं | डायएरिसिस के साथ लैटिन कैपिटल लेटर I | |
208 | डी | डी | डी | लैटिन कैपिटल लेटर Eth | |
209 | एन | एन | एन | टिल्डे के साथ लैटिन कैपिटल लेटर N | |
210 | हे | हे | हे | ग्रेव के साथ लैटिन कैपिटल लेटर O | |
211 | ओह | ओह | ओह | एक्यूट . के साथ लैटिन कैपिटल लेटर O | |
212 | छाता | छाता | छाता | सर्कमफ्लेक्स के साथ लैटिन कैपिटल लेटर O | |
213 | हे | हे | हे | टिल्डे के साथ लैटिन कैपिटल लेटर O | |
214 | मैं | मैं | मैं | डायरेसिस के साथ लैटिन कैपिटल लेटर O | |
215 | × | × | × | गुणन चिह्न | |
216 | मैं | मैं | मैं | स्ट्रोक के साथ लैटिन कैपिटल लेटर O | |
217 | यू | यू | यू | कब्र के साथ लैटिन कैपिटल लेटर यू | |
218 | U के | U के | U के | एक्यूट . के साथ लैटिन कैपिटल लेटर यू | |
219 | यू | यू | यू | सर्कमफ्लेक्स के साथ लैटिन कैपिटल लेटर यू | |
220 | मैं | मैं | मैं | डायएरिसिस के साथ लैटिन कैपिटल लेटर यू | |
221 | विचार | विचार | विचार | एक्यूट . के साथ लैटिन कैपिटल लेटर Y | |
222 | वां | वां | वां | लैटिन कैपिटल लेटर थॉर्न | |
223 | मैं | मैं | मैं | लैटिन स्माल लेटर शार्प s | |
224 | पर | पर | पर | कब्र के साथ लैटिन छोटा पत्र a | |
225 | ए | ए | ए | एक्यूट के साथ लैटिन स्माल लेटर ए | |
226 | ए | ए | ए | सर्कमफ्लेक्स के साथ लैटिन स्माल लेटर ए | |
227 | ए | ए | ए | टिल्डे के साथ लैटिन स्माल लेटर ए | |
228 | ए | ए | ए | डायएरिसिस के साथ लैटिन स्माल लेटर ए | |
229 | ए | ए | ए | लैटिन छोटा अक्षर a ऊपर की अंगूठी के साथ | |
230 | मैं | मैं | मैं | लैटिन छोटा अक्षर एई | |
231 | सी | सी | सी | सेडिला के साथ लैटिन स्माल लेटर सी | |
232 | है | है | है | कब्र के साथ लैटिन छोटा पत्र ई | |
233 | यह है | यह है | यह है | एक्यूट . के साथ लैटिन स्माल लेटर ई | |
234 | इ | इ | इ | सर्कमफ्लेक्स के साथ लैटिन छोटा अक्षर ई | |
235 | इ | इ | इ | डायएरिसिस के साथ लैटिन छोटा अक्षर ई | |
236 | मैं | मैं | मैं | कब्र के साथ लैटिन छोटा पत्र I | |
237 | मैं | मैं | मैं | तीव्र . के साथ लैटिन छोटा अक्षर I | |
238 | मैं | मैं | मैं | सर्कमफ्लेक्स के साथ लैटिन स्माल लेटर I | |
239 | मैं | मैं | मैं | डायएरिसिस के साथ लैटिन स्माल लेटर I | |
240 | डी | डी | डी | लैटिन स्माल लेटर एथ | |
241 | एन | एन | एन | टिल्डे के साथ लैटिन छोटा अक्षर n | |
242 | हे | हे | हे | कब्र के साथ लैटिन छोटा पत्र ओ | |
243 | ó | ó | ó | तीव्र . के साथ लैटिन छोटा अक्षर o | |
244 | छाता | छाता | छाता | सर्कमफ्लेक्स के साथ लैटिन स्माल लेटर ओ | |
245 | हे | हे | हे | टिल्डे के साथ लैटिन छोटा अक्षर ओ | |
246 | ओ | ओ | ओ | डायएरिसिस के साथ लैटिन छोटा पत्र ओ | |
247 | मैं | मैं | मैं | विभाजन चिह्न | |
248 | मैं | मैं | मैं | स्ट्रोक के साथ लैटिन छोटा अक्षर ओ | |
249 | यू | यू | यू | ग्रेव के साथ लैटिन स्माल लेटर यू | |
250 | U के | U के | U के | एक्यूट . के साथ लैटिन स्माल लेटर यू | |
251 | तथा | तथा | तथा | सर्कमफ्लेक्स के साथ लैटिन छोटा पत्र | |
252 | ü | ü | ü | डायएरेसिस के साथ लैटिन स्माल लेटर यू | |
253 | विचार | विचार | विचार | एक्यूट . के साथ लैटिन छोटा अक्षर y | |
254 | वां | वां | वां | लैटिन स्माल लेटर थॉर्न | |
255 | मैं | मैं | मैं | डायएरिसिस के साथ लैटिन छोटा अक्षर y |
ASCII कैरेक्टर सेट
ASCII नियंत्रण वर्णों के लिए 0 से 31 (और 127) के मानों का उपयोग करता है।
ASCII अक्षरों, अंकों और प्रतीकों के लिए 32 से 126 तक के मानों का उपयोग करता है।
ASCII 128 से 255 तक के मानों का उपयोग नहीं करता है।
एएनएसआई कैरेक्टर सेट (विंडोज-1252)
ANSI 0 से 127 के मानों के लिए ASCII के समान है।
एएनएसआई के पास 128 से 159 के मानों के लिए वर्णों का एक मालिकाना सेट है।
एएनएसआई 160 से 255 के मानों के लिए यूटीएफ -8 के समान है।
ISO-8859-1 कैरेक्टर सेट
ISO-8859-1 0 से 127 के मानों के लिए ASCII के समान है।
ISO-8859-1 128 से 159 तक के मानों का उपयोग नहीं करता है।
ISO-8859-1 160 से 255 के मानों के लिए UTF-8 के समान है।
UTF-8 कैरेक्टर सेट
UTF-8 0 से 127 के मानों के लिए ASCII के समान है।
UTF-8 128 से 159 तक के मानों का उपयोग नहीं करता है।
UTF-8 160 से 255 के मानों के लिए ANSI और 8859-1 दोनों के समान है।
UTF-8 मान 256 से 10,000 से अधिक विभिन्न वर्णों के साथ जारी है।
करीब से देखने के लिए, हमारे संपूर्ण HTML कैरेक्टर सेट संदर्भ का अध्ययन करें ।