ผลต่างระหว่างรุ่นของ "ยูนิโคด"

เนื้อหาที่ลบ เนื้อหาที่เพิ่ม
JBot (คุย | ส่วนร่วม)
ย้อนการแก้ไขที่อาจเป็นการทดลอง หรือก่อกวนด้วยบอต ไม่ควรย้อน? แจ้งที่นี่
ป้ายระบุ: ย้อนด้วยมือ
ไม่มีความย่อการแก้ไข
ป้ายระบุ: ถูกย้อนกลับแล้ว
บรรทัด 10:
ยูนิโคดสามารถนำไปใช้งานได้ด้วยชุดอักขระแบบต่าง ๆ ชุดอักขระที่เป็นที่รู้จักมากที่สุดคือ [[UTF-8]] (ใช้ 1 [[ไบต์]]สำหรับอักขระทุกตัวในรหัส[[แอสกี]]และมีค่ารหัสเหมือนกับมาตรฐานแอสกี หรือมากกว่านั้นจนถึง 4 ไบต์สำหรับอักขระแบบอื่น) [[UCS-2]] ซึ่งปัจจุบันเลิกใช้แล้ว (ใช้ 2 ไบต์สำหรับอักขระทุกตัว แต่ไม่ครอบคลุมอักขระทั้งหมดในยูนิโคด) และ [[UTF-16]] (เป็นส่วนขยายจาก UCS-2 โดยใช้ 4 ไบต์
สำหรับแทนรหัสอักขระที่ขาดไปของ UCS-2)
 
==การเข้ารหัส==
UTF-8 เข้ารหัสตัวอักษรเป็นข้อมูลหนึ่งถึงสี่ไบต์ตามลำดับของจุดรหัส ตารางต่อไปนี้แสดงโครงสร้างของการเข้ารหัส ตัว {{mono|x}} แทนบิตของจุดรหัส
{| class="wikitable"
|+ จุดรหัส <-> UTF-8
! จุดรหัสแรก
! จุดรหัสท้าย
! ไบต์ที่ 1
! ไบต์ที่ 2
! ไบต์ที่ 3
! ไบต์ที่ 4
|-
| style="text-align: right;" |U+0000
| style="text-align: right;" |U+007F
|{{mono|0xxxxxxx}}
| style="background: darkgray;" colspan=3 |
|-
| style="text-align: right;" |U+0080
| style="text-align: right;" |U+07FF
|{{mono|110xxxxx}}||{{mono|10xxxxxx}}
| style="background: darkgray;" colspan=2 |
|-
| style="text-align: right;" |U+0800
| style="text-align: right;" |U+FFFF
|{{mono|1110xxxx}}||{{mono|10xxxxxx}}||{{mono|10xxxxxx}}
| style="background: darkgray;" |
|-
| style="text-align: right;" |U+10000
| style="text-align: right;" |U+10FFFF
|{{mono|11110xxx}}||{{mono|10xxxxxx}}||{{mono|10xxxxxx}}||{{mono|10xxxxxx}}
|}
 
{| class="wikitable"
|+ ตัวอย่างการเข้ารหัส
|-
! colspan=2 | ตัวอักษร !! จุดรหัสฐานสอง !! UTF-8 ฐานสอง !! UTF-8 ฐานสิบหก
|-
|[[$]] || align=right|{{mono|U+0024}}
|align=right|{{mono|{{fontcolor|red|010 0100}}}}
|align=left|{{mono|0{{fontcolor|red|0100100}}}}
|align=left|{{mono|{{fontcolor|red|24}}}}
|-
|[[เซนต์|¢]] || align=right|{{mono|U+00A2}}
|align=right|{{mono|{{fontcolor|green|000 10}}{{fontcolor|red|10 0010}}}}
|align=left|{{mono|110{{fontcolor|green|00010}} 10{{fontcolor|red|100010}}}}
|align=left|{{mono|{{fontcolor|green|C2}} {{fontcolor|red|A2}}}}
|-
|[[อักษรเทวนาครี|ह]] || align=right|{{mono|U+0939}}
|align=right|{{mono|{{fontcolor|blue|0000}} {{fontcolor|green|1001 00}}{{fontcolor|red|11 1001}}}}
|align=left|{{mono|1110{{fontcolor|blue|0000}} 10{{fontcolor|green|100100}} 10{{fontcolor|red|111001}}}}
|align=left|{{mono|{{fontcolor|blue|E0}} {{fontcolor|green|A4}} {{fontcolor|red|B9}}}}
|-
|[[เครื่องหมายยูโร|€]] || align=right|{{mono|U+20AC}}
|align=right|{{mono|{{fontcolor|blue|0010}} {{fontcolor|green|0000 10}}{{fontcolor|red|10 1100}}}}
|align=left|{{mono|1110{{fontcolor|blue|0010}} 10{{fontcolor|green|000010}} 10{{fontcolor|red|101100}}}}
|align=left|{{mono|{{fontcolor|blue|E2}} {{fontcolor|green|82}} {{fontcolor|red|AC}}}}
|-
|[[ฮันกึล|한]] || align=right|{{mono|U+D55C}}
|align=right|{{mono|{{fontcolor|blue|1101}} {{fontcolor|green|0101 01}}{{fontcolor|red|01 1100}}}}
|align=left|{{mono|1110{{fontcolor|blue|1101}} 10{{fontcolor|green|010101}} 10{{fontcolor|red|011100}}}}
|align=left|{{mono|{{fontcolor|blue|ED}} {{fontcolor|green|95}} {{fontcolor|red|9C}}}}
|-
|[[Hwair|𐍈]] || align=right|{{mono|U+10348}}
|align=right|{{mono|{{fontcolor|#C000C0|0 00}}{{fontcolor|blue|01 0000}} {{fontcolor|green|0011 01}}{{fontcolor|red|00 1000}}}}
|align=left|{{mono|11110{{fontcolor|#C000C0|000}} 10{{fontcolor|blue|010000}} 10{{fontcolor|green|001101}} 10{{fontcolor|red|001000}}}}
|align=left|{{mono|{{fontcolor|#C000C0|F0}} {{fontcolor|blue|90}} {{fontcolor|green|8D}} {{fontcolor|red|88}}}}
|}
 
== รุ่นยูนิโคด ==