ผลต่างระหว่างรุ่นของ "ยูนิโคด"

เนื้อหาที่ลบ เนื้อหาที่เพิ่ม
gifs
ป้ายระบุ: การแก้ไขแบบเห็นภาพ แก้ไขจากอุปกรณ์เคลื่อนที่ แก้ไขจากเว็บสำหรับอุปกรณ์เคลื่อนที่
ABC
ป้ายระบุ: การแก้ไขแบบเห็นภาพ แก้ไขจากอุปกรณ์เคลื่อนที่ แก้ไขจากเว็บสำหรับอุปกรณ์เคลื่อนที่
บรรทัด 2:
[[ไฟล์:Unicodeconsortium bookv5.jpg|thumb|The Unicode Standard, Version 5.0]]
[[ไฟล์:Unichart-printed.jpg|thumb|200px|right|อักขระยูนิโคดทั้งหมดเมื่อพิมพ์ลงกระดาษ (รวมทั้งสองแผ่น)]]
'''ยูนิโคด''' ({{lang-en|Unicode}}) คือมาตรฐานอุตสาหกรรมที่ช่วยให้[[คอมพิวเตอร์]]แสดงผลและจัดการ[[ข้อความธรรมดา]]ที่ใช้ใน[[ระบบการเขียน]]ของ[[ภาษาอังกฤษ|ภาษา]]ส่วนใหญ่ในโลกได้อย่างสอดคล้องกัน ยูนิโคดประกอบด้วยรายการ[[แบบอักขระ|'''<u>อักขระ</u>''']]ที่แสดงผลได้มากกว่า 100,000 ตัว พัฒนาต่อยอดมาจากมาตรฐาน[[ชุดอักขระสากล]] (Universal Character Set: UCS) และมีการตีพิมพ์ลงในหนังสือ ''The Unicode Standard'' เป็นแผนผังรหัสเพื่อใช้เป็นรายการอ้างอิง นอกจากนั้นยังมีการอธิบายวิธีการที่ใช้เข้ารหัสและการนำเสนอมาตรฐานของ[[การเข้ารหัสอักขระ]]อีกจำนวนหนึ่ง [[การเรียงลำดับอักษร]] กฎเกณฑ์ของการรวมและการแยกอักขระ รวมไปถึงลำดับการแสดงผลของอักขระสองทิศทาง (เช่น[[อักษรอาหรับ]]หรือ[[อักษรฮีบรู]]ที่เขียนจากขวาไปซ้าย) <ref>http://www.unicode.org/standard/principles.html#What_Characters</ref>
 
[[ยูนิโคดคอนซอร์เทียม]] (Unicode Consortium) ซึ่งเป็น[[องค์กรไม่แสวงหาผลกำไร]] เป็นผู้รับผิดชอบในการพัฒนายูนิโคด องค์กรนี้มีจุดมุ่งหมายเกี่ยวกับการแทนที่การเข้ารหัสอักขระที่มีอยู่ด้วยยูนิโคดและมาตรฐานรูปแบบการแปลงยูนิโคด (Unicode Transformation Format: UTF) แต่ก็เป็นที่ยุ่งยากเนื่องจากแผนการที่มีอยู่ถูกจำกัดไว้ด้วยขนาดและขอบเขต ซึ่งอาจไม่รองรับกับสภาพแวดล้อมหลายภาษาในคอมพิวเตอร์
 
ความสำเร็จของยูนิโคดคือการรวมรหัสอักขระหลายชนิดให้เป็นหนึ่งเดียว นำไปสู่การใช้งานอย่างกว้างขวางและมีอิทธิพลต่อการแปลภาษาของ[[ซอฟต์แวร์คอมพิวเตอร์]] นั่นคือโปรแกรมจะสามารถใช้ได้หลายภาษา มาตรฐานนี้มีการนำไปใช้เป็นเทคโนโลยีหลักหลายอย่าง อาทิ [[เอกซ์เอ็มแอล]] [[ภาษาจาวา]] [[ดอตเน็ตเฟรมเวิร์ก]] และ[[ระบบปฏิบัติการ]]สมัยใหม่
 
ยูนิโคดสามารถนำไปใช้งานได้ด้วยชุดอักขระแบบต่าง ๆ ชุดอักขระที่เป็นที่รู้จักมากที่สุดคือ [[UTF-8]] (ใช้ 1 [[ไบต์]]สำหรับอักขระทุกตัวในรหัส[[แอสกี]]และมีค่ารหัสเหมือนกับมาตรฐานแอสกี หรือมากกว่านั้นจนถึง 4 ไบต์สำหรับอักขระแบบอื่น) [[UCS-2]] ซึ่งปัจจุบันเลิกใช้แล้ว (ใช้ 2 ไบต์สำหรับอักขระทุกตัว แต่ไม่ครอบคลุมอักขระทั้งหมดในยูนิโคด) และ [[UTF-16]] (เป็นส่วนขยายจาก UCS-2 โดยใช้ 4 ไบต์
สำหรับแทนรหัสอักขระที่ขาดไปของ UCS-2)
 
== รุ่นยูนิโคด ==
{| class="wikitable"
|-
!rowspan=2| รุ่น
!rowspan=2| วันที่
!rowspan=2| หนังสือ
!rowspan=2| ความสอดคล้องกับ<br />[[ชุดอักขระสากล]]<br />(ISO/IEC 10646)
!rowspan=2| ชุดอักษร
!colspan=2| อักขระ
|-
! จำนวน
! การเพิ่มเติมที่สำคัญ
|-
| 1.0.0
| ตุลาคม พ.ศ. 2534
| ISBN 0-201-56788-1 (Vol.1)
|
| 24
| 7,161
| เริ่มต้นด้วยอักษรเหล่านี้: [[อักษรอาหรับ|อาหรับ]], [[อักษรอาร์มีเนีย|อาร์มีเนีย]], [[อักษรเบงกาลี|เบงกาลี]], [[จู้อิน|ปอพอมอฟอ]], [[อักษรซีริลลิก|ซีริลลิก]], [[อักษรเทวนาครี|เทวนาครี]], [[อักษรจอร์เจีย|จอร์เจีย]], [[อักษรกรีก|กรีกและคอปติก]], [[อักษรคุชราต|คุชราต]], [[อักษรคุรมุขี|คุรมุขี]], [[อักษรฮันกึล|ฮันกึล]], [[อักษรฮีบรู|ฮีบรู]], [[ฮิระงะนะ]], [[อักษรกันนาดา|กันนาดา]], [[คะตะคะนะ]], [[อักษรลาว|ลาว]], [[อักษรละติน|ละติน]], [[อักษรมาลายาลัม|มาลายาลัม]], [[อักษรโอริยา|โอริยา]], [[อักษรทมิฬ|ทมิฬ]], [[อักษรเตลูกู|เตลูกู]], [[อักษรไทย|ไทย]] และ[[อักษรทิเบต|ทิเบต]] <ref>http://www.unicode.org/Public/reconstructed/1.0.0/UnicodeData.txt</ref>
|-
| 1.0.1
| มิถุนายน พ.ศ. 2535
| ISBN 0-201-60845-6 (Vol.2)
|
| 25
| 28,359
| เริ่มมี[[อักษรภาพรวมจีนญี่ปุ่นเกาหลี]] (CJK Unified Ideographs) 20,902 ตัว <ref>http://www.unicode.org/Public/reconstructed/1.0.1/UnicodeData.txt</ref>
|-
| 1.1
| มิถุนายน พ.ศ. 2536
|
| ISO/IEC 10646-1:1993
| 24
| 34,233
| เพิ่ม[[พยางค์]]ฮันกึลลงไปอีก 4,306 ตัว จากชุดเดิม 2,350 ตัว และอักษรทิเบตถูกเอาออก <ref>http://www.unicode.org/Public/1.1-Update/UnicodeData-1.1.5.txt</ref>
|-
| 2.0
| กรกฎาคม พ.ศ. 2539
| ISBN 0-201-48345-9
| ISO/IEC 10646-1:1993 เพิ่มข้อแก้ไขที่ 5, 6, 7
| 25
| 38,950
| พยางค์ฮันกึลชุดเดิมถูกเอาออก แล้วเพิ่มพยางค์ฮันกึลชุดใหม่ 11,619 ตัวในตำแหน่งใหม่ อักษรทิเบตเพิ่มกลับเข้ามาที่ตำแหน่งใหม่พร้อมกับเปลี่ยนแปลงอักขระบางตัว กลไก[[อักขระทดแทน]] (surrogate) ได้ถูกนิยามขึ้น และมีการกำหนดให้เพลน 15 และเพลน 16 เป็น[[พื้นที่ใช้งานส่วนตัว]] (Private Use Areas) <ref>http://www.unicode.org/Public/2.0-Update/UnicodeData-2.0.14.txt</ref>
|-
| 2.1
| พฤษภาคม พ.ศ. 2541
|
| ISO/IEC 10646-1:1993 เพิ่มข้อแก้ไขที่ 5, 6, 7 และอักขระสองตัวจากข้อแก้ไขที่ 18
| 25
| 38,952
| เครื่องหมาย[[ยูโร]]ถูกเพิ่มเข้ามา <ref>http://www.unicode.org/Public/2.1-Update/UnicodeData-2.1.2.txt</ref>
|-
| 3.0
| กันยายน พ.ศ. 2542
| ISBN 0-201-61633-5
| ISO/IEC 10646-1:2000
| 38
| 49,259
| [[อักษรเชอโรกี|เชอโรกี]], [[อักษรเอธิโอเปีย|เอธิโอเปีย]], [[อักษรเขมร|เขมร]], [[อักษรมองโกเลีย|มองโกเลีย]], [[อักษรพม่า|พม่า]], [[อักษรโอคัม|โอคัม]], [[อักษรรูนส์|รูนส์]], [[อักษรสิงหล|สิงหล]], [[อักษรซีเรียค|ซีเรียค]], [[อักษรทานะ|ทานา]], [[Canadian Aboriginal syllabics|Unified Canadian Aboriginal Syllabics]] และ[[อักษรอี้|อี้]] เพิ่มเข้ามา เช่นเดียวกับรูปแบบ[[อักษรเบรลล์]] <ref>http://www.unicode.org/Public/3.0-Update/UnicodeData-3.0.0.txt</ref>
|-
| 3.1
| มีนาคม พ.ศ. 2544
|
| ISO/IEC 10646-1:2000
ISO/IEC 10646-2:2001
| 41
| 94,205
| [[อักษรเดเซเรท|เดเซเรท]], [[อักษรโกธิก|โกธิก]] และ[[อักษรอิตาลีโบราณ|อิตาลีโบราณ]] เพิ่มเข้ามา พร้อมกับ[[สัญลักษณ์ทางดนตรีสมัยใหม่]]และ[[ดนตรีไบแซนไทน์]] และเพิ่มอักษรภาพรวมจีนญี่ปุ่นเกาหลีอีก 42,711 ตัว <ref>http://www.unicode.org/Public/3.1-Update/UnicodeData-3.1.0.txt</ref>
|-
| 3.2
| มีนาคม พ.ศ. 2545
|
| ISO/IEC 10646-1:2000 เพิ่มข้อแก้ไขที่ 1
ISO/IEC 10646-2:2001
| 45
| 95,221
| เพิ่มอักษรที่ใช้ใน[[ฟิลิปปินส์]]: [[อักษรบูฮิด|บูฮิด]], [[อักษรฮานูโนโอ|ฮานูโนโอ]], [[อักษรบายบายิน|บายบายิน]] และ[[อักษรตักบันวา|ตักบันวา]] <ref>http://www.unicode.org/Public/3.2-Update/UnicodeData-3.2.0.txt</ref>
|-
| 4.0
| เมษายน พ.ศ. 2546
| ISBN 0-321-18578-1
| ISO/IEC 10646:2003
| 52
| 96,447
| [[อักษรไซปรัส|ไซปรัส]], [[อักษรลิมบู|ลิมบู]], [[อักษรไลเนียร์บี|ไลเนียร์บี]], [[อักษรออสมันยา|ออสมันยา]], [[อักษรชาเวียน|ชาเวียน]], [[อักษรไทใต้คง|ไทใต้คง]] และ[[อักษรยูการิติก|ยูการิติก]] เพิ่มเข้ามาพร้อมกับ[[แผนภูมิหกชั้น]]ของ[[อี้จิง]] <ref>http://www.unicode.org/Public/4.0-Update/UnicodeData-4.0.0.txt</ref>
|-
| 4.1
| มีนาคม พ.ศ. 2548
|
| ISO/IEC 10646:2003 เพิ่มข้อแก้ไขที่ 1
| 59
| 97,720
| [[อักษรลนตารา|ลนตารา]], [[อักษรกลาโกลิติก|กลาโกลิติก]], [[อักษรขโรษฐี|ขโรษฐี]], [[อักษรไทลื้อใหม่|ไทลื้อใหม่]], [[Old Persian cuneiform script|Old Persian]], [[อักษรสิเลฏินาครี|สิเลฏินาครี]] และ[[อักษรทิฟินาค|ทิฟินาค]] เพิ่มเข้ามา และ[[อักษรคอปติก|คอปติก]]ในรูปแบบที่ต่างจาก[[อักษรกรีก]] เลขกรีกโบราณและสัญลักษณ์ทางดนตรีเพิ่มเข้ามาด้วย <ref>http://www.unicode.org/Public/4.1.0/ucd/UnicodeData.txt</ref>
|-
| 5.0
| กรกฎาคม พ.ศ. 2549
| ISBN 0-321-48091-0
| ISO/IEC 10646:2003 เพิ่มข้อแก้ไขที่ 1, 2 และอักขระสี่ตัวจากข้อแก้ไขที่ 3
| 64
| 99,089
| [[อักษรบาหลี|บาหลี]], [[คูนิฟอร์ม]], [[อักษรอึนโก|อึนโก]], [[อักษรพักส์-ปา|พักส์-ปา]] และ[[อักษรฟินิเชีย|ฟินิเชีย]] เพิ่มเข้ามา <ref>http://www.unicode.org/Public/5.0.0/ucd/UnicodeData.txt</ref>
|-
| 5.1
| เมษายน พ.ศ. 2551
|
| ISO/IEC 10646:2003 เพิ่มข้อแก้ไขที่ 1, 2, 3, 4
| 75
| 100,713
| [[อักษรคาเรีย|คาเรีย]], [[อักษรจาม|จาม]], [[อักษรกะยา|กะยา]], [[อักษรเลปชา|เลปชา]], [[อักษรไลเซีย|ไลเซีย]], [[อักษรไลเดีย|ไลเดีย]], [[Ol Chiki script|Ol Chiki]], [[อักษรเรชัง|เรชัง]], [[อักษรศารทา|ศารทา]], [[อักษรซุนดา|ซุนดา]] และ[[อักษรไว|ไว]] เพิ่มเข้ามา เช่นเดียวกับกลุ่มสัญลักษณ์ [[Phaistos Disc]], หน้า[[ไพ่นกกระจอก]] และหน้า[[โดมิโน]] เพิ่มเติมอักษรที่สำคัญสำหรับ[[อักษรพม่า]], additions of letters and [[Scribal abbreviation]]s used in medieval [[manuscript]]s, and the addition of [[capital ß]].<ref>http://www.unicode.org/Public/5.1.0/ucd/UnicodeData.txt</ref>
|-
| 5.2
| ตุลาคม พ.ศ. 2552
|
| ISO/IEC 10646:2003 เพิ่มข้อแก้ไขที่ 1, 2, 3, 4, 5, 6
| 90
| 107,361
| [[อักษรอเวสตะ|อเวสตะ]], [[อักษรบามุม|บามุม]], [[ไฮโรกลิฟฟิก]] (the [[Gardiner's sign list|Gardiner Set]], comprising 1,071 characters), [[Aramaic language#Imperial Aramaic|Imperial Aramaic]], [[Pahlavi scripts#Inscriptional Pahlavi|Inscriptional Pahlavi]], [[Parthian language#Written Parthian|Inscriptional Parthian]], [[อักษรชวา|ชวา]], [[อักษรไกถิ|ไกถิ]], [[อักษรฟราเซอร์|ลีสู่]], [[อักษรมณีปุรี|ไมไตมาเยก]], [[South Arabian alphabet|Old South Arabian]], [[Old Turkic script|Old Turkic]], [[Samaritan script|Samaritan]], [[อักษรไทธรรม|ไทธรรม]] และ [[อักษรไทเวียด|ไทเวียด]]. เพิ่มอักษรภาพรวมจีนญี่ปุ่นเกาหลีอีก 4,149 ตัว (CJK-C), เช่นเดียวกับจาโมส่วนขยายของ[[อักษรฮันกึล|อักษรฮันกึลโบราณ]] และอักขระสำหรับ[[อักษรพระเวท]] <ref>http://www.unicode.org/Public/5.2.0/ucd/UnicodeData.txt</ref>
|-
| 6.0
| ตุลาคม พ.ศ. 2553
|
| ISO/IEC 10646:2010 เพิ่มเครื่องหมายสกุลเงิน[[รูปีอินเดีย]]
| 93
| 109,449
| [[อักษรบาตัก|บาตัก]], [[อักษรพราหมี|พราหมี]], [[อักษรมันดาอิก|มันดาอิก]], สัญลักษณ์หน้า[[ไพ่ป๊อก]], สัญลักษณ์[[จราจร]]และ[[แผนที่]], สัญลักษณ์[[การเล่นแร่แปรธาตุ]], [[อีโมติคอน]] และ[[อีโมจิ]]<ref>{{Cite web
| title = Unicode Data 6.0.0
| url = http://www.unicode.org/Public/6.0.0/ucd/UnicodeData.txt
| accessdate = 2010-10-11}}
</ref>
|}
 
== ข้อจำกัดและปัญหา ==
มีการวิจารณ์ยูนิโคดเกี่ยวกับปัญหาทางเทคนิค และข้อจำกัดต่าง ๆ อย่างไรก็ดี ยูนิโคดได้กลายเป็นวิธีการเข้ารหัสที่ใช้กันมากที่สุดในการทำให้ซอฟต์แวร์และระบบปฏิบัติการใช้ได้หลายภาษาพร้อม ๆ กัน
 
ระบบปฏิบัติการตระกูล[[ไมโครซอฟท์วินโดวส์|วินโดวส์]] ได้แก่[[วินโดวส์เอ็นที]], [[วินโดวส์ 2000]] และ [[วินโดวส์เอกซ์พี]] ใช้รหัสยูนิโคดแบบ [[UTF-16]] ในการเข้ารหัสข้อความ [[ระบบปฏิบัติการ]]ที่คล้ายกับ[[ยูนิกซ์]] เช่น [[ลีนุกซ์|GNU/Linux]] [[บีเอสดี|BSD]] และ [[แมคโอเอสเท็น|Mac OS X]] ก็ได้นำยูนิโคดแบบ [[UTF-8]] มาใช้ เป็นพื้นฐานของการแทนข้อความที่มีหลายภาษา
 
การรองรับภาษาไทยในยูนิโคด ได้รับการวิพากษ์วิจารณ์เนื่องจากว่าลำดับเรียงตัวอักษรนั้นไม่ถูกต้องตามที่ควรจะเป็น ซึ่งเป็นเพราะว่ายูนิโคดในส่วนภาษาไทยได้อ้างอิงรูปแบบเดิมจาก [[TIS-620|Thai Industry [[แบบอักขระ|อักขระอักขระ]]Standard 620]] (TIS-620) ที่มีปัญหานี้เช่นกัน จึงทำให้การเทียบเรียงลำดับยูนิโคดยุ่งยากขึ้น
 
== อ้างอิง ==