อักษรไทย
บทความนี้ยังต้องการเพิ่มแหล่งอ้างอิงเพื่อพิสูจน์ความถูกต้อง |
อักษรไทย เป็นอักษรที่ใช้เขียนภาษาไทยและภาษาของกลุ่มชาติพันธุ์ต่างๆ เช่น คำเมือง, อีสาน, ภาษาไทยใต้, มลายูปัตตานี เป็นต้น ในประเทศไทย มีพยัญชนะ 44 รูป สระ 21 รูป วรรณยุกต์ 4 รูป และเครื่องหมายอื่น ๆ อีกจำนวนหนึ่ง พยัญชนะไทยจะเรียงตัวไปตามแนวนอน จากซ้ายไปขวา ส่วนสระจะอยู่หน้า บน ล่าง และหลังพยัญชนะประกอบคำแล้วแต่ชนิดของสระ
อักษรไทย | |
---|---|
ชนิด | |
ผู้ประดิษฐ์ | พ่อขุนรามคำแหงมหาราช[ใคร?] |
ช่วงยุค | พ.ศ. 1826 (ค.ศ. 1283) – ปัจจุบัน |
ทิศทาง | ซ้ายไปขวา |
ภาษาพูด | มาตรฐาน: ภาษาไทย, ภาษาไทยใต้ ไม่เป็นมาตรฐาน: คำเมือง, อีสาน, มลายูปัตตานี, และอื่นๆ |
อักษรที่เกี่ยวข้อง | |
ระบบแม่ | |
ระบบลูก | อักษรไทเวียด |
ระบบพี่น้อง | อักษรฝักขาม อักษรลาว |
ISO 15924 | |
ISO 15924 | Thai (352), Thai |
ยูนิโคด | |
ยูนิโคดแฝง | Thai |
ช่วงยูนิโคด | U+0E00–U+0E7F |
อักษรไทยไม่มีการแยกอักษรตัวใหญ่หรืออักษรตัวเล็กอย่างอักษรโรมัน และไม่มีการเว้นวรรคระหว่างคำ เมื่อจบหนึ่งประโยคจะลงท้ายด้วยการเว้นวรรค กับมีเครื่องหมายวรรคตอนจำนวนหนึ่ง
ภาษาไทยมีเลขไทยเป็นของตัวเอง แต่นิยมใช้ตัวเลขอาหรับเป็นส่วนใหญ่ในชีวิตประจำวัน
ประวัติและวิวัฒนาการ
แก้ราว พ.ศ. 400 ไทยได้อพยพจากถิ่นเดิมมาตั้งภูมิลำเนาอยู่ใกล้อาณาเขตมอญ ซึ่งกำลังเป็นชาติที่เจริญรุ่งเรืองในสมัยนั้น เริ่มแรกคงเริ่มเลียนแบบตัวอักษรมาจากมอญ ต่อมาราว พ.ศ. 1500 เมื่อขอมขยายอำนาจเข้ามาในดินแดนของคนไทยซึ่งตั้งอยู่บริเวณริมแม่น้ำยม และได้ปกครองเมืองเชลียงและเมืองสุโขทัย ไทยก็เริ่มดัดแปลงอักษรที่มีอยู่เดิมให้คล้ายกับอักษรขอมหวัด
อักษรมอญและอักษรขอมที่ไทยนำมาดัดแปลงใช้นั้นล้วนเป็นอักษรที่รับและแปลงรูปมาจากอักษรพราหมี ของพวกพราหมณ์ซึ่งแพร่หลายในอินเดียตอนเหนือ และอักษรสันสกฤตในสมัยราชวงศ์ปัลลวะ ซึ่งแพร่หลายบริเวณอินเดียตอนใต้ อักษรอินเดียทั้งคู่นี้ต่างก็รับแบบมาจากอักษรฟินิเชียนอีกชั้นหนึ่ง อักษรเฟนีเซียนับได้ว่าเป็นอักษรที่เก่าแก่ที่สุด และเป็นแม่แบบตัวอักษรของชาติต่างๆ ทั้งในเอเชียและยุโรป
ราว พ.ศ. 1826 พ่อขุนรามคำแหงทรงประดิษฐ์อักษรไทยที่เรียกกันว่า "ลายสือไทย" ขึ้น[ใคร?] ซึ่งได้เค้ารูปมาจากอักษรมอญและอักษรขอมที่มีอยู่เดิม ทำให้อักษรไทยมีลักษณะคล้ายคลึงกับอักษรทั้งสอง แม้บางตัวจะไม่คล้ายกัน แต่ก็สามารถรู้ได้ว่าดัดแปลงมาจากอักษรตัวไหน
อักษรไทยมีการปรับปรุงอยู่เรื่อยๆ ในสมัยพญาฦๅไทราว พ.ศ. 1900 มีการแก้ไขตัวอักษรให้ผิดเพี้ยนไปบ้างเล็กน้อย โดยเฉพาะการเพิ่มเชิงที่ตัว ญ ซึ่งใช้ติดต่อเรื่อยมาจนทุกวันนี้ คาดว่าน่าจะเอาอย่างมาจากเขมร ในสมัยสมเด็จพระนารายณ์มหาราช ราว พ.ศ. 2223 ตัวอักษรเริ่มมีทรวดทรงดีขึ้นแต่ก็ไม่ทิ้งเค้าเดิม มีบางตัวเท่านั้นที่แก้ไขผิดไปจากเดิม คือตัว ฎ และ ธ ซึ่งเหมือนกับที่ใช้อยู่ในปัจจุบัน นักวิชาการจำนวนหนึ่งเชื่อว่าในสมัยสมเด็จพระนารายณ์มหาราช ตัวอักษรและการใช้งานมีความคล้ายคลึงกับในปัจจุบันมากที่สุด
อักษรไทย
แก้อักษรไทย | |||||||
---|---|---|---|---|---|---|---|
รูปพยัญชนะ | |||||||
ก | ข | ฃ | ค | ฅ | ฆ | ง | จ |
ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ | ฐ |
ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ |
น | บ | ป | ผ | ฝ | พ | ฟ | ภ |
ม | ย | ร | ล | ว | ศ | ษ | ส |
ห | ฬ | อ | ฮ | ||||
รูปสระ | |||||||
ะ | –ั | า | –ํ | –ิ | ' | " | |
–ุ | –ู | เ | โ | ใ | ไ | –็ | |
อ | ว | ย | ฤ | ฤๅ | ฦ | ฦๅ | |
รูปวรรณยุกต์ | |||||||
–่ | –้ | –๊ | –๋ | ||||
เครื่องหมายอื่น ๆ | |||||||
–์ | –๎ | –ฺ | |||||
เครื่องหมายวรรคตอน | |||||||
ฯ | ฯลฯ | ๆ | |||||
๏ | ๚ | ๛ | ┼ |
พยัญชนะ
แก้พยัญชนะไทยมี 44 รูป แต่ละตัวมีชื่อเรียกโดยเฉพาะ สามารถแบ่งตามฐานที่ใช้ในการออกเสียงเป็นวรรค เสียงอ่านที่กำกับไว้คือเสียงเมื่อเป็นพยัญชนะต้น
วรรค ฐานกรณ์ กักสิถิล กักธนิตหรือเสียดแทรก นาสิก วรรค กะ เพดานอ่อน ก ไก่
[k~g]ข ไข่
[kʰ~x]ฃ ขวด¹
[kʰ~x]ค ควาย
[kʰ~x]ฅ คน¹
[kʰ~x]ฆ ระฆัง
[kʰ~x]ง งู
[ŋ]วรรค จะ เพดานแข็ง จ จาน
[t͡ɕ]ฉ ฉิ่ง
[t͡ɕʰ]ช ช้าง
[t͡ɕʰ]ซ โซ่
[s~z~ɕ]ฌ เฌอ
[t͡ɕʰ]ญ หญิง
[ɲ]²วรรค ฏะ ปุ่มเหงือก ฎ ชฎา
[d̪]ฏ ปฏัก
[t̪]ฐ ฐาน
[tʰ]ฑ มณโฑ
[tʰ]/[d̪]ฒ ผู้เฒ่า
[tʰ]ณ เณร
[n]วรรค ตะ ด เด็ก
[d̪]ต เต่า
[t̪]ถ ถุง
[tʰ]ท ทหาร
[tʰ]ธ ธง
[tʰ]น หนู
[n]วรรค ปะ ริมฝีปาก บ ใบไม้
[b]ป ปลา
[p]ผ ผึ้ง
[pʰ]ฝ ฝา
[f]พ พาน
[pʰ]ฟ ฟัน
[f]ภ สำเภา
[pʰ]ม ม้า
[m]ไตรยางศ์ กลาง สูง ต่ำ
วรรค เปิดหรือรัว เสียดแทรก เปิดข้างลิ้น
ปุ่มเหงือกกัก
เส้นเสียงเสียดแทรก
เส้นเสียงเศษวรรค ย ยักษ์
[j]ร เรือ
[r~ɹ]ล ลิง
[l]ว แหวน
[ʋ~w]ศ ศาลา
[s~z~ɕ]ษ ฤๅษี
[s~z~ɕ]ส เสือ
[s~z~ɕ]ห หีบ
[h]ฬ จุฬา
[l]อ อ่าง³
[ʔ]ฮ นกฮูก
[h]ไตรยางศ์ ต่ำ สูง ต่ำ กลาง ต่ำ
- ฃ และ ฅ เป็นอักษรที่ในปัจจุบันเลิกใช้แล้ว
- ในปัจจุบันเสียงนี้ถูกแทนที่ด้วย /j/ ในภาษาไทยกลาง แต่ยังคงพบได้ในภาษาไทยถิ่นอื่นๆ เช่น ภาษาไทยอีสาน เป็นต้น
- อ ถือว่าเป็นเสียงว่างให้รูปสระมาเกาะได้
พยัญชนะไทยยังแบ่งออกเป็น 3 หมู่ เรียกว่า ไตรยางศ์ ประกอบด้วย
- อักษรสูง 11 ตัว ได้แก่ ข ฃ ฉ ฐ ถ ผ ฝ ศ ษ ส ห
- อักษรกลาง 9 ตัว ได้แก่ ก จ ฎ ฏ ด ต บ ป อ
- อักษรต่ำ 24 ตัว ได้แก่ ค ฅ ฆ ง ช ซ ฌ ญ ฑ ฒ ณ ท ธ น พ ฟ ภ ม ย ร ล ว ฬ ฮ
ความถี่ของพยัญชนะไทย พยัญชนะไทยที่ใช้บ่อยที่สุดคือ น และที่ใช้น้อยที่สุดคือ ฅ ความถี่ที่แสดงในตารางอาจแตกต่างกันในทางปฏิบัติตามประเภทของข้อความ (ผู้อ่านสามารถทดลองเปิดหน้าข่าว หรือเปิดหนังสือ ebook สักเล่มแล้วลอง ค้นหา(search) อักษรโดดๆ เช่น ก ข ค ... จะพบว่าพยัญชนะไทยที่ใช้มากที่สุดในเอกสารนั้นคือ น (นอ หนู) หรืออาจจะเป็นตัวพยัญชนะ ร อ บ้างในบางเอกสารเท่านั้น)
ยูนิโคด | ชื่อตัวอักษร | พยัญชนะไทย | ความถี่ TNC v.1 | ความถี่ LEXiTRON Data 2.0 | ความถี่ พจนานุกรมราชบัณฑิตฯ 2554 |
---|---|---|---|---|---|
0E19 | NO NU | น | 9.68% | 8.61% | 8.29% |
0E23 | RO RUA | ร | 7.47% | 9.17% | 9.04% |
0E2D | O ANG | อ | 7.44% | 6.61% | 6.42% |
0E01 | KO KAI | ก | 7.35% | 7.54% | 7.79% |
0E07 | NGO NGU | ง | 6.90% | 6.26% | 5.66% |
0E21 | MO MA | ม | 6.24% | 5.77% | 5.78% |
0E22 | YO YAK | ย | 4.90% | 4.90% | 5.18% |
0E27 | WO WAEN | ว | 4.80% | 4.71% | 4.56% |
0E25 | LO LING | ล | 3.97% | 4.26% | 4.85% |
0E14 | DO DEK | ด | 3.96% | 3.89% | 3.60% |
0E17 | THO THAHAN | ท | 3.75% | 2.89% | 2.73% |
0E2B | HO HIP | ห | 3.59% | 3.26% | 3.67% |
0E15 | TO TAO | ต | 3.31% | 3.81% | 3.93% |
0E04 | KHO KHWAI | ค | 3.09% | 3.35% | 2.47% |
0E2A | SO SUA | ส | 3.07% | 3.84% | 4.13% |
0E1B | PO PLA | ป | 2.90% | 2.60% | 2.76% |
0E1A | BO BAIMAI | บ | 2.88% | 3.06% | 3.06% |
0E08 | CHO CHAN | จ | 2.69% | 2.05% | 1.98% |
0E02 | KHO KHAI | ข | 2.13% | 1.78% | 1.88% |
0E1E | PHO PHAN | พ | 1.95% | 2.27% | 2.43% |
0E0A | CHO CHANG | ช | 1.56% | 1.73% | 1.75% |
0E1C | PHO PHUNG | ผ | 0.86% | 0.87% | 0.72% |
0E16 | THO THUNG | ถ | 0.79% | 0.79% | 0.73% |
0E13 | NO NEN | ณ | 0.64% | 0.65% | 0.80% |
0E28 | SO SALA | ศ | 0.60% | 0.89% | 0.90% |
0E18 | THO THONG | ธ | 0.56% | 0.63% | 0.78% |
0E29 | SO RUSI | ษ | 0.47% | 0.56% | 0.60% |
0E0D | YO YING | ญ | 0.46% | 0.57% | 0.57% |
0E20 | PHO SAMPHAO | ภ | 0.44% | 0.61% | 0.70% |
0E0B | SO SO | ซ | 0.42% | 0.45% | 0.43% |
0E09 | CHO CHING | ฉ | 0.25% | 0.29% | 0.36% |
0E10 | THO THAN | ฐ | 0.20% | 0.15% | 0.20% |
0E1F | FO FAN | ฟ | 0.18% | 0.44% | 0.33% |
0E1D | FO FA | ฝ | 0.13% | 0.24% | 0.20% |
0E0F | TO PATAK | ฏ | 0.08% | 0.08% | 0.14% |
0E0E | DO CHADA | ฎ | 0.08% | 0.08% | 0.08% |
0E12 | THO PHUTHAO | ฒ | 0.07% | 0.04% | 0.04% |
0E2E | HO NOKHUK | ฮ | 0.06% | 0.10% | 0.12% |
0E11 | THO NANGMONTHO | ฑ | 0.03% | 0.11% | 0.14% |
0E06 | KHO RAKHANG | ฆ | 0.03% | 0.07% | 0.12% |
0E2C | LO CHULA | ฬ | 0.02% | 0.03% | 0.07% |
0E0C | CHO CHOE | ฌ | 0.003% | 0.01% | 0.03% |
0E03 | KHO KHUAT | ฃ | 0.001% | 0% | 0% |
0E05 | KHO KHON | ฅ | 0.0003% | 0% | 0% |
1นับความถี่จาก Thai National Corpus (1st version on CQPweb) จำนวน 34,782,267 โทเค็น
2นับความถี่ จากฐานข้อมูล LEXiTRON Data 2.0 จำนวนคำศัพท์ในพจนานุกรม 32,365 คำ เก็บถาวร 2017-09-27 ที่ เวย์แบ็กแมชชีน
สระ
แก้สระในภาษาไทยมี 21 รูป ซึ่งรูปสระเหล่านี้จะนำไปประกอบเป็นรูปสระที่ใช้จริงอีกต่อหนึ่ง (ดูที่ ภาษาไทย)
|
|
วรรณยุกต์
แก้วรรณยุกต์ในภาษาไทยมี 4 รูป 5 เสียง
เสียงวรรณยุกต์ไทยตามหลักภาษาศาสตร์ แบ่งได้ดังนี้
- เสียงสามัญ (ระดับเสียงกึ่งสูง-กลาง)
- เสียงเอก (ระดับเสียงกึ่งต่ำ-ต่ำ)
- เสียงโท (ระดับเสียงสูง-ต่ำ)
- เสียงตรี (ระดับเสียงกึ่งสูง-สูง)
- เสียงจัตวา (ระดับเสียงต่ำ-กึ่งสูง)
รูปวรรณยุกต์
แก้เครื่องหมายวรรณยุกต์ในภาษาไทย มี 4 รูป ดังนี้
ไม้เอก (-่) ไม้โท (-้) ไม้ตรี (-๊) และ ไม้จัตวา (-๋)
อย่างไรก็ตาม ในจารึกสมัยโบราณ เช่น ศิลาจารึกพ่อขุนรามคำแหง มีเครื่องหมายวรรณยุกต์เพียง 2 รูป คือ ไม้เอก (-่) และไม้โท (-๋)[ต้องการอ้างอิง] เช่น น๋อง (น้อง), ห๋า (ห้า)
การผันเสียงวรรณยุกต์
แก้โดยทั่วไปเสียงพยางค์หนึ่งในภาษาไทย สามารถผันได้ ๕ เสียงวรรณยุกต์ แต่ในภาษาเขียน จะมีกฎเกณฑ์การผันที่ตายตัว ดังนี้
หมู่อักษร-คำเป็นคำตาย | เสียงสามัญ | เสียงเอก | เสียงโท | เสียงตรี | เสียงจัตวา |
---|---|---|---|---|---|
อักษรกลาง คำเป็น | กา | ก่า | ก้า | ก๊า | ก๋า |
อักษรกลาง คำตาย สระสั้น | - | กะ | ก้ะ | ก๊ะ | ก๋ะ |
อักษรกลาง คำตาย สระยาว | - | กาบ | ก้าบ | ก๊าบ | ก๋าบ |
อักษรสูง คำเป็น | - | ข่า | ข้า | - | ขา |
อักษรสูง คำตาย สระสั้น | - | ขะ | ข้ะ | - | - |
อักษรสูง คำตาย สระยาว | - | ขาบ | ข้าบ | - | - |
อักษรต่ำ คำเป็น | คา | - | ค่า | ค้า | - |
อักษรต่ำ คำตาย สระสั้น | - | - | ค่ะ | คะ | ค๋ะ |
อักษรต่ำ คำตาย สระยาว | - | - | คาบ | ค้าบ | ค๋าบ |
คำตายของอักษรกลางและอักษรสูง ไม่ว่าสระจะเป็นเสียงสั้นหรือเสียงยาวก็ผันวรรณยุกต์ตามรูปแบบเดียวกัน เว้นแต่คำตายของอักษรต่ำ เมื่อเป็นสระเสียงสั้นหรือเสียงยาวจะผันคนละแบบ
อักษรต่ำและอักษรสูงไม่สามารถผันให้ครบ ๕ เสียงได้ จึงมักจะใช้อักษรเสียงเดียวกันจากอีกหมู่หนึ่งมาใช้เป็นอักษรนำ โดยมีอักษรสูงนำ (ยกเว้นอักษร อ ซึ่งเป็นอักษรกลาง สามารถนำ อักษร ย ได้) เช่น นา หน่า น่า น้า หนา, มี หมี่ มี่ มี้ หมี
ตัวเลข
แก้ตัวเลขที่เป็นอักษรไทย เรียกว่าเลขไทย มีลักษณะดังนี้
- ๐ ๑ ๒ ๓ ๔ ๕ ๖ ๗ ๘ ๙
วิธีการบอกจำนวนใช้ระบบประจำหลักเหมือนกับตระกูลตัวเลขอาหรับอื่น ๆ
เครื่องหมายวรรคตอน
แก้
|
รหัสยูนิโคดสำหรับอักษรไทย
แก้ช่วงรหัสยูนิโคด (Unicode) ของอักษรไทย คือ U+0E00 ถึง U+0E7F
ไทย Unicode.org chart (PDF) | ||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F | |
U+0E0x | ก | ข | ฃ | ค | ฅ | ฆ | ง | จ | ฉ | ช | ซ | ฌ | ญ | ฎ | ฏ | |
U+0E1x | ฐ | ฑ | ฒ | ณ | ด | ต | ถ | ท | ธ | น | บ | ป | ผ | ฝ | พ | ฟ |
U+0E2x | ภ | ม | ย | ร | ฤ | ล | ฦ | ว | ศ | ษ | ส | ห | ฬ | อ | ฮ | ฯ |
U+0E3x | ะ | ั | า | ำ | ิ | ี | ึ | ื | ุ | ู | ฺ | ฿ | ||||
U+0E4x | เ | แ | โ | ใ | ไ | ๅ | ๆ | ็ | ่ | ้ | ๊ | ๋ | ์ | ํ | ๎ | ๏ |
U+0E5x | ๐ | ๑ | ๒ | ๓ | ๔ | ๕ | ๖ | ๗ | ๘ | ๙ | ๚ | ๛ | ||||
U+0E6x | ||||||||||||||||
U+0E7x |