อักษรไทย

ตัวอักษร
(เปลี่ยนทางจาก อักษรต่ำ)

อักษรไทย เป็นอักษรที่ใช้เขียนภาษาไทยและภาษาของกลุ่มชาติพันธุ์ต่างๆ เช่น คำเมือง, อีสาน, ภาษาไทยใต้, มลายูปัตตานี เป็นต้น ในประเทศไทย มีพยัญชนะ 44 รูป สระ 21 รูป วรรณยุกต์ 4 รูป และเครื่องหมายอื่น ๆ อีกจำนวนหนึ่ง พยัญชนะไทยจะเรียงตัวไปตามแนวนอน จากซ้ายไปขวา ส่วนสระจะอยู่หน้า บน ล่าง และหลังพยัญชนะประกอบคำแล้วแต่ชนิดของสระ

อักษรไทย
ชนิดอักษรสระประกอบ
ภาษาพูดมาตรฐาน:
ภาษาไทย, ภาษาไทยใต้
ไม่เป็นมาตรฐาน:
คำเมือง, อีสาน,
มลายูปัตตานี, และอื่นๆ
ผู้ประดิษฐ์พ่อขุนรามคำแหงมหาราช[ใครกล่าว?]
ช่วงยุคพ.ศ. 1826 (ค.ศ. 1283) – ปัจจุบัน
ระบบแม่
ระบบลูกอักษรไทเวียด
ระบบพี่น้องอักษรฝักขาม
อักษรลาว
ช่วงยูนิโคดU+0E00–U+0E7F
ISO 15924Thai
บทความนี้มีสัญลักษณ์สัทศาสตร์สัทอักษรสากล หากไม่มีการสนับสนุนเร็นเดอร์ที่เหมาะสม คุณอาจเห็นเครื่องหมายคำถาม กล่อง หรือสัญลักษณ์อื่นแทนอักขระยูนิโค้ด

อักษรไทยไม่มีการแยกอักษรตัวใหญ่หรืออักษรตัวเล็กอย่างอักษรโรมัน และไม่มีการเว้นวรรคระหว่างคำ เมื่อจบหนึ่งประโยคจะลงท้ายด้วยการเว้นวรรค กับมีเครื่องหมายวรรคตอนจำนวนหนึ่ง

ภาษาไทยมีเลขไทยเป็นของตัวเอง แต่นิยมใช้ตัวเลขอาหรับเป็นส่วนใหญ่ในชีวิตประจำวัน

ประวัติและวิวัฒนาการ แก้

 
วิวัฒนาการอักษรไทย

ราว พ.ศ. 400 ไทยได้อพยพจากถิ่นเดิมมาตั้งภูมิลำเนาอยู่ใกล้อาณาเขตมอญ ซึ่งกำลังเป็นชาติที่เจริญรุ่งเรืองในสมัยนั้น เริ่มแรกคงเริ่มเลียนแบบตัวอักษรมาจากมอญ ต่อมาราว พ.ศ. 1500 เมื่อขอมขยายอำนาจเข้ามาในดินแดนของคนไทยซึ่งตั้งอยู่บริเวณริมแม่น้ำยม และได้ปกครองเมืองเชรียงและเมืองสุโขทัย ไทยก็เริ่มดัดแปลงอักษรที่มีอยู่เดิมให้คล้ายกับอักษรขอมหวัด

อักษรมอญและอักษรขอมที่ไทยนำมาดัดแปลงใช้นั้นล้วนเป็นอักษรที่รับและแปลงรูปมาจากอักษรพราหมี ของพวกพราหมณ์ซึ่งแพร่หลายในอินเดียตอนเหนือ และอักษรสันสกฤตในสมัยราชวงศ์ปัลลวะ ซึ่งแพร่หลายบริเวณอินเดียตอนใต้ อักษรอินเดียทั้งคู่นี้ต่างก็รับแบบมาจากอักษรฟินิเชียนอีกชั้นหนึ่ง อักษรเฟนีเซียนับได้ว่าเป็นอักษรที่เก่าแก่ที่สุด และเป็นแม่แบบตัวอักษรของชาติต่างๆ ทั้งในเอเชียและยุโรป

ราว พ.ศ. 1826 พ่อขุนรามคำแหงทรงประดิษฐ์อักษรไทยที่เรียกกันว่า "ลายสือไทย" ขึ้น[ใครกล่าว?] ซึ่งได้เค้ารูปมาจากอักษรมอญและอักษรขอมที่มีอยู่เดิม ทำให้อักษรไทยมีลักษณะคล้ายคลึงกับอักษรทั้งสอง แม้บางตัวจะไม่คล้ายกัน แต่ก็สามารถรู้ได้ว่าดัดแปลงมาจากอักษรตัวไหน

อักษรไทยมีการปรับปรุงอยู่เรื่อยๆ ในสมัยพญาฦๅไทราว พ.ศ. 1900 มีการแก้ไขตัวอักษรให้ผิดเพี้ยนไปบ้างเล็กน้อย โดยเฉพาะการเพิ่มเชิงที่ตัว ญ ซึ่งใช้ติดต่อเรื่อยมาจนทุกวันนี้ คาดว่าน่าจะเอาอย่างมาจากเขมร ในสมัยสมเด็จพระนารายณ์มหาราช ราว พ.ศ. 2223 ตัวอักษรเริ่มมีทรวดทรงดีขึ้นแต่ก็ไม่ทิ้งเค้าเดิม มีบางตัวเท่านั้นที่แก้ไขผิดไปจากเดิม คือตัว ฎ และ ธ ซึ่งเหมือนกับที่ใช้อยู่ในปัจจุบัน นักวิชาการจำนวนหนึ่งเชื่อว่าในสมัยสมเด็จพระนารายณ์มหาราช ตัวอักษรและการใช้งานมีความคล้ายคลึงกับในปัจจุบันมากที่สุด

อักษรไทย แก้

อักษรไทย
รูปพยัญชนะ
รูปสระ
–ั –ํ –ิ ' "
–ุ –ู –็
ฤๅ ฦๅ
รูปวรรณยุกต์
–่ –้ –๊ –๋
เครื่องหมายอื่น ๆ
–์ –๎ –ฺ
เครื่องหมายวรรคตอน
ฯลฯ

พยัญชนะ แก้

พยัญชนะไทยมี 44 รูป แต่ละตัวมีชื่อเรียกโดยเฉพาะ สามารถแบ่งตามฐานที่ใช้ในการออกเสียงเป็นวรรค เสียงอ่านที่กำกับไว้คือเสียงเมื่อเป็นพยัญชนะต้น

วรรค ฐานกรณ์ กักสิถิล กักธนิตหรือเสียดแทรก นาสิก
วรรค กะ เพดานอ่อน ไก่
[k]
ไข่
[kʰ]
ขวด¹
[kʰ]
ควาย
[kʰ]
คน¹
[kʰ]
ระฆัง
[kʰ]
งู
[ŋ]
วรรค จะ เพดานแข็ง จาน
[t͡ɕ]
ฉิ่ง
[t͡ɕʰ]
ช้าง
[t͡ɕʰ]
โซ่
[s]
เฌอ
[t͡ɕʰ]
หญิง
[ɲ]²
วรรค ฏะ ปุ่มเหงือก ชฎา
[d]
ปฏัก
[t]
ฐาน
[tʰ]
มณโฑ
[tʰ]/[d]
ผู้เฒ่า
[tʰ]
เณร
[n]
วรรค ตะ เด็ก
[d]
เต่า
[t]
ถุง
[tʰ]
ทหาร
[tʰ]
ธง
[tʰ]
หนู
[n]
วรรค ปะ ริมฝีปาก ใบไม้
[b]
ปลา
[p]
ผึ้ง
[pʰ]
ฝา
[f]
พาน
[pʰ]
ฟัน
[f]
สำเภา
[pʰ]
ม้า
[m]
ไตรยางศ์ กลาง สูง ต่ำ
วรรค เปิดหรือรัว เสียดแทรก เปิดข้างลิ้น
ปุ่มเหงือก
กัก
เส้นเสียง
เสียดแทรก
เส้นเสียง
เศษวรรค ยักษ์
[j]
เรือ
[r]
ลิง
[l]
แหวน
[w]
ศาลา
[s]
ฤๅษี
[s]
เสือ
[s]
หีบ
[h]
จุฬา
[l]
อ่าง³
[ʔ]
นกฮูก
[h]
ไตรยางศ์ ต่ำ สูง ต่ำ กลาง ต่ำ
  1. ฃ และ ฅ เป็นอักษรที่ในปัจจุบันเลิกใช้แล้ว
  2. ในปัจจุบันเสียงนี้ถูกแทนที่ด้วย /j/ ในภาษาไทยกลาง แต่ยังคงพบได้ในภาษาไทยถิ่นอื่นๆ เช่น ภาษาไทยอีสาน เป็นต้น
  3. อ ถือว่าเป็นเสียงว่างให้รูปสระมาเกาะได้

พยัญชนะไทยยังแบ่งออกเป็น 3 หมู่ เรียกว่า ไตรยางศ์ ประกอบด้วย

ความถี่ของพยัญชนะไทย พยัญชนะไทยที่ใช้บ่อยที่สุดคือ น และที่ใช้น้อยที่สุดคือ ฅ ความถี่ที่แสดงในตารางอาจแตกต่างกันในทางปฏิบัติตามประเภทของข้อความ (ผู้อ่านสามารถทดลองเปิดหน้าข่าว หรือเปิดหนังสือ ebook สักเล่มแล้วลอง ค้นหา(search) อักษรโดดๆ เช่น ก ข ค ... จะพบว่าพยัญชนะไทยที่ใช้มากที่สุดในเอกสารนั้นคือ น (นอ หนู) หรืออาจจะเป็นตัวพยัญชนะ ร อ บ้างในบางเอกสารเท่านั้น)

ยูนิโคด ชื่อตัวอักษร พยัญชนะไทย ความถี่ TNC v.1 ความถี่ LEXiTRON Data 2.0 ความถี่ พจนานุกรมราชบัณฑิตฯ 2554
0E19 NO NU 9.68% 8.61% 8.29%
0E23 RO RUA 7.47% 9.17% 9.04%
0E2D O ANG 7.44% 6.61% 6.42%
0E01 KO KAI 7.35% 7.54% 7.79%
0E07 NGO NGU 6.90% 6.26% 5.66%
0E21 MO MA 6.24% 5.77% 5.78%
0E22 YO YAK 4.90% 4.90% 5.18%
0E27 WO WAEN 4.80% 4.71% 4.56%
0E25 LO LING 3.97% 4.26% 4.85%
0E14 DO DEK 3.96% 3.89% 3.60%
0E17 THO THAHAN 3.75% 2.89% 2.73%
0E2B HO HIP 3.59% 3.26% 3.67%
0E15 TO TAO 3.31% 3.81% 3.93%
0E04 KHO KHWAI 3.09% 3.35% 2.47%
0E2A SO SUA 3.07% 3.84% 4.13%
0E1B PO PLA 2.90% 2.60% 2.76%
0E1A BO BAIMAI 2.88% 3.06% 3.06%
0E08 CHO CHAN 2.69% 2.05% 1.98%
0E02 KHO KHAI 2.13% 1.78% 1.88%
0E1E PHO PHAN 1.95% 2.27% 2.43%
0E0A CHO CHANG 1.56% 1.73% 1.75%
0E1C PHO PHUNG 0.86% 0.87% 0.72%
0E16 THO THUNG 0.79% 0.79% 0.73%
0E13 NO NEN 0.64% 0.65% 0.80%
0E28 SO SALA 0.60% 0.89% 0.90%
0E18 THO THONG 0.56% 0.63% 0.78%
0E29 SO RUSI 0.47% 0.56% 0.60%
0E0D YO YING 0.46% 0.57% 0.57%
0E20 PHO SAMPHAO 0.44% 0.61% 0.70%
0E0B SO SO 0.42% 0.45% 0.43%
0E09 CHO CHING 0.25% 0.29% 0.36%
0E10 THO THAN 0.20% 0.15% 0.20%
0E1F FO FAN 0.18% 0.44% 0.33%
0E1D FO FA 0.13% 0.24% 0.20%
0E0F TO PATAK 0.08% 0.08% 0.14%
0E0E DO CHADA 0.08% 0.08% 0.08%
0E12 THO PHUTHAO 0.07% 0.04% 0.04%
0E2E HO NOKHUK 0.06% 0.10% 0.12%
0E11 THO NANGMONTHO 0.03% 0.11% 0.14%
0E06 KHO RAKHANG 0.03% 0.07% 0.12%
0E2C LO CHULA 0.02% 0.03% 0.07%
0E0C CHO CHOE 0.003% 0.01% 0.03%
0E03 KHO KHUAT 0.001% 0% 0%
0E05 KHO KHON 0.0003% 0% 0%

1นับความถี่จาก Thai National Corpus (1st version on CQPweb) จำนวน 34,782,267 โทเค็น

2นับความถี่ จากฐานข้อมูล LEXiTRON Data 2.0 จำนวนคำศัพท์ในพจนานุกรม 32,365 คำ เก็บถาวร 2017-09-27 ที่ เวย์แบ็กแมชชีน

3นับความถี่จากฐานข้อมูล พจนานุกรม ฉบับราชบัณฑิตยสถาน พ.ศ. ๒๕๕๔ จำนวนคำศัพท์ในพจนานุกรม 39,191 คำ (db.version 2018.07.24)

สระ แก้

สระในภาษาไทยมี 21 รูป ซึ่งรูปสระเหล่านี้จะนำไปประกอบเป็นรูปสระที่ใช้จริงอีกต่อหนึ่ง (ดูที่ ภาษาไทย)

วรรณยุกต์ แก้

วรรณยุกต์ในภาษาไทยมี 4 รูป 5 เสียง

เสียงวรรณยุกต์ไทยตามหลักภาษาศาสตร์ แบ่งได้ดังนี้

  • เสียงสามัญ (ระดับเสียงกึ่งสูง-กลาง)
  • เสียงเอก (ระดับเสียงกึ่งต่ำ-ต่ำ)
  • เสียงโท (ระดับเสียงสูง-ต่ำ)
  • เสียงตรี (ระดับเสียงกึ่งสูง-สูง)
  • เสียงจัตวา (ระดับเสียงต่ำ-กึ่งสูง)

รูปวรรณยุกต์ แก้

เครื่องหมายวรรณยุกต์ในภาษาไทย มี 4 รูป ดังนี้

ไม้เอก (-่) ไม้โท (-้) ไม้ตรี (-๊) และ ไม้จัตวา (-๋)

อย่างไรก็ตาม ในจารึกสมัยโบราณ เช่น ศิลาจารึกพ่อขุนรามคำแหง มีเครื่องหมายวรรณยุกต์เพียง 2 รูป คือ ไม้เอก (-่) และไม้โท (-๋)[ต้องการอ้างอิง] เช่น น๋อง (น้อง), ห๋า (ห้า)

การผันเสียงวรรณยุกต์ แก้

โดยทั่วไปเสียงพยางค์หนึ่งในภาษาไทย สามารถผันได้ ๕ เสียงวรรณยุกต์ แต่ในภาษาเขียน จะมีกฎเกณฑ์การผันที่ตายตัว ดังนี้

หมู่อักษร-คำเป็นคำตาย เสียงสามัญ เสียงเอก เสียงโท เสียงตรี เสียงจัตวา
อักษรกลาง คำเป็น กา ก่า ก้า ก๊า ก๋า
อักษรกลาง คำตาย สระสั้น - กะ ก้ะ ก๊ะ ก๋ะ
อักษรกลาง คำตาย สระยาว - กาบ ก้าบ ก๊าบ ก๋าบ
อักษรสูง คำเป็น - ข่า ข้า - ขา
อักษรสูง คำตาย สระสั้น - ขะ ข้ะ - -
อักษรสูง คำตาย สระยาว - ขาบ ข้าบ - -
อักษรต่ำ คำเป็น คา - ค่า ค้า -
อักษรต่ำ คำตาย สระสั้น - - ค่ะ คะ ค๋ะ
อักษรต่ำ คำตาย สระยาว - - คาบ ค้าบ ค๋าบ

คำตายของอักษรกลางและอักษรสูง ไม่ว่าสระจะเป็นเสียงสั้นหรือเสียงยาวก็ผันวรรณยุกต์ตามรูปแบบเดียวกัน เว้นแต่คำตายของอักษรต่ำ เมื่อเป็นสระเสียงสั้นหรือเสียงยาวจะผันคนละแบบ

อักษรต่ำและอักษรสูงไม่สามารถผันให้ครบ ๕ เสียงได้ จึงมักจะใช้อักษรเสียงเดียวกันจากอีกหมู่หนึ่งมาใช้เป็นอักษรนำ โดยมีอักษรสูงนำ (ยกเว้นอักษร อ ซึ่งเป็นอักษรกลาง สามารถนำ อักษร ย ได้) เช่น นา หน่า น่า น้า หนา, มี หมี่ มี่ มี้ หมี

ตัวเลข แก้

ตัวเลขที่เป็นอักษรไทย เรียกว่าเลขไทย มีลักษณะดังนี้

๐ ๑ ๒ ๓ ๔ ๕ ๖ ๗ ๘ ๙

วิธีการบอกจำนวนใช้ระบบประจำหลักเหมือนกับตระกูลตัวเลขอาหรับอื่น ๆ

เครื่องหมายวรรคตอน แก้

รหัสยูนิโคดสำหรับอักษรไทย แก้

ช่วงรหัสยูนิโคด (Unicode) ของอักษรไทย คือ U+0E00 ถึง U+0E7F

ไทย
Unicode.org chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0E0x  
U+0E1x
U+0E2x
U+0E3x         ฿
U+0E4x
U+0E5x        
U+0E6x                                
U+0E7x                                


ดูเพิ่ม แก้

แหล่งข้อมูลอื่น แก้