อักษรไทย

ตัวอักษร

อักษรไทย เป็นอักษรที่ใช้เขียนภาษาไทยและภาษาของกลุ่มชาติพันธุ์ต่างๆ เช่น คำเมือง, อีสาน, ภาษาไทยใต้, มลายูปัตตานี เป็นต้น ในประเทศไทย มีพยัญชนะ 44 รูป สระ 21 รูป วรรณยุกต์ 4 รูป และเครื่องหมายอื่น ๆ อีกจำนวนหนึ่ง พยัญชนะไทยจะเรียงตัวไปตามแนวนอน จากซ้ายไปขวา ส่วนสระจะอยู่หน้า บน ล่าง และหลังพยัญชนะประกอบคำแล้วแต่ชนิดของสระ

อักษรไทย
Thai Alphabet Sample.svg
ชนิดอักษรสระประกอบ
ภาษาพูดมาตรฐาน:
ภาษาไทย, ภาษาไทยใต้
ไม่เป็นมาตรฐาน:
คำเมือง, อีสาน,
มลายูปัตตานี, และอื่นๆ
ผู้ประดิษฐ์พ่อขุนรามคำแหงมหาราช[ใครกล่าว?]
ช่วงยุคพ.ศ. 1826 (ค.ศ. 1283) – ปัจจุบัน
ระบบแม่
ระบบลูกอักษรไทเวียด
ระบบพี่น้องอักษรลาว
ช่วงยูนิโคดU+0E00–U+0E7F
ISO 15924Thai
บทความนี้มีสัญลักษณ์สัทศาสตร์สัทอักษรสากล หากไม่มีการสนับสนุนเร็นเดอร์ที่เหมาะสม คุณอาจเห็นเครื่องหมายคำถาม กล่อง หรือสัญลักษณ์อื่นแทนอักขระยูนิโค้ด

อักษรไทยไม่มีการแยกอักษรตัวใหญ่หรืออักษรตัวเล็กอย่างอักษรโรมัน และไม่มีการเว้นวรรคระหว่างคำ เมื่อจบหนึ่งประโยคจะลงท้ายด้วยการเว้นวรรค กับมีเครื่องหมายวรรคตอนจำนวนหนึ่ง

ภาษาไทยมีตัวเลขเป็นของตัวเอง แต่นิยมใช้เลขอารบิกเป็นส่วนใหญ่ในชีวิตประจำวัน

ประวัติและวิวัฒนาการแก้ไข

 
วิวัฒนาการอักษรไทย

ราว พ.ศ. 400 ไทยได้อพยพจากถิ่นเดิมมาตั้งภูมิลำเนาอยู่ใกล้อาณาเขตมอญ ซึ่งกำลังเป็นชาติที่เจริญรุ่งเรืองในสมัยนั้น เริ่มแรกคงเริ่มเลียนแบบตัวอักษรมาจากมอญ ต่อมาราว พ.ศ. 1500 เมื่อขอมขยายอำนาจเข้ามาในดินแดนของคนไทยซึ่งตั้งอยู่บริเวณริมแม่น้ำยม และได้ปกครองเมืองเชรียงและเมืองสุโขทัย ไทยก็เริ่มดัดแปลงอักษรที่มีอยู่เดิมให้คล้ายกับอักษรขอมหวัด

อักษรมอญและอักษรขอมที่ไทยนำมาดัดแปลงใช้นั้นล้วนเป็นอักษรที่รับและแปลงรูปมาจากอักษรพราหมี ของพวกพราหมณ์ซึ่งแพร่หลายในอินเดียตอนเหนือ และอักษรสันสกฤตในสมัยราชวงศ์ปัลลวะ ซึ่งแพร่หลายบริเวณอินเดียตอนใต้ อักษรอินเดียทั้งคู่นี้ต่างก็รับแบบมาจากอักษรฟินิเชียนอีกชั้นหนึ่ง อักษรเฟนีเซียนับได้ว่าเป็นอักษรที่เก่าแก่ที่สุด และเป็นแม่แบบตัวอักษรของชาติต่างๆ ทั้งในเอเชียและยุโรป

ราว พ.ศ. 1826 พ่อขุนรามคำแหงทรงประดิษฐ์อักษรไทยที่เรียกกันว่า "ลายสือไทย" ขึ้น[ใครกล่าว?] ซึ่งได้เค้ารูปมาจากอักษรมอญและอักษรเขมรที่มีอยู่เดิม ทำให้อักษรไทยมีลักษณะคล้ายคลึงกับอักษรทั้งสอง แม้บางตัวจะไม่คล้ายกัน แต่ก็สามารถรู้ได้ว่าดัดแปลงมาจากอักษรตัวไหน

อักษรไทยมีการปรับปรุงอยู่เรื่อยๆ ในสมัยพญาฦๅไทราว พ.ศ. 1900 มีการแก้ไขตัวอักษรให้ผิดเพี้ยนไปบ้างเล็กน้อย โดยเฉพาะการเพิ่มเชิงที่ตัว ญ ซึ่งใช้ติดต่อเรื่อยมาจนทุกวันนี้ คาดว่าน่าจะเอาอย่างมาจากเขมร ในสมัยสมเด็จพระนารายณ์มหาราช ราว พ.ศ. 2223 ตัวอักษรเริ่มมีทรวดทรงดีขึ้นแต่ก็ไม่ทิ้งเค้าเดิม มีบางตัวเท่านั้นที่แก้ไขผิดไปจากเดิม คือตัว ฎ และ ธ ซึ่งเหมือนกับที่ใช้อยู่ในปัจจุบัน นักวิชาการจำนวนหนึ่งเชื่อว่าในสมัยสมเด็จพระนารายณ์มหาราช ตัวอักษรและการใช้งานมีความคล้ายคลึงกับในปัจจุบันมากที่สุด

อักษรไทยแก้ไข

อักษรไทย
รูปพยัญชนะ
รูปสระ
–ั –ํ –ิ ' "
–ุ –ู –็
ฤๅ ฦๅ
รูปวรรณยุกต์
–่ –้ –๊ –๋
เครื่องหมายอื่น ๆ
–์ –๎ –ฺ
เครื่องหมายวรรคตอน
ฯลฯ

พยัญชนะแก้ไข

พยัญชนะไทยมี 44 รูป แต่ละตัวมีชื่อเรียกโดยเฉพาะ สามารถแบ่งตามฐานที่ใช้ในการออกเสียงเป็นวรรค เสียงอ่านที่กำกับไว้คือเสียงเมื่อเป็นพยัญชนะต้น

วรรค ฐานกรณ์ กักสิถิล กักธนิตหรือเสียดแทรก นาสิก
วรรค กะ เพดานอ่อน ไก่
[k]
ไข่
[kʰ]
ขวด¹
[kʰ]
ควาย
[kʰ]
คน¹
[kʰ]
ระฆัง
[kʰ]
งู
[ŋ]
วรรค จะ เพดานแข็ง จาน
[t͡ɕ]
ฉิ่ง
[t͡ɕʰ]
ช้าง
[t͡ɕʰ]
โซ่
[s]
เฌอ
[t͡ɕʰ]
หญิง
[ɲ]²
วรรค ฏะ ปุ่มเหงือก ชฎา
[d]
ปฏัก
[t]
ฐาน
[tʰ]
มณโฑ
[tʰ]/[d]
ผู้เฒ่า
[tʰ]
เณร
[n]
วรรค ตะ เด็ก
[d]
เต่า
[t]
ถุง
[tʰ]
ทหาร
[tʰ]
ธง
[tʰ]
หนู
[n]
วรรค ปะ ริมฝีปาก ใบไม้
[b]
ปลา
[p]
ผึ้ง
[pʰ]
ฝา
[f]
พาน
[pʰ]
ฟัน
[f]
สำเภา
[pʰ]
ม้า
[m]
ไตรยางศ์ กลาง สูง ต่ำ
วรรค เปิดหรือรัว เสียดแทรก เปิดข้างลิ้น
ปุ่มเหงือก
กัก
เส้นเสียง
เสียดแทรก
เส้นเสียง
เศษวรรค ยักษ์
[j]
เรือ
[r]
ลิง
[l]
แหวน
[w]
ศาลา
[s]
ฤๅษี
[s]
เสือ
[s]
หีบ
[h]
จุฬา
[l]
อ่าง³
[ʔ]
นกฮูก
[h]
ไตรยางศ์ ต่ำ สูง ต่ำ กลาง ต่ำ
  1. ฃ และ ฅ เป็นอักษรที่ในปัจจุบันเลิกใช้แล้ว
  2. ในปัจจุบันเสียงนี้ถูกแทนที่ด้วย /j/ ในภาษาไทยกลาง แต่ยังคงพบได้ในภาษาไทยถิ่นอื่นๆ เช่น ภาษาไทยอีสาน เป็นต้น
  3. อ ถือว่าเป็นเสียงว่างให้รูปสระมาเกาะได้

พยัญชนะไทยยังแบ่งออกเป็น 3 หมู่ เรียกว่า ไตรยางศ์ ประกอบด้วย


ความถี่ของพยัญชนะไทย พยัญชนะไทยที่ใช้บ่อยที่สุดคือ น และที่ใช้น้อยที่สุดคือ ฅ ความถี่ที่แสดงในตารางอาจแตกต่างกันในทางปฏิบัติตามประเภทของข้อความ (ผู้อ่านสามารถทดลองเปิดหน้าข่าว หรือเปิดหนังสือ ebook สักเล่มแล้วลอง ค้นหา(search) อักษรโดดๆ เช่น ก ข ค ... จะพบว่าพยัญชนะไทยที่ใช้มากที่สุดในเอกสารนั้นคือ น (นอ หนู) หรืออาจจะเป็นตัวพยัญชนะ ร อ บ้างในบางเอกสารเท่านั้น)

Unicode Letter names พยัญชนะไทย ความถี่ TNC v.1 ความถี่ LEXiTRON Data 2.0 ความถี่ พจนานุกรมราชบัณฑิตฯ 2554
0E19 NO NU 9.68% 8.61% 8.29%
0E23 RO RUA 7.47% 9.17% 9.04%
0E2D O ANG 7.44% 6.61% 6.42%
0E01 KO KAI 7.35% 7.54% 7.79%
0E07 NGO NGU 6.90% 6.26% 5.66%
0E21 MO MA 6.24% 5.77% 5.78%
0E22 YO YAK 4.90% 4.90% 5.18%
0E27 WO WAEN 4.80% 4.71% 4.56%
0E25 LO LING 3.97% 4.26% 4.85%
0E14 DO DEK 3.96% 3.89% 3.60%
0E17 THO THAHAN 3.75% 2.89% 2.73%
0E2B HO HIP 3.59% 3.26% 3.67%
0E15 TO TAO 3.31% 3.81% 3.93%
0E04 KHO KHWAI 3.09% 3.35% 2.47%
0E2A SO SUA 3.07% 3.84% 4.13%
0E1B PO PLA 2.90% 2.60% 2.76%
0E1A BO BAIMAI 2.88% 3.06% 3.06%
0E08 CHO CHAN 2.69% 2.05% 1.98%
0E02 KHO KHAI 2.13% 1.78% 1.88%
0E1E PHO PHAN 1.95% 2.27% 2.43%
0E0A CHO CHANG 1.56% 1.73% 1.75%
0E1C PHO PHUNG 0.86% 0.87% 0.72%
0E16 THO THUNG 0.79% 0.79% 0.73%
0E13 NO NEN 0.64% 0.65% 0.80%
0E28 SO SALA 0.60% 0.89% 0.90%
0E18 THO THONG 0.56% 0.63% 0.78%
0E29 SO RUSI 0.47% 0.56% 0.60%
0E0D YO YING 0.46% 0.57% 0.57%
0E20 PHO SAMPHAO 0.44% 0.61% 0.70%
0E0B SO SO 0.42% 0.45% 0.43%
0E09 CHO CHING 0.25% 0.29% 0.36%
0E10 THO THAN 0.20% 0.15% 0.20%
0E1F FO FAN 0.18% 0.44% 0.33%
0E1D FO FA 0.13% 0.24% 0.20%
0E0F TO PATAK 0.08% 0.08% 0.14%
0E0E DO CHADA 0.08% 0.08% 0.08%
0E12 THO PHUTHAO 0.07% 0.04% 0.04%
0E2E HO NOKHUK 0.06% 0.10% 0.12%
0E11 THO NANGMONTHO 0.03% 0.11% 0.14%
0E06 KHO RAKHANG 0.03% 0.07% 0.12%
0E2C LO CHULA 0.02% 0.03% 0.07%
0E0C CHO CHOE 0.003% 0.01% 0.03%
0E03 KHO KHUAT 0.001% 0% 0%
0E05 KHO KHON 0.0003% 0% 0%

1นับความถี่จาก Thai National Corpus (1st version on CQPweb) จำนวน 34,782,267 โทเค็น

2นับความถี่ จากฐานข้อมูล LEXiTRON Data 2.0 จำนวนคำศัพท์ในพจนานุกรม 32,365 คำ

3นับความถี่จากฐานข้อมูล พจนานุกรม ฉบับราชบัณฑิตยสถาน พ.ศ.๒๕๕๔ จำนวนคำศัพท์ในพจนานุกรม 39,191 คำ (db.version 2018.07.24)

สระแก้ไข

สระในภาษาไทยมี 21 รูป ซึ่งรูปสระเหล่านี้จะนำไปประกอบเป็นรูปสระที่ใช้จริงอีกต่อหนึ่ง (ดูที่ ภาษาไทย)

วรรณยุกต์แก้ไข

วรรณยุกต์ในภาษาไทยมี 4 รูป 5 เสียง

เสียงวรรณยุกต์ไทยตามหลักภาษาศาสตร์ แบ่งได้ดังนี้

  • เสียงสามัญ (ระดับเสียงกึ่งสูง-กลาง)
  • เสียงเอก (ระดับเสียงกึ่งต่ำ-ต่ำ)
  • เสียงโท (ระดับเสียงสูง-ต่ำ)
  • เสียงตรี (ระดับเสียงกึ่งสูง-สูง)
  • เสียงจัตวา (ระดับเสียงต่ำ-กึ่งสูง)

รูปวรรณยุกต์แก้ไข

เครื่องหมายวรรณยุกต์ในภาษาไทย มี 4 รูป ดังนี้

ไม้เอก (-่) ไม้โท (-้) ไม้ตรี (-๊) และ ไม้จัตวา (-๋)

อย่างไรก็ตาม ในจารึกสมัยโบราณ เช่น ศิลาจารึกพ่อขุนรามคำแหง มีเครื่องหมายวรรณยุกต์เพียง 2 รูป คือ ไม้เอก (-่) และไม้โท (-๋)[ต้องการอ้างอิง] เช่น น๋อง (น้อง), ห๋า (ห้า)

การผันเสียงวรรณยุกต์แก้ไข

โดยทั่วไปเสียงพยางค์หนึ่งในภาษาไทย สามารถผันได้ ๕ เสียงวรรณยุกต์ แต่ในภาษาเขียน จะมีกฎเกณฑ์การผันที่ตายตัว ดังนี้

หมู่อักษร-คำเป็นคำตาย เสียงสามัญ เสียงเอก เสียงโท เสียงตรี เสียงจัตวา
อักษรกลาง คำเป็น กา ก่า ก้า ก๊า ก๋า
อักษรกลาง คำตาย สระสั้น - กะ ก้ะ ก๊ะ ก๋ะ
อักษรกลาง คำตาย สระยาว - กาบ ก้าบ ก๊าบ ก๋าบ
อักษรสูง คำเป็น - ข่า ข้า - ขา
อักษรสูง คำตาย สระสั้น - ขะ ข้ะ - -
อักษรสูง คำตาย สระยาว - ขาบ ข้าบ - -
อักษรต่ำ คำเป็น คา - ค่า ค้า -
อักษรต่ำ คำตาย สระสั้น - - ค่ะ คะ ค๋ะ
อักษรต่ำ คำตาย สระยาว - - คาบ ค้าบ ค๋าบ

คำตายของอักษรกลางและอักษรสูง ไม่ว่าสระจะเป็นเสียงสั้นหรือเสียงยาวก็ผันวรรณยุกต์ตามรูปแบบเดียวกัน เว้นแต่คำตายของอักษรต่ำ เมื่อเป็นสระเสียงสั้นหรือเสียงยาวจะผันคนละแบบ

อักษรต่ำและอักษรสูงไม่สามารถผันให้ครบ ๕ เสียงได้ จึงมักจะใช้อักษรเสียงเดียวกันจากอีกหมู่หนึ่งมาใช้เป็นอักษรนำ โดยมีอักษรสูงนำ (ยกเว้นอักษร อ ซึ่งเป็นอักษรกลาง สามารถนำ อักษร ย ได้) เช่น นา หน่า น่า น้า หนา, มี หมี่ มี่ มี้ หมี

ตัวเลขแก้ไข

ดูบทความหลักที่: เลขไทย

ตัวเลขที่เป็นอักษรไทย เรียกว่าเลขไทย มีลักษณะดังนี้

๐ ๑ ๒ ๓ ๔ ๕ ๖ ๗ ๘ ๙

วิธีการบอกจำนวนใช้ระบบประจำหลักเหมือนกับตระกูลเลขฮินดู-อารบิกอื่น ๆ

เครื่องหมายวรรคตอนแก้ไข

รหัสยูนิโคดสำหรับอักษรไทยแก้ไข

ช่วงรหัสยูนิโคด (Unicode) ของอักษรไทย คือ U+0E00 ถึง U+0E7F

ไทย
Unicode.org chart (PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+0E0x  
U+0E1x
U+0E2x
U+0E3x         ฿
U+0E4x
U+0E5x        
U+0E6x                                
U+0E7x                                


ดูเพิ่มแก้ไข

แหล่งข้อมูลอื่นแก้ไข