ผลต่างระหว่างรุ่นของ "การเรียนรู้ของเครื่อง"

เนื้อหาที่ลบ เนื้อหาที่เพิ่ม
แทนที่เนื้อหาด้วย "== วิธีการเรียนรู้ =="
ป้ายระบุ: ถูกแทน แก้ไขจากอุปกรณ์เคลื่อนที่ แก้ไขจากเว็บสำหรับอุปกรณ์เคลื่อนที่
Chainwit. (คุย | ส่วนร่วม)
ย้อนกลับไปรุ่นที่ 8900069 โดย Hamishด้วยสจห.
ป้ายระบุ: ทำกลับ
บรรทัด 1:
'''การเรียนรู้ของเครื่อง''' ({{lang-en|machine learning}}) เป็นสาขาหนึ่งของ[[ปัญญาประดิษฐ์]]ที่พัฒนามาจากการศึกษา[[การรู้จำแบบ]] เกี่ยวข้องกับการศึกษาและการสร้างอัลกอริทึมที่สามารถเรียนรู้ข้อมูลและทำนายข้อมูลได้ อัลกอริทึมนั้นจะทำงานโดยอาศัยโมเดลที่สร้างมาจากชุดข้อมูลตัวอย่างขาเข้าเพื่อการทำนายหรือตัดสินใจในภายหลัง แทนที่จะทำงานตามลำดับของคำสั่ง[[โปรแกรมคอมพิวเตอร์]]
 
การเรียนรู้ของเครื่องมีเกี่ยวข้องอย่างมากกับ[[สถิติศาสตร์]] เนื่องจากทั้งสองสาขาศึกษาการวิเคราะห์ข้อมูลเพื่อการทำนายเช่นกัน นอกจากนี้ยังมีความสัมพันธ์กับสาขา[[การหาค่าเหมาะที่สุด]]ในทางคณิตศาสตร์ที่แงของวิธีการ ทฤษฎี และการประยุกต์ใช้ การเรียนรู้ของเครื่องสามารถนำไปประยุกต์ใช้งานได้หลากหมาย ไม่ว่าจะเป็นการกรองอีเมล์ขยะ การรู้จำตัวอักษร เครื่องมือค้นหา และ[[คอมพิวเตอร์วิทัศน์]]
 
== ภาพรวม ==
[[ไฟล์:Machine Learning Technique..JPG|thumb|ภาพที่ 1 เทคนิคการเรียนรู้ของเครื่องจักร]]
 
[[อาเธอร์ ซามูเอล]] นัก[[วิทยาศาสตร์คอมพิวเตอร์]]ชาวอเมริกันได้ให้นิยามของการเรียนรู้ของเครื่องจักรไว้ในปี ค.ศ. 1959 ว่า "เป็นสาขาที่ให้คอมพิวเตอร์มีความสามารถในการเรียนรู้โดยไม่ต้องโปรแกรมให้ชัดเจน"<ref name="arthur_samuel_machine_learning_def">{{cite book | title=Too Big to Ignore: The Business Case for Big Data | publisher=Wiley | author=Phil Simon | date=March 18, 2013 | pages=89 | isbn=978-1118638170 | url=http://books.google.gr/books?id=Dn-Gdoh66sgC&pg=PA89#v=onepage&q&f=false}}</ref>
 
[[ทอม เอ็ม. มิตเชลล์]] ได้ขยายนิยามอย่างเป็นทางการกว้างๆไว้ว่า "เราจะเรียกคอมพิวเตอร์โปรแกรมว่าได้เรียนรู้จากประสบการณ์ E เพื่อทำงาน T ได้โดยมีประสิทธิผล P เมื่อโปรแกรมนั้นสามารถทำงาน T ที่วัดผลด้วย P แล้วพัฒนาขึ้นจากประสบการณ์ E"<ref>* Mitchell, T. (1997). ''Machine Learning'', McGraw Hill. ISBN 0-07-042807-7, p.2.</ref> คำนิยามนี้เป็นข้อจำกัดความที่มีชื่อเสียงเพราะเป็นการนิยามการเรียนรู้ของเครื่องจักรในแง่ของการดำเนินการมากกว่าในแง่ของความรู้สึกนึกคิด เปรียบเทียบคือ เป็นการเปลี่ยนคำถามของ[[แอลัน ทัวริง]]ที่เคยถามว่า "เครื่องจักรคิดได้หรือไม่" เป็นคำถามที่ว่า "เครื่องจักรจะทำงานที่พวกเราทำได้หรือไม่"<ref>{{Citation |chapterurl=http://eprints.ecs.soton.ac.uk/12954/ |first=Stevan |last=Harnad |year=2008 |chapter=The Annotation Game: On Turing (1950) on Computing, Machinery, and Intelligence |editor1-last=Epstein |editor1-first=Robert |editor2-last=Peters |editor2-first=Grace |title=The Turing Test Sourcebook: Philosophical and Methodological Issues in the Quest for the Thinking Computer |location= |publisher=Kluwer |isbn= }}</ref>
== ประวัติและความสัมพันธ์กับสาขาอื่น ==
 
ศาสตร์ด้านการเรียนรู้ของเครื่องเติบโตไปพร้อมๆกับ[[ปัญญาประดิษฐ์]] ในความจริงนั้น การเรียนรู้ของเครื่องมีมาตั้งแต่ยุคแรกๆของปัญญาประดิษฐ์ นักวิทยาศาสตร์หลายคนสนใจการสร้างเครื่องจักรที่สามารถเรียนรู้จากข้อมูลได้ จึงเริ่มทดลองวิธีการหลายๆอย่าง ที่เด่นชัดสุดคือ [[โครงข่ายประสาทเทียม]] และในเวลาต่อมา ได้มีการคิดค้นโมเดลเชิงเส้นทั่วไปจากหลักการทาง[[สถิติศาสตร์]] ไปจนถึงการพัฒนาวิธีการให้เหตุผลตามหลัก[[ความน่าจะเป็น]] โดยเฉพาะในการประยุกต์ด้านการวินิจฉัยโรคอัตโนมัติ
 
อย่างไรก็ตาม นักวิจัยในสาย[[ปัญญาประดิษฐ์]]ยุคต่อมาเริ่มหันมาให้ความสำคัญกับ[[ตรรกศาสตร์]]และใช้วิธีการทาง[[การแทนความรู้]]มากขึ้น จนทำให้ปัญญาประดิษฐ์เริ่มแยกตัวออกจากกับศาสตร์การเรียนรู้ของเครื่อง หลังจากนั้นเริ่มมีการใช้หลักการความน่าจะเป็นมากขึ้นในการดึงและการแทนข้อมูล ต่อมาในปี 1980 [[ระบบผู้เชี่ยวชาญ]]เริ่มโดดเด่นในสายของปัญญาประดิษฐ์จนหมดยุคของการใช้หลักสถิติ มีงานวิจัยด้านการเรียนรู้เชิงสัญลักษณ์และบนพื้นฐานของฐานความรู้ออกมาเรื่อยๆ จนกลายศาสตร์ด้าน[[การโปรแกรมตรรกะเชิงอุปนัย]]ได้ถือกำเนิดขึ้นมา แต่งานด้านสถิติก็ยังถือว่ามีบทบาทมากนอกสาขาของปัญญาประดิษฐ์ เช่น [[การรู้จำแบบ]]และ[[การค้นคืนสารสนเทศ]] นักวิจัยสายปัญญาประดิษฐ์และนักวิทยาศาสตร์คอมพิวเตอร์ได้ทิ้งงานวิจัยด้าน[[โครงข่ายประสาทเทียม]]ไปในเวลาเดียวกัน แต่ก็ยังมีนักคณิตศาสตร์บางคน เช่น [[จอห์น ฮอปฟิลด์]] [[เดวิด โรเมลฮาร์ต]] และ[[เจฟฟรีย์ ฮินตัน]]ที่ยังพัฒนาโครงข่ายประสาทเทียมต่อไป จนกระทั่งได้ค้นพบหลักการ[[การแพร่ย้อนกลับ]]ของโครงข่ายประสาทเทียม ที่ประสบความสำเร็จมากมายในเวลาต่อมา
 
=== ความสัมพันธ์กับการทำเหมืองข้อมูล ===
ส่วนการเรียนรู้ของเครื่องกับ[[การทำเหมืองข้อมูล]]มักจะใช้วิธีการเหมือนๆกันและมีส่วนคาบเกี่ยวกันอย่างเห็นได้ชัด สิ่งที่แตกต่างระหว่างสองศาสตร์นี้คือ
* การเรียนรู้ของเครื่อง เน้นเรื่องการพยากรณ์ข้อมูลจากคุณสมบัติที่"รู้"แล้วที่ได้เรียนรู้มาจากข้อมูลชุดสอน
* [[การทำเหมืองข้อมูล]] เน้นเรื่องการค้นหาคุณสมบัติที่"ไม่รู้"จากข้อมูลที่ได้มา กล่าวได้ว่าเป็นขั้นตอนการวิเคราะห์เพื่อค้นหา"ความรู้"ในฐานข้อมูล
 
สองศาสตร์นี้มีส่วนคาบเกี่ยวกันไม่น้อย คือ การทำเหมืองข้อมูลใช้วิธีการทางการเรียนรู้ของเครื่อง แต่มักจะมีเป้าหมายในใจที่แตกต่างออกไปเล็กน้อย ส่วนการเรียนรู้ของเครื่องก็ใช้วิธีการของการทำเหมืองข้อมูลบางอย่าง เช่น การเรียนรู้แบบไม่มีผู้สอน หรือขั้นตอนการเตรียมข้อมูลเพื่อปรับปรุงความถูกต้องของการเรียนรู้ บ่อยครั้งที่นักวิทยาศาสตร์ผสมสองสาขานี้เข้าด้วยกันด้วยเหตุผลที่ว่า ประสิทธิภาพของการเรียนรู้ของเครื่องมักจะดีขึ้นหากมีความสามารถในการรู้ความรู้บางอย่าง ในขณะที่การค้นหาความรู้และการทำเหมืองข้อมูลนั้น กุญแจสำคัญคือการค้นหาความรู้ที่ไม่รู้มาก่อน หากมีการวัดประสิทธิภาพจากสิ่งที่ไม่รู้มาก่อน วิธีการเรียนรู้แบบมีผู้สอนของการเรียนรู้ของเครื่อง ก็มักจะให้ผลได้ดีกว่าการใช้วิธีการเรียนรู้แบบไม่มีผู้สอนอย่างเดียว นั่นคือ
 
=== ความสัมพันธ์กับการหาค่าเหมาะที่สุด ===
การเรียนรู้ของเครื่องยังมีความคล้ายคลึงกับการหาค่าเหมาะที่สุด (optimization) นั่นคือ การเรียนรู้หลายอย่างมักจะถูกจัดให้อยู่ในรูปแบบของการหาค่าที่น้อยที่สุดของ''ฟังก์ชันการสูญเสีย''บางอย่างจากข้อมูลชุดสอน ฟังก์ชันการสูญเสียหมายถึงความแตกต่างระหว่างสิ่งที่พยากรณ์ไว้กับสิ่งที่เป็นจริง
 
=== ความสัมพันธ์กับสถิติศาสตร์ ===
 
การเรียนรู้ของเครื่องมีความสัมพันธ์กับ[[สถิติศาสตร์]]อย่างใกล้ชิด ไมเคิล ไอ. จอร์แดน นักวิทยาศาสตร์คอมพิวเตอร์ชาวอเมริกันชี้ว่าแนวคิดของการเรียนรู้ของเครื่องก็มาจากหลักการของทฤษฎีที่มีมาอย่างยาวนานของสถิติศาสตร์<ref name="mi jordan ama">{{cite web|url=http://www.reddit.com/r/MachineLearning/comments/2fxi6v/ama_michael_i_jordan/ckelmtt?context=3 |title=statistics and machine learning|publisher=reddit|date=2014-09-10|accessdate=2014-10-01|language=|author=MI Jordan}}</ref> ในขณะที่นักวิทยาศาสตร์บางคนมองว่า สถิติให้ความสำคัญกับข้อมูล ขณะที่การเรียนรู้ของเครื่องให้ความสำคัญกับ[[อัลกอริทึม]]มากกว่า<ref>http://projecteuclid.org/download/pdf_1/euclid.ss/1009213726</ref>
 
นักสถิติศาสตร์บางคนก็ยังปรับเอาหลักการของการเรียนรู้ของเครื่องไปใช้ นำไปสู่กับผสมผสานกันระหว่างสองศาสตร์ กลายเป็นศาสตร์ที่ชื่อ การเรียนรู้ทางสถิติ<ref name="islr">{{cite book |author1=Gareth James |author2=Daniela Witten |author3=Trevor Hastie |author4=Robert Tibshirani |title=An Introduction to Statistical Learning |publisher=Springer |year=2013 |url=http://www-bcf.usc.edu/~gareth/ISL/ |page=vii}}</ref>
 
== ทฤษฎี ==
หัวใจสำคัญของการเรียนรู้ของเครื่องคือ การทำให้โมเดลมีความครอบคลุม"ทั่วไป" (general) มากขึ้นจากประสบกาณ์ที่ได้มา การทำให้ทั่วไปมากขึ้นนี้จะทำให้เครื่องสามารถพยากรณ์หรือทำงานกับตัวอย่างข้อมูลที่ไม่เคยเห็นมาก่อนได้อย่างแม่นยำมากขึ้น บางครั้ง ข้อมูลชุดสอนก็มาจากการสุ่มและผู้เรียนรู้จะต้องทำให้โมเดลมีความครอบคลุมทั่วไปมากขึ้นเพื่อจะได้ทำการพยากรณ์ข้อมูลใหม่ๆได้อย่างถูกต้องเพียงพอ
 
การวิเคราะห์เชิงคำนวณของการเรียนรู้ของเครื่อง และการวัดประสิทธิภาพการเรียนรู้ เป็นอีกสาขาหนึ่งทางวิทยาศาสตร์คอมพิวเตอร์สายทฤษฎีที่รู้จักกันในชื่อ [[ทฤษฎีการเรียนรู้เชิงคำนวณ]] อย่างไรก็ตาม ทฤษฎีก็ไม่สามารถรับประกันประสิทธิภาพของอัลกอริทึมได้เพราะข้อมูลนั้นมีจำกัดและอนาคตมีความไม่แน่นอน แต่ทฤษฎีก็สามารถบอกขอบเขตบนความน่าจะเป็นได้ว่า ประสิทธิภาพน่าจะอยู่ในช่วงใด นอกจากนี้ นักวิทยาศาสตร์ด้านนี้ยังได้ศึกษาดูต้นทุนทางเวลาและความเป็นไปได้ของการเรียนรู้ของเครื่องด้วย โดยการคำนวณที่ถือว่าเป็นไปได้ในการเรียนรู้นั้นจะต้องสามารถเรียนรู้ได้ในเวลาโพลิโนเมียล
 
== วิธีการเรียนรู้ ==
 
=== ประเภทของการเรียนรู้ ===
การเรียนรู้ของเครื่อง สามารถแบ่งโดยกว้างๆได้เป็นหลายประเภท ตามประเภทของ"ข้อมูลฝึก" หรือ "ข้อมูลขาเข้า" และประเภทของงาน ได้ดังนี้
 
==== [[การเรียนรู้แบบมีผู้สอน]] (supervised learning) - ====
ข้อมูลตัวอย่างและผลลัพธ์ที่"ผู้สอน"ต้องการถูกป้อนเข้าสู่คอมพิวเตอร์ เป้าหมายคือการสร้างกฎทั่วไปที่สามารถเชื่อมโยงข้อมูลขาเข้ากับขาออกได้
 
นอกจากนี้ยังมีการเรียนรู้ความคล้าย (similarity and metric learning) โดยเครื่องจะมีตัวอย่างของคู่ที่ถูกมองว่าคล้ายมากและคู่ที่ถูกมองว่าคล้ายน้อย เครื่องจะต้องหาฟังก์ชันความคล้ายออกมาที่สามารถทำนายได้ว่าวัตถุใหม่นั้นมีความคล้ายมากน้อยเพียงใด มักใช้ในระบบแนะนำ (recommendation system)
 
==== [[การเรียนรู้แบบไม่มีผู้สอน]] (unsupervised learning) ====
ไม่มีการทำฉลากใดๆและให้คอมพิวเตอร์หาโครงสร้างของข้อมูลขาเข้าเอง
 
วิธีการหลักที่นิยมใช้ได้แก่ [[การแบ่งกลุ่มข้อมูล]] อันเป็นการจัดกลุ่มของข้อมูลสำรวจให้ตกอยู่ในเซ็ตย่อย (เรียกว่า กลุ่ม หรือ cluster) โดยที่ข้อมูลที่อยู่ในกลุ่มเดียวกันจะมีความคล้ายคลึงกันตามเกณฑ์ที่ตั้งเอาไว้ ในข้อมูลที่อยู่คนละกลุ่มจะมีความแตกต่างกัน เทคนิคการแบ่งกลุ่มข้อมูลแต่ละเทคนิคก็มีสมมติฐานของโครงสร้างข้อมูลไม่เหมือนกัน โดยปกติแล้วมักจะมีการนิยาม ''การวัดค่าความเหมือน'' ''การเกาะกลุ่มภายใน'' และ ''การแยกกันระหว่างกลุ่ม'' ที่แตกต่างกัน การแบ่งกลุ่มข้อมูลจัดเป็นวิธี[[การเรียนรู้แบบไม่มีผู้สอน]] และเป็นวิธีที่ใช้กันทั่วไปในการวิเคราะห์ข้อมูลทางสถิติ
 
==== [[การเรียนรู้แบบเสริมกำลัง]] (reinforcement learning) ====
คอมพิวเตอร์มีปฏิสัมพันธ์กับสิ่งแวดล้อมที่เปลี่ยนไปตลอดเวลาโดยคอมพิวเตอร์จะต้องทำงานบางอย่าง (เช่น ขับรถ) โดยที่ไม่มี"ผู้สอน"คอยบอกอย่างจริงจังว่าวิธีการที่ทำอยู่นั้นเข้าใกล้เป้าหมายแล้วหรือไม่ ตัวอย่างเช่น การเรียนรู้เพื่อเล่นเกม [[การเรียนรู้แบบเสริมกำลัง]] พิจารณาว่า ''เอเยนต์'' ควรจะมี ''การกระทำ'' ใดใน ''สิ่งแวดล้อม'' เพื่อที่จะได้ ''รางวัล'' สูงสุด อัลกอริทึมของการเรียนรู้แบบเสริมกำลังนี้พยายามจะหา ''นโยบาย'' ที่เชื่อมโยง ''สถานะ'' ของโลกเข้ากับการกระทำที่เอเยนต์ควรจะทำในสถานะนั้นๆ การเรียนรู้แบบเสริมกำลังนี้มีความแตกต่างไปจาก[[การเรียนรู้แบบมีผู้สอน]]ตรงที่ว่า คอมพิวเตอร์จะไม่รู้เลยว่าอะไรถูกอะไรผิด กล่าวคือ ไม่มีการบอกอย่างชัดเจนว่าการกระทำใดยังไม่ดี
 
==== [[การเรียนรู้แบบกึ่งมีผู้สอน]] (semi supervised Learning) ====
เป็นการเรียนรู้อีกแบบหนึ่งที่ระหว่างการเรียนรู้แบบมีผู้สอนกับการเรียนรู้แบบไม่มีผู้สอน โดยที่"ผู้สอน"จะไม่สอนอย่างสมบูรณ์ นั่นคือ บางข้อมูลในเซ็ตการสอนนั้นขาดข้อมูลขาออก
 
==== [[ทรานดักชัน]] (transduction) ====
เป็นกรณีพิเศษของการเรียนรู้แบบกึ่งมีผู้สอนคือใช้ชุดตัวอย่างที่มีทั้งฉลากและไม่มีฉลากในการเรียนรู้ แต่จุดประสงค์ไม่ใช่การสร้างแบบจำลอง แต่เป็นการใส่ฉลากให้กับตัวอย่างที่ไม่มีฉลากที่ใช้ในการฝึกสอน เนื่องจากการเรียนรู้แบบ ทรานดักชันไม่มีแบบจำลอง ผลการเรียนรู้จึงไม่สามารถนำไปใช้กับข้อมูลชุดใหม่ได้โดยตรง
 
==== [[การเรียนวิธีการเรียน]] (learning to learn, meta-learning) ====
เป็นวิธีที่จะเรียนวิธีการเรียนรู้ของตนเอง โดยปรับปรุง inductive bias ที่เป็นข้อสมมติฐานที่อัลกอริทึมใช้ในการเรียนรู้จากประสบการณ์ที่ผ่านมา
 
==== การเรียนรู้ด้วยการแทน (representation learning) ====
การเรียนรู้บางอย่างโดยเฉพาะ[[การเรียนรู้แบบไม่มีผู้สอน]]นั้นพยายามจะค้นหาการแทนข้อมูลขาเข้าที่ดีขึ้นเมื่อมีชุดข้อมูลฝึก ตัวอย่างของ[[การเรียนรู้ด้วยการแทน]]นี้ได้แก่ [[การวิเคราะห์องค์ประกอบหลัก]]และ[[การแบ่งกลุ่มข้อมูล]] อัลกอริทึมการเรียนรู้ด้วยการแทนมักจะเปลี่ยนข้อมูลไปในรูปแบบที่มีประโยชน์แต่ยังคงรักษาสารสนเทศของข้อมูลเอาไว้ มักใช้ในกระบวนการเตรียมข้อมูลก่อนจะ[[การแบ่งประเภทข้อมูล|แบ่งประเภทข้อมูล]]หรือพยากรณ์ ตัวอย่างอื่นของการเรียนรู้ด้วยการแทนได้แก่ [[การเรียนรู้เชิงลึก]]
 
==== การเรียนรู้พจนานุกรมแบบห่าง (sparse dictionary learning) ====
 
==== [[กฎความสัมพันธ์]] (association rule learning) ====
เป็นวิธีการหาความสัมพันธ์ที่น่าสนใจจากตัวแปรในฐานข้อมูลขนาดใหญ่ นอกจากนี้ยังมี[[การโปรแกรมตรรกะเชิงอุปนัย]] เป็นวิธีการเรียนรู้จากกฎโดยใช้การโปรแกรมตรรกะ เมื่อมีข้อมูลเบื้องหลังและกลุ่มของตัวอย่างที่เป็นฐานข้อมูลตรรกะแล้ว โปรแกรมตรรกะเชิงอุปนัยจะหาโปรแกรมตรรกะที่ครอบคลุมตัวอย่างบวกแต่ไม่รอบคลุมตัวอย่างลบ
 
=== แบบจำลอง ===
การเรียนรู้ของเครื่องเกี่ยวข้องกับการสร้างแบบโมเดล (model) ซึ่งเกิดจากการสอนด้วยข้อมูลสอนและสามารถพยากรณ์ข้อมูลที่เข้ามาใหม่ได้ โมเดลมีหลากหลายรูปแบบ ได้แก่
 
==== โครงข่ายประสาทเทียม (artificial neural networks) ====
[[โครงข่ายประสาทเทียม]] เป็น[[อัลกอริทึม]]ที่ได้แรงบันดาลใจมาจากโครงสร้างและการทำงานของเซลล์ประสาทในสมอง การคำนวณของโครงข่ายประสาทเทียมถูกสร้างเป็นโครงสร้างของการเชื่อมต่อของประสาทเทียมแต่ละตัว ประมวลผลข้อมูลโดยหลักการการเชื่อมต่อ โครงข่ายประสาทเทียมสมัยใหม่เป็นเครื่องวิเคราะห์ทางสถิติที่ไม่เป็นเชิงเส้น มักใช้ในการจำลองความสัมพันธ์ที่ซับซ้อนระหว่างข้อมูลขาเข้าและขาออก เพื่อหารูปแบบจากข้อมูล หรือเพื่อหาโครงสร้างทางสถิติระหว่างตัวแปรที่สำรวจ
 
==== การเรียนรู้ต้นไม้ตัดสินใจ (decision tree learning) ====
[[การเรียนรู้ต้นไม้ตัดสินใจ]] ใช้ต้นไม้ตัดสินใจในการสร้างโมเดลที่พยากรณ์ได้ ซึ่งจะเชื่อมโยงข้อมูลสังเกตการณ์เข้ากับข้อมูลปลายทาง
 
==== ซัพพอร์ตเวกเตอร์แมชชีน (support vector machines) ====
[[ซัพพอร์ตเวกเตอร์แมชชีน]] เป็นหนึ่งในวิธีการเรียนรู้แบบมีผู้สอน ใช้เพื่อการ[[การแบ่งประเภทข้อมูล]]และ[[การวิเคราะห์การถอดถอย]] เมื่อมีข้อมูลฝึกมาให้และแต่ละข้อมูลถูกจัดอยู่ในประเภทใดประเภทหนึ่งจากสองประเภท ซัพพอร์ตเวกเตอร์แมชชีนจะสร้างแบบจำลองที่สามารถพยากรณ์ได้ว่าตัวอย่างใหม่นี้จะตกอยู่ในกลุ่มใด
 
==== การวิเคราะห์ความถดถอย (regression analysis) ====
 
==== เครือข่ายแบบเบย์ (Bayesian networks) ====
[[เครือข่ายแบบเบย์]] เป็นโมเดลความน่าจะเป็นเชิงกราฟที่แทนกลุ่มของตัวแปรสุ่มและความเป็นอิสระแบบมีเงื่อนไขด้วย[[กราฟอวัฏจักรระบุทิศทาง]] ตัวอย่างเช่น เครือข่ายแบบเบย์สามารถใช้แทนความสัมพันธ์เชิงความน่าจะเป็นระหว่างอาการแสดงกับโรคได้ เมื่อมีอาการแสดง เครือข่ายจะคำนวณความน่าจะเป็นที่จะเป็นโรคแต่ละโรค มีหลายอัลกอริทึมที่สามารถอนุมานและเรียนรู้ได้อย่างมีประสิทธิภาพ
 
==== ขั้นตอนวิธีเชิงพันธุกรรม (genetic algorithms) ====
[[ขั้นตอนวิธีเชิงพันธุกรรม]] เป็นการค้นหาแบบฮิวริสติกที่เลียนแบบ[[กระบวนการคัดเลือกตามธรรมชาติ]]ในช่วงวิวัฒนาการของสิ่งมีชีวิต โดยใช้เทคนิค[[การกลายพันธุ์]]ของยีนและการไขว้เปลี่ยนของโครโมโซมในการหาประชากรที่น่าจะอยู่รอดเพื่อพาไปสู่คำตอบของปัญหาได้ อัลกอริทึมนี้ได้รับความสนใจมากในสาขาการเรียนรู้ของเครื่องในช่วงทศวรรษ 1980 และ 1990 และเทคนิคทางการเรียนรู้ของเครื่องก็ช่วยปรับปรุงประสิทธิภาพของ[[ขั้นตอนวิธีเชิงพันธุกรรม]]และ[[ขั้นตอนวิธีเชิงวิวัฒนาการ]]เช่นกัน
 
== การประยุกต์ ==
 
การเรียนรู้ของเครื่อง สามารถประยุกต์ใช้งานได้หลากหลาย เช่น
 
{{refbegin|3}}
* เว็บไซต์ปรับรูปแบบเองได้ (Adaptive website)
* [[การคำนวณเชิงอารมณ์]] (affective computing)
* ชีวสารสนเทศศาสตร์ (bioinformatics)
* [[ส่วนต่อประสานสมอง–คอมพิวเตอร์]] (brain–computer interface)
* เคมีสารสนเทศศาสตร์ (chemoinformatics)
* การจัดประเภท[[ลำดับดีเอ็นเอ]]
* คอมพิวเตอร์วิทัศน์ (computer vision)
* การตรวจจับ[[การฉ้อโกงบัตรเครดิต]] (credit card fraud)
* การเล่น[[เกมกลยุทธ์]]
* [[การค้นคืนสารสนเทศ]] (information retrieval)
* การตรวจสอบการฉ้อโกงทางอินเทอร์เน็ต
* [[การรับรู้ของเครื่อง]] (Machine perception)
* [[การวินิจฉัยทางการแพทย์]] (medical diagnosis)
* [[การประมวลผลภาษาธรรมชาติ]] (natural language processing)
* การหาค่าเหมาะที่สุด (optimization)
* ระบบแนะนำ (recommender systems)
* ระบบเคลื่อนไหวของ[[หุ่นยนต์]]
* [[เสิร์ชเอนจิน]] (search engines)
* วิศวกรรมซอฟต์แวร์ (software engineering)
* การรู้จำเสียงพูด (speech recognition)
{{refend}}
 
== ซอฟต์แวร์ ==
 
=== [[ซอฟต์แวร์เสรี]]และ[[ซอฟต์แวร์โอเพนซอร์ซ]] ===
{{Div col|colwidth=18em}}
* [[Microsoft Cognitive Toolkit|CNTK]]
* [[Deeplearning4j]]
* [[Keras]]
* [[Caffe (software)|Caffe]]
* [[Apache Mahout|Mahout]]
* [[GNU Octave]]
* [[OpenNN]]
* [[Orange (software)|Orange]]
* [[scikit-learn]]
* [[TensorFlow]]
* [[ROOT]]
* [[PyTorch]]
* [[Weka]]
* [[R (programming language)|R]]
{{Div col end}}
 
=== ซอฟต์แวร์จำกัดสิทธิ์ที่มีรุ่นฟรีและโอเพนซอร์ซ ===
{{Div col|colwidth=18em}}
* [[KNIME]]
* [[RapidMiner]]
{{Div col end}}
 
===[[ซอฟต์แวร์จำกัดสิทธิ์]]===
{{Div col|colwidth=18em}}
* [[Amazon Machine Learning]]
* [[Azure Machine Learning]]
* [[IBM Data Science Experience]]
* [[Google APIs|Google Prediction API]]
* [[SPSS Modeler|IBM SPSS Modeler]]
* [[Mathematica]]
* [[MATLAB]]
* [[Microsoft Azure]]
* [[Neural Designer]]
* [[Oracle Data Mining]]
* [[SAS (software)#Components|SAS Enterprise Miner]]
* [[Splunk]]
* [[STATISTICA]] Data Miner
{{Div col end}}
 
== ดูเพิ่ม ==
 
* [[ข้อมูลขนาดใหญ่|ข้อมูลขนาดใหญ่ (Big data)]]
* [[การทำเหมืองข้อมูล]] (Data mining)
*[[วิทยาการข้อมูล]] (Data science)
 
== อ้างอิง ==
{{รายการอ้างอิง}}
 
 
[[หมวดหมู่:ไซเบอร์เนติกส์]]
[[หมวดหมู่:วิทยาการคอมพิวเตอร์]]
[[หมวดหมู่:วิศวกรรมคอมพิวเตอร์]]
[[หมวดหมู่:วิทยาการคอมพิวเตอร์เชิงทฤษฎี]]
[[หมวดหมู่:การเรียนรู้ของเครื่อง|การเรียนรู้ของเครื่อง]]
[[หมวดหมู่:ปัญญาประดิษฐ์]]