แอลฟาโกะ (อังกฤษ: AlphaGo) เป็นโปรแกรมคอมพิวเตอร์ที่เล่นเกมกระดานหมากล้อม[1] ที่ได้รับการพัฒนาโดย กูเกิล ดีปไมด์ ของ แอลฟาเบต อิงก์ ในกรุงลอนดอน แอลฟาโกะมีรุ่นสืบทอดที่มีอานุภาพมากกว่าถึงสามรุ่น ได้แก่ แอลฟาโกะ มาสเตอร์, แอลฟาโกะ ซีโร[2] และ แอลฟาซีโร

โลโก้แอลฟาโกะ
โลโก้แอลฟาโกะ

ในเดือนตุลาคม ค.ศ. 2015 แอลฟาโกะกลายเป็นโปรแกรมคอมพิวเตอร์โกะตัวแรกที่ชนะนักหมากล้อมอาชีพโดยไม่มีแต้มต่อบนกระดานขนาด 19 × 19 เต็มรูปแบบ[3][4] ในเดือนมีนาคม ค.ศ. 2016 มันสามารถเป็นฝ่ายชนะอี เซ-ดล ในการแข่งขันห้าเกม ซึ่งเป็นครั้งแรกที่โปรแกรมคอมพิวเตอร์โกะสามารถเป็นฝ่ายชนะมืออาชีพระดับ 9 ดั้งโดยไม่มีแต้มต่อ[5] แม้ว่าจะเป็นฝ่ายแพ้อี เซ-ดล ในเกมที่สี่ แต่อีก็ยอมแพ้ในเกมสุดท้าย ส่งผลให้แอลฟาโกะเป็นฝ่ายชนะด้วยผล 4 ต่อ 1 ในการยอมรับถึงชัยชนะ แอลฟาโกะได้รับรางวัล 9 ดั้งกิตติมศักดิ์จากสมาคมหมากล้อมแห่งประเทศเกาหลี[6] รายการดังกล่าวและนัดท้าชิงกับอี เซ-ดล ได้รับการบันทึกไว้ในภาพยนตร์สารคดีที่มีชื่อเดียวกันว่า แอลฟาโกะ[7] กำกับโดยเกร็ก โคหส์ ผลงานนี้ได้รับเลือกจากวารสารไซเอินซ์ในตำแหน่งรองชนะเลิศของความก้าวหน้าแห่งปี ในวันที่ 22 ธันวาคม ค.ศ. 2016[8]

ที่การประชุมสุดยอดหมากล้อมแห่งอนาคต ค.ศ. 2017 แอลฟาโกะเป็นฝ่ายชนะเคอ เจี๋ย ซึ่งเป็นผู้เล่นอันดับ 1 ของโลกในเวลานั้น ในการแข่งขันสามเกม หลังจากนั้น แอลฟาโกะได้รับรางวัล 9 ดั้งระดับมืออาชีพจากสมาคมหมากล้อมแห่งประเทศจีน[9]

แอลฟาโกะใช้ขั้นตอนวิธีคำนวณแบบการค้นหาต้นไม้มงเต การ์โล เพื่อหาตาเดินของมันโดยขึ้นอยู่กับความรู้ที่ได้ "เรียนรู้" ก่อนหน้านี้โดยการเรียนรู้ของเครื่อง โดยเฉพาะโครงข่ายประสาทเทียม (กระบวนการการเรียนรู้เชิงลึก) โดยการฝึกฝนที่ครอบคลุมแบบถ้วนทั่ว ทั้งจากการเล่นของมนุษย์และคอมพิวเตอร์[10] โครงข่ายประสาทได้รับการฝึกเพื่อคาดการณ์การเลือกเดินของตัวแอลฟาโกะเองและเป็นฝ่ายชนะเกม โครงข่ายประสาทนี้ช่วยเพิ่มพลังของการคำนวณแบบการค้นหาต้นไม้ ส่งผลให้มีการเลือกเดินมีคุณภาพสูงขึ้น และการเล่นด้วยตัวเองที่แข็งแกร่งขึ้นในการทำซ้ำครั้งต่อไป

หลังจากการแข่งขันระหว่างแอลฟาโกะกับเคอ เจี๋ย แอลฟาโกะได้อำลาวงการในขณะที่ดีปไมด์ดำเนินการวิจัยเอไอในด้านอื่น ๆ ต่อไป[11] การเริ่มต้นจาก 'หน้าว่าง' ด้วยระยะเวลาการฝึกสั้น ๆ เท่านั้น ยังทำให้แอลฟาโกะ ซีโร ประสบความสำเร็จ 100–0 เกม จากการเป็นฝ่ายชนะชนะแชมป์อย่างแอลฟาโกะ ในขณะที่รุ่นสืบทอดอย่างแอลฟาซีโร ซึ่งทำการสอนด้วยตัวเอง ก็ยังได้รับการยอมรับในฐานะมืออันดับต้น ๆ ของโลก ทั้งในหมากล้อมและอาจรวมถึงในหมากรุกสากล

ประวัติ แก้

หมากล้อมได้รับการพิจารณาว่ายากมากสำหรับคอมพิวเตอร์ที่จะเป็นฝ่ายชนะกว่าเกมอื่น ๆ เช่นหมากรุก เนื่องจากจำนวนการแตกกิ่งก้านที่มีขนาดใหญ่มากจึงทำให้ยากที่จะใช้วิธีการดั้งเดิมของเอไอ เช่น การตัดออกแบบแอลฟา–เบตา, การท่องต้นไม้ และการค้นหาวิทยาการศึกษาสำนึก[3][12]

เกือบสองทศวรรษหลังจากที่ดีปบลูคอมพิวเตอร์ของไอบีเอ็มชนะแชมป์หมากรุกโลกอย่างแกรี คาสปารอฟ ในดีปบลูพบคาสปารอฟ โปรแกรมหมากล้อมที่แข็งแกร่งใช้เทคนิคปัญญาประดิษฐ์ถึงระดับ 5 ดั้งสมัครเล่นเท่านั้น[10] และยังไม่สามารถเอาชนะผู้เล่นหมากล้อมระดับอาชีพได้โดยไม่มีแต้มต่อ[3][4][13] ส่วนในปี ค.ศ. 2012 โปรแกรมซอฟต์แวร์เซน ได้ทำงานบนคอมพิวเตอร์สี่กลุ่ม และเป็นฝ่ายชนะมาซากิ ทาเกมิยะ (9 ดั้งอาชีพ) สองครั้งด้วยแต้มต่อห้าและสี่เม็ด[14] ครั้นในปี ค.ศ. 2013 ซอฟต์แวร์เครซีสโตน เป็นฝ่ายชนะโยชิโอะ อิชิดะ (9 ดั้งอาชีพ) ด้วยแต้มต่อสี่เม็ด[15]

อ้างอิงจากเดวิด ซิลเวอร์ ของดีปไมด์ โครงการวิจัยแอลฟาโกะก่อตั้งขึ้นประมาณปี ค.ศ. 2014 เพื่อทดสอบเครือข่ายประสาทเทียมที่ใช้การเรียนรู้เชิงลึกสามารถเข้าแข่งขันในหมากล้อมได้[16] แอลฟาโกะแสดงถึงการปรับปรุงที่สำคัญกว่าโปรแกรมหมากล้อมรุ่นก่อน โดยใน 500 เกมได้เผชิญกับโปรแกรมหมากล้อมอื่น ๆ ที่มีอยู่ รวมทั้งเครซีสโตนและเซน[17] แอลฟาโกะที่ทำงานบนคอมพิวเตอร์เครื่องเดียวได้เป็นฝ่ายชนะทุกเกมยกเว้นเพียงเกมเดียว[18] ในการจับคู่ที่คล้ายกัน แอลฟาโกะทำงานบนคอมพิวเตอร์หลายเครื่องได้ชนะเกมทั้งหมด 500 เกมที่เล่นกับโปรแกรมหมากล้อมอื่น ๆ และ 77 เปอร์เซนต์ของเกมที่เล่นกับแอลฟาโกะทำงานบนคอมพิวเตอร์เครื่องเดียว เวอร์ชันเผยแพร่ในเดือนตุลาคม ค.ศ. 2015 ใช้ 1,202 หน่วยประมวลผลกลาง และ 176 หน่วยประมวลผลกราฟิกส์[10]

แมตช์ปะทะฝาน ฮุย แก้

ในเดือนตุลาคม ค.ศ. 2015 รุ่นเผยแพร่ของแอลฟาโกะชนะแชมป์หมากล้อมของยุโรปอย่างฝาน ฮุย[19] ซึ่งเป็นนักหมากล้อมอาชีพระดับ 2 ดั้ง (จากที่มีทั้งหมด 9 ดั้ง) ห้าต่อศูนย์เกม[4][20] นี่เป็นครั้งแรกที่โปรแกรมหมากล้อมคอมพิวเตอร์เป็นฝ่ายชนะผู้เล่นระดับอาชีพบนกระดานขนาดเต็มโดยไม่มีแต้มต่อ[21] การประกาศข่าวดังกล่าวล่าช้าไปจนถึงวันที่ 27 มกราคม ค.ศ. 2016 เพื่อให้ตรงกับการตีพิมพ์บทความในวารสารเนเจอร์[10] โดยมีการอธิบายถึงการใช้อัลกอริทึม[4]

แมตช์ปะทะอี เซ-ดล แก้

แอลฟาโกะได้เล่นกับอี เซ-ดล ซึ่งเป็นนักหมากล้อมระดับอาชีพ 9 ดั้งชาวเกาหลีใต้ หนึ่งในผู้เล่นที่ดีที่สุดในหมากล้อม[13] กับห้าเกมที่จัดที่โรงแรมโฟร์ซีซันส์ในกรุงโซล ประเทศเกาหลีใต้เมื่อวันที่ 9, 10, 12, 13 และ 15 มีนาคม ค.ศ. 2016[22][23] ซึ่งมีวิดีโอสตรีมถ่ายทอดสด[24] ส่วนเอจา ฮวง ซึ่งเป็นสมาชิกทีมดีปไมด์ และนักเล่นหมากล้อม 6 ดั้งสมัครเล่น ได้วางเม็ดบนกระดานหมากล้อมให้แก่แอลฟาโกะ ซึ่งทำงานผ่านระบบคลาวด์ของกูเกิลพร้อมกับเซิร์ฟเวอร์ที่ตั้งอยู่ในสหรัฐ[25] การแข่งขันใช้กติกาแบบจีนกับโคมิ 7.5 แต้ม และแต่ละฝ่ายมีเวลาในการคิดสองชั่วโมงบวกกับระยะเวลาเบียวโยมิ 60 วินาที[26] เวอร์ชันของแอลฟาโกะที่เล่นกับอีใช้จำนวนกำลังประมวลผลเหมือนกับที่ใช้ในการแข่งขันกับฝาน ฮุย[27] นิตยสารดิอีโคโนมิสต์รายงานว่าใช้ 1,920 หน่วยประมวลผลกลาง และ 280 หน่วยประมวลผลกราฟิกส์[28]

ในขณะที่เล่น อี เซ-ดล มีชัยชนะหมากล้อมชิงแชมป์ระหว่างประเทศสูงสุดเป็นอันดับ 2 ของโลก[29] แม้ว่าจะไม่มีวิธีการอย่างเป็นทางการในการจัดอันดับหมากล้อมระดับนานาชาติ แต่แหล่งข่าวบางแห่งได้ให้อี เซ-ดล เป็นผู้เล่นที่ดีที่สุดอันดับที่สี่ในโลกในขณะนั้น[30][31] ส่วนแอลฟาโกะไม่ได้รับการฝึกโดยเฉพาะเพื่อเผชิญหน้ากับอี[32]

แอลฟาโกะเป็นฝ่ายชนะสามเกมแรกตามการยอมจำนนของอี[33][34] อย่างไรก็ตาม อีเป็นฝ่ายชนะแอลฟาโกะในเกมที่สี่ ที่ชนะจากฝ่ายตรงข้ามยอมจำนนในตาที่ 180 จากนั้น แอลฟาโกะยังคงชนะได้เป็นครั้งที่สี่ จากการชนะเกมที่ห้าโดยอีกฝ่ายยอมจำนน[35]

รางวัลนี้มีมูลค่า 1 ล้านดอลลาร์สหรัฐ เนื่องด้วยแอลฟาโกะเป็นฝ่ายชนะสี่ในห้าเกม และดังนั้น รางวัลจะนำไปมอบให้แก่องค์กรการกุศล รวมทั้งยูนิเซฟ ส่วนอี เซ-ดล ได้รับเงิน 150,000 ดอลลาร์สำหรับการเข้าร่วมในเกมทั้งหมดห้าเกมและเพิ่มอีก 20,000 ดอลลาร์สำหรับการชนะของเขา[26]

ในเดือนมิถุนายน ค.ศ. 2016 ในการนำเสนอที่จัดขึ้นที่มหาวิทยาลัยในประเทศเนเธอร์แลนด์ เอจา ฮวง หนึ่งในทีมดีปไมด์ เปิดเผยว่าได้แก้ไขปัญหาที่เกิดขึ้นในระหว่างเกมที่ 4 ระหว่างแอลฟาโกะกับอี และหลังจากตาเดินที่ 78 (ซึ่งได้รับการขนานนามว่า "การเคลื่อนย้ายของพระเจ้า" โดยระดับอาชีพหลายคน) มันจะเล่นได้อย่างแม่นยำและรักษาความได้เปรียบของหมากดำ ก่อนถึงตาเดินที่ 78 แอลฟาโกะเป็นผู้นำตลอดเกมและการเดินของอีไม่ได้รับการยกย่องว่าเป็นหนึ่งในเกมที่ชนะ แต่เกิดจากพลังการประมวลผลของโปรแกรมถูกเบี่ยงเบนและสับสน[36] ฮวงอธิบายว่าเครือข่ายวิถีทางของแอลฟาโกะของการหาคำสั่งเดินที่แม่นยำที่สุดและความต่อเนื่อง ไม่ได้นำแอลฟาโกะไปสู่ความต่อเนื่องที่ถูกต้องหลังจากตาเดินที่ 78 เนื่องจากเครือข่ายประเมินค่าไม่ได้ระบุว่าตาเดินที่ 78 ของอีจะเป็นไปได้มากที่สุด และดังนั้นเมื่อเดินตาดังกล่าว ทำให้แอลฟาโกะไม่สามารถปรับให้ถูกต้องเพื่อความต่อเนื่องทางตรรกะได้[37]

หกสิบเกมออนไลน์ แก้

เมื่อวันที่ 29 ธันวาคม ค.ศ. 2016 บัญชีใหม่บนเซิร์ฟเวอร์ทาอีเจ็มชื่อ "มาจิสเตอร์" (Magister) (ซึ่งแสดงเป็น 'มาจิสต์' (Magist) ในเวอร์ชันภาษาจีนของเซิร์ฟเวอร์) จากประเทศเกาหลีใต้ได้เริ่มเล่นเกมกับนักกีฬามืออาชีพ จากนั้นได้เปลี่ยนชื่อบัญชีเป็น "มาสเตอร์" (Master) ในวันที่ 30 ธันวาคม แล้วย้ายไปที่เซิร์ฟเวอร์ฟอกซ์โกะในวันที่ 1 มกราคม ค.ศ. 2017 ครั้นเมื่อวันที่ 4 มกราคม ทางดีปไมด์ได้ยืนยันว่าทั้ง "มาจิสเตอร์" และ "มาสเตอร์" เป็นการเล่นโดยแอลฟาโกะในเวอร์ชันที่อัปเดตแล้ว[38][39] ณ วันที่ 5 มกราคม ค.ศ. 2017 สถิติออนไลน์ของแอลฟาโกะคือแพ้ 60 ครั้งและแพ้ 0 ครั้ง[40] รวมถึงสามชัยชนะเหนือผู้เล่นอันดับหนึ่งของหมากล้อมอย่างเคอ เจี๋ย[41] ที่ได้รับการบรรยายสรุปอย่างเงียบ ๆ ล่วงหน้าว่ามาสเตอร์เป็นเวอร์ชันหนึ่งของแอลฟาโกะ[40] หลังจากแพ้ต่อมาสเตอร์ กู่ ลี่ เสนอเงินรางวัล 100,000 หยวน (14,400 ดอลลาร์สหรัฐ) ให้แก่ผู้เล่นคนแรกที่สามารถเอาชนะมาสเตอร์ได้[39] มาสเตอร์เล่นที่ 10 เกมต่อวัน หลายคนสงสัยอย่างรวดเร็วว่าเป็นผู้เล่นเอไอเนื่องจากมีการพักระหว่างเกมน้อยหรือไม่มีเลย คู่ต่อสู้ของมันรวมถึงแชมป์โลกหลายราย เช่น เคอ เจี๋ย, พัก จ็อง-ฮวัน, ยูตะ อิยามะ, ตั้ว เจียซี, หมี่ ยวี่ถิง, สือ เยวี่ย, เฉิน เย่าเย่, หลี่ ชินเฉิง, กู่ ลี่, ฉาง เฮ่า, ถัง เหวยซิง, ฟั่น ถิงอี้ว์, โจว รุ่ยหยาง, เจียง เหวยเจี๋ย, โจว จุ้น-ซุน, คิม จี-ซ็อก, คัง ทง-ยุน, พัก ย็อง-ฮุน และว็อน ซ็อง-จิน; แชมป์ของประเทศหรือรองแชมป์โลก เช่น เหลียน เซี่ยว, ถัน เซี่ยว, เม่ง ไท่หลิง, ตั่ง อี้เฟย, หวง หยุนซง, หยาง ติ่งซิน, กู จื่อเหา, ชิน จินซอ, โช ฮัน-ซึง และอัน ซ็องจุน เกมทั้งหมด 60 เกมยกเว้นหนึ่งเกมเป็นเกมเร็ว กับสามเกมแบบเบียวโยมิ 20 หรือ 30 วินาที มาสเตอร์ได้เสนอให้ขยายเบียวโยมิไปหนึ่งนาทีเมื่อเล่นกับเนี่ย เว่ยผิง ในการพิจารณาจากอายุของเขา หลังจากชนะเกมที่ 59 มาสเตอร์ได้เปิดเผยตัวเองในแชทรูมที่ได้รับการควบคุมโดย ดร. เอจา ฮวง จากทีมดีปไมด์[42] แล้วเปลี่ยนสัญชาติของมันเป็นสหราชอาณาจักร หลังจากเกมเหล่านี้เสร็จสิ้น เดมิส ฮัสซาบิส ซึ่งเป็นผู้ร่วมก่อตั้งกูเกิล ดีปไมด์ ได้กล่าวในทวีตว่า "เรากำลังรอคอยที่จะเล่นเกมอย่างเป็นทางการและเต็มรูปแบบในเวลาต่อมา [ค.ศ. 2017] โดยร่วมมือกับองค์กรหมากล้อมและผู้เชี่ยวชาญ"[38][39]

ผู้เชี่ยวชาญด้านหมากล้อมรู้สึกประทับใจกับประสิทธิภาพการทำงานของแอลฟาโกะ และสไตล์การเล่นที่ไม่ได้เป็นมนุษย์ เคอ เจี๋ย กล่าวว่า "หลังจากที่มนุษยชาติใช้เวลาหลายพันปีในการปรับปรุงกลยุทธ์ของเรา คอมพิวเตอร์บอกเราว่ามนุษย์เป็นฝ่ายผิดอย่างสิ้นเชิง... ผมจะส่งเสียงเท่าที่จะบอกได้ว่าไม่ใช่มนุษย์คนเดียวที่ได้สัมผัสกับขอบแห่งความจริงของหมากล้อม"[40]

การประชุมสุดยอดหมากล้อมแห่งอนาคต แก้

ในการประชุมสุดยอดหมากล้อมแห่งอนาคต ซึ่งจัดขึ้นที่อูเจิ้นในเดือนพฤษภาคม ค.ศ. 2017 แอลฟาโกะได้เล่นสามเกมกับเคอ เจี๋ย ซึ่งเป็นนักหมากล้อมอันดับ 1 ของโลก รวมทั้งสองเกมกับมืออาชีพจีนชั้นนำหลายคน ได้แก่ เกมหมากล้อมแบบจับคู่หนึ่งเกม และที่พบกับทีมห้าผู้เล่นที่เป็นมนุษย์อีกหนึ่งเกม[43]

กูเกิล ดีปไมด์ มอบรางวัล 1.5 ล้านดอลลาร์เป็นรางวัลแก่ผู้ชนะสำหรับการจับคู่สามเกมระหว่างเคอ เจี๋ย และแอลฟาโกะ ขณะที่ฝ่ายแพ้ได้รับเงิน 300,000 ดอลลาร์[44][45][46] ซึ่งแอลฟาโกะชนะทั้งสามเกมกับเคอ เจี๋ย[47][48] รวมทั้งแอลฟาโกะได้รับรางวัล 9 ดั้งระดับมืออาชีพจากสมาคมหมากล้อมแห่งประเทศจีน[9]

หลังจากที่ชนะการแข่งขันสามเกมกับเคอ เจี๋ย ผู้เป็นนักหมากล้อมอันดับสูงสุด แอลฟาโกะก็ได้อำลาวงการ และทางดีปไมด์ยังยกเลิกการทำงานของทีมที่ทำงานเกี่ยวกับเกมเพื่อมุ่งเน้นไปที่การวิจัยเอไอในด้านอื่น ๆ ต่อไป[11] หลังจากการประชุมสุดยอด ดีปไมด์ได้เผยแพร่แมตช์แอลฟาโกะปะทะแอลฟาโกะ 50 เกมเต็มความยาว เป็นของขวัญให้แก่ชุมชนหมากล้อม[49]

แอลฟาโกะ ซีโร และแอลฟาซีโร แก้

ทีมแอลฟาโกะเผยแพร่บทความในวารสารเนเจอร์ เมื่อวันที่ 19 ตุลาคม ค.ศ. 2017 โดยแนะนำแอลฟาโกะ ซีโร ซึ่งเป็นเวอร์ชันที่ไม่มีข้อมูลของมนุษย์และแข็งแกร่งกว่าเวอร์ชันก่อน ๆ ของมนุษย์ที่ชนะการแข่งขัน[50] โดยการเล่นเกมกับตัวเอง แอลฟาโกะ ซีโร เหนือกว่าจุดแข็งของแอลฟาโกะ อี ภายในสามวันด้วยการชนะ 100 เกมต่อ 0 อีกทั้งถึงระดับของแอลฟาโกะ มาสเตอร์ ภายใน 21 วัน และเหนือกว่ารุ่นเก่าทั้งหมดใน 40 วัน[51]

ในเอกสารที่เผยแพร่ในอาร์ซิฟเมื่อวันที่ 5 ธันวาคม ค.ศ. 2017 ดีปไมด์อ้างว่ามันใช้แนวทางแอลฟาโกะ ซีโร โดยทั่วไปจนกลายเป็นแอลฟาซีโรอัลกอริทึมเดียว ซึ่งประสบความสำเร็จภายใน 24 ชั่วโมงในระดับที่เหนือกว่าของการเล่นในเกมหมากรุกสากล, หมากรุกญี่ปุ่น และหมากล้อม โดยการเอาชนะโปรแกรมแชมป์โลก ทั้งสต็อกฟิช, เอลโม และแอลฟาโกะ ซีโร เวอร์ชัน 3 วัน[52]

แกรนด์มาสเตอร์ ฮิการุ นากามูระ รู้สึกประทับใจเล็กน้อยในการชนะหมากรุกสากลของแอลฟาซีโร โดยกล่าวว่า "ความเข้าใจของผมคือแอลฟาซีโรนั้นใช้ซูเปอร์คอมพิวเตอร์ของกูเกิล และสต็อกฟิชไม่ทำงานบนฮาร์ดแวร์นั่น สต็อกฟิชนั้นทำงานบนแล็ปท็อปของผม หากคุณต้องการมีการแข่งขันที่เทียบเคียงคุณต้องมีสต็อกฟิชทำงานบนซูเปอร์คอมพิวเตอร์เช่นกัน"[53] ผู้เล่นหมากรุกสากลระดับแถวหน้าของสหรัฐอย่างโวล์ฟ มอร์โรว์ ก็รู้สึกไม่ประทับใจเช่นกัน โดยอ้างว่าแอลฟาซีโรอาจจะไม่ทำให้รอบรองชนะเลิศของการแข่งขันที่เป็นธรรมเหมือนกับทีซีอีซีที่เอนจินทั้งหมดเล่นบนฮาร์ดแวร์ที่เท่าเทียมกัน มอร์โรว์กล่าวเพิ่มเติมว่าแม้ว่าเขาอาจจะไม่สามารถเอาชนะแอลฟาซีโรได้หากแอลฟาซีโรเล่นเปืดเกมเช่นการป้องกันของเปตรอฟ ซึ่งแอลฟาซีโรจะไม่สามารถเอาชนะเขาได้ในเกมหมากรุกทางจดหมายเช่นกัน[54]

เครื่องมือการสอน แก้

เมื่อวันที่ 11 ธันวาคม ค.ศ. 2017 ดีปไมด์ได้เปิดตัวเครื่องมือการสอนแอลฟาโกะในเว็บไซต์ของตน[55] เพื่อวิเคราะห์อัตราการชนะของการเปิดหมากล้อมที่แตกต่างกันตามที่แอลฟาโกะ มาสเตอร์ คำนวณ[56] เครื่องมือการสอนรวบรวม 6,000 การเปิดหมากล้อมจาก 230,000 เกมของมนุษย์ในแต่ละเกมที่วิเคราะห์ด้วย 10,000,000 แบบจำลองโดยแอลฟาโกะ มาสเตอร์ หลายการเปิดประกอบด้วยการแนะนำการดำเนินเกมของมนุษย์[56]

เวอร์ชัน แก้

แอลฟาโกะเวอร์ชันก่อน ๆ ได้รับการทดสอบเกี่ยวกับฮาร์ดแวร์ที่มีซีพียูและจีพียูหลายแบบ โดยทำงานในแบบอะซิงโครนัสหรือโหมดแบบกระจาย สองวินาทีของการคิดในการเดินแต่ละตา ผลการให้คะแนนอีโลแสดงที่รายการด้านล่าง[10] โดยในการแข่งขันที่มีเวลาต่อการเดินมากขึ้นระดับการให้คะแนนเมื่อชนะก็จะมากขึ้น

การกำหนดค่าและประสิทธิภาพ
โครงแบบ กระบวนการทำงาน
ค้นหา
จำนวนของซีพียู จำนวนของจีพียู การให้คะแนนอีโล
แบบเดี่ยว[10] พี. 10–11 40 48 1 2,181
แบบเดี่ยว 40 48 2 2,738
แบบเดี่ยว 40 48 4 2,850
แบบเดี่ยว 40 48 8 2,890
แบบกระจาย 12 428 64 2,937
แบบกระจาย 24 764 112 3,079
แบบกระจาย 40 1,202 176 3,140
แบบกระจาย 64 1,920 280 3,168

ในเดือนพฤษภาคม ค.ศ. 2016 กูเกิลได้เปิดตัว "หน่วยประมวลผลเทนเซอร์" ซึ่งเป็นฮาร์ดแวร์ที่เป็นกรรมสิทธิ์ของตนเอง ซึ่งระบุว่าได้รับการติดตั้งในโครงการภายในหลายแห่งที่กูเกิลแล้ว รวมทั้งการแข่งขันแอลฟาโกะกับอี เซ-ดล[57][58]

ในการประชุมสุดยอดหมากล้อมแห่งอนาคตเมื่อเดือนพฤษภาคม ค.ศ. 2017 ดีปไมด์เผยว่าเวอร์ชันของแอลฟาโกะที่ใช้ในการประชุมสุดยอดครั้งนี้คือแอลฟาโกะ มาสเตอร์[59][60] และเปิดเผยว่าได้วัดความแรงของซอฟต์แวร์เวอร์ชันต่าง ๆ ส่วนแอลฟาโกะ อี ซึ่งเป็นเวอร์ชันที่ใช้กับอี สามารถต่อให้แอลฟาโกะ ฝาน ซึ่งเป็นเวอร์ชันที่ใช้กับฝาน ฮุย ด้วยแต้มต่อสามเม็ด และแอลฟาโกะ มาสเตอร์ ที่มีแต้มต่อสามเม็ดอีกแบบที่แข็งแกร่งขึ้น[61]

การกำหนดค่าและความแข็งแกร่ง[62]
เวอร์ชัน ฮาร์ดแวร์ การให้คะแนนอีโล แมตช์
แอลฟาโกะ ฝาน 176 จีพียู,[51] แบบกระจาย 3,144[50] 5:0 กับฝาน ฮุย
แอลฟาโกะ อี 48 ทีพียู,[51] แบบกระจาย 3,739[50] 4:1 กับอี เซ-ดล
แอลฟาโกะ มาสเตอร์ 4 ทีพียู,[51] เครื่องเดียว 4,858[50] 60:0 กับผู้เล่นระดับอาชีพ;
การประชุมสุดยอดหมากล้อมแห่งอนาคต
แอลฟาโกะ ซีโร 4 ทีพียู,[51] เครื่องเดียว 5,185[50] 100:0 กับแอลฟาโกะ อี

89:11 กับแอลฟาโกะ มาสเตอร์

แอลฟาซีโร 4 ทีพียู, เครื่องเดียว ไม่สามารถใช้ได้ 60:40 กับแอลฟาโกะ ซีโร

ขั้นตอนวิธี แก้

ตั้งแต่ปี ค.ศ. 2016 ขั้นตอนวิธีของแอลฟาโกะใช้การรวมกันของการเรียนรู้ของเครื่องและเทคนิคการคำนวณแบบการค้นหาต้นไม้ รวมกับการฝึกแบบกว้าง ทั้งจากการเล่นของมนุษย์และคอมพิวเตอร์ มันใช้การคำนวณแบบการค้นหาต้นไม้มงเต การ์โล ที่นำโดย "เครือข่ายคุณค่า" และ "เครือข่ายนโยบาย" ซึ่งดำเนินการโดยใช้โครงข่ายประสาทเทียมแบบลึก[3][10] จำนวนจำกัดของการตรวจจับคุณลักษณะเฉพาะเกมก่อนการประมวลผล (ตัวอย่างเช่น เพื่อเน้นว่าการเดินตรงกับรูปแบบนากาเดะ) ได้นำมาใช้กับอินพุตก่อนที่จะถูกส่งไปยังโครงข่ายประสาทเทียม[10]

ระบบโครงข่ายประสาทเทียมได้รับการปลุกเครื่องในขั้นต้นจากความชำนาญในการเล่นเกมของมนุษย์ แอลฟาโกะได้รับการฝึกขั้นต้นเพื่อเลียนแบบการเล่นของมนุษย์โดยพยายามจับคู่การเคลื่อนไหวของผู้เล่นระดับอาชีพจากเกมประวัติศาสตร์ที่บันทึกไว้ โดยใช้ฐานข้อมูลประมาณ 30 ล้านรูปแบบการวางหมาก[19] เมื่อมันถึงระดับหนึ่งของความสามารถ มันก็ได้รับการฝึกเพิ่มเติมโดยการตั้งค่าให้เล่นเกมจำนวนมากกับอินสแตนซ์อื่น ๆ ของตัวเอง โดยใช้การเรียนแบบเสริมกำลังเพื่อพัฒนาการเล่นของมัน[3] และเพื่อหลีกเลี่ยงการเสียเวลาของฝ่ายตรงข้าม โปรแกรมจะถูกกำหนดไว้เป็นพิเศษเพื่อยอมแพ้หากมีการประเมินความน่าจะเป็นของชัยชนะภายใต้เกณฑ์บางอย่าง สำหรับการแข่งขันกับอี เกณฑ์การยอมแพ้ถูกกำหนดไว้ที่ 20 เปอร์เซ็นต์[63]

รูปแบบการเล่น แก้

โทบี แมนนิง ซึ่งเป็นผู้ตัดสินสำหรับแมตช์แอลฟาโกะพบฝาน ฮุย ได้อธิบายถึงรูปแบบของโปรแกรมว่า "อนุรักษ์นิยม"[64] รูปแบบการเล่นของแอลฟาโกะมีความเป็นไปได้ในการชนะมากกว่าด้วยแต้มน้อยกว่า เหนือความเป็นไปได้ในการแพ้มากกว่าด้วยแต้มมากกว่า[16] กลยุทธ์ของการเพิ่มความน่าจะเป็นของการชนะ แตกต่างจากสิ่งที่ผู้เล่นที่เป็นมนุษย์มนุษย์มีแนวโน้มที่จะทำเพื่อเพิ่มผลกำไรจากพื้นที่ และแจกแจงบางส่วนด้วยการเคลื่อนไหวแปลก ๆ ของมัน[65] มันทำการเดินเปิดเกมหลายแบบที่มนุษย์ไม่เคยหรือไม่ค่อยทำ ในขณะที่มักหลีกเลี่ยงการเปิดเกมในเส้นที่สองที่มนุษย์ชอบทำ มันชอบใช้หมากกดไหล่ โดยเฉพาะอย่างยิ่งหากฝ่ายตรงข้ามมีสมาธิมากกว่า[ต้องการอ้างอิง]

การตอบสนองต่อชัยชนะในปี ค.ศ. 2016 แก้

สังคมปัญญาประดิษฐ์ แก้

ชัยชนะในเดือนมีนาคมปี ค.ศ. 2016 ของแอลฟาโกะเป็นก้าวสำคัญในการวิจัยปัญญาประดิษฐ์[66] หมากล้อมได้รับการยกย่องว่าเป็นปัญหาที่ยากในการเรียนรู้ด้วยเครื่องซึ่งคาดว่าจะเป็นไปไม่ได้สำหรับเทคโนโลยีในยุคนั้น[66][67][68] ผู้เชี่ยวชาญส่วนใหญ่คิดว่าโปรแกรมหมากล้อมที่มีประสิทธิภาพอย่างแอลฟาโกะจะต้องใช้เวลาห่างออกไปอย่างน้อยห้าปี[69] โดยผู้เชี่ยวชาญบางคนคิดว่าจะใช้เวลาอย่างน้อยอีกหนึ่งทศวรรษก่อนที่คอมพิวเตอร์จะเอาชนะแชมป์หมากล้อม[10][70][71] ผู้สังเกตการณ์ส่วนใหญ่ในตอนต้นของการแข่งขัน ค.ศ. 2016 คาดว่าอีจะชนะแอลฟาโกะ[66]

พร้อมด้วยเกมเช่นหมากฮอส (ที่ได้ "แก้ปัญหา" โดยทีมผู้เล่นหมากฮอสชีนุก), หมากรุกสากล และปัจจุบันที่หมากล้อมชนะโดยคอมพิวเตอร์ ชัยชนะในเกมกระดานยอดนิยม ไม่สามารถใช้เป็นหลักไมล์สำคัญสำหรับปัญญาประดิษฐ์ในวิถีที่พวกเขาเคยใช้ได้อีกต่อไป เมอร์รีย์ แคมป์เบล แห่งดีปบลู กล่าวถึงชัยชนะของแอลฟาโกะว่า "จุดจบแห่งยุค... พวกเขาได้แสดงให้เห็นว่าเกมกระดานทำได้มากหรือน้อยกว่า และถึงเวลาแล้วที่ต้องก้าวต่อไป"[66]

เมื่อเปรียบเทียบกับดีปบลูหรือกับวัตสัน ขั้นตอนวิธีพื้นฐานของแอลฟาโกะนั้นมีวัตถุประสงค์ทั่วไปมากกว่า และอาจเป็นหลักฐานว่าชุมชนทางวิทยาศาสตร์กำลังก้าวหน้าไปสู่ปัญญาประดิษฐ์ทั่วไป[16][72] ผู้แสดงความคิดเห็นบางคนเชื่อว่าชัยชนะของแอลฟาโกะเป็นโอกาสที่ดีสำหรับสังคมในการเริ่มพูดคุยการเตรียมการสำหรับผลกระทบที่เป็นไปได้ในอนาคตของเครื่องที่มีความฉลาดเอนกประสงค์ (ตามที่ระบุไว้โดยผู้ประกอบการอย่างกาย ซูเตอร์ แอลฟาโกะเองรู้เพียงวิธีเล่นหมากล้อม และไม่มีความฉลาดทางวัตถุประสงค์ทั่วไป: "[มัน] ไม่สามารถตื่นขึ้นมาในเช้าวันหนึ่งและตัดสินใจว่าต้องการเรียนรู้วิธีใช้อาวุธปืน"[66]) ในเดือนมีนาคม ค.ศ. 2016 สจวร์ต รัสเซลล์ นักวิจัยปัญญาประดิษฐ์กล่าวว่า "กระบวนการของปัญญาประดิษฐ์นั้นก้าวหน้าไปเร็วกว่าที่คาดไว้มาก (ซึ่ง) ทำให้คำถามเกี่ยวกับผลระยะยาวที่เร่งด่วนมากขึ้น" และกล่าวเพิ่มเติมว่า "เพื่อให้มั่นใจว่าระบบปัญญาประดิษฐ์ที่มีประสิทธิภาพยิ่งขึ้นยังคงอยู่ภายใต้การควบคุมของมนุษย์... มีงานให้ทำมากมาย"[73] นักวิชาการบางคน เช่น สตีเฟน ฮอว์กิง ได้เตือน (ในเดือนพฤษภาคม ค.ศ. 2015 ก่อนการแข่ง) ว่าการที่ปัญญาประดิษฐ์พัฒนาตัวเองในอนาคตบางอย่างสามารถรับความฉลาดทั่วไปที่เกิดขึ้นจริง โดยนำไปสู่การยึดอำนาจของปัญญาประดิษฐ์ที่ไม่คาดฝัน ส่วนนักวิชาการคนอื่นไม่เห็นด้วย: ฌ็อง-กาเบรียล กานัสเซีย ผู้เชี่ยวชาญด้านปัญญาประดิษฐ์เชื่อว่า "สิ่งต่าง ๆ เช่น 'สามัญสำนึก'... อาจไม่สามารถถอดแบบได้"[74] และกล่าวว่า "ฉันไม่เห็นว่าทำไมเราจะเราจะต้องพูดเกี่ยวกับความกลัว ในทางตรงกันข้าม สิ่งนี้ทำให้เกิดความหวังในหลาย ๆ ด้านเช่นสุขภาพและการสำรวจอวกาศ"[73] และริชาร์ด ซัตตัน นักวิทยาศาสตร์คอมพิวเตอร์ กล่าวว่า "ผมไม่คิดว่าผู้คนควรจะกลัว... แต่ผมคิดว่าผู้คนควรจะให้ความสนใจ"[75]

ในประเทศจีน แอลฟาโกะคือ "ช่วงเวลาแห่งสปุตนิก" ซึ่งช่วยโน้มน้าวให้รัฐบาลจีนจัดลำดับความสำคัญและเพิ่มเงินทุนสำหรับปัญญาประดิษฐ์อย่างมาก[76]

ในปี ค.ศ. 2017 ทีมดีปไมด์แอลฟาโกะได้รับเหรียญสถาปนา ไอเจซีเอไอ มาร์วิน มินสกี สำหรับความสำเร็จที่โดดเด่นในปัญญาประดิษฐ์ “แอลฟาโกะเป็นความสำเร็จที่ยอดเยี่ยม และเป็นตัวอย่างที่สมบูรณ์แบบในสิ่งที่เหรียญมินสกีเริ่มยอมรับ” ศาสตราจารย์ ไมเคิล วูลดริดจ์ ประธานคณะกรรมการรางวัลไอเจซีเอไอกล่าว “สิ่งที่ทำให้ไอเจซีเอไอประทับใจเป็นพิเศษคือแอลฟาโกะประสบความสำเร็จในสิ่งที่ทำผ่านการผสมผสานที่ยอดเยี่ยมของเทคนิคปัญญาประดิษฐ์คลาสสิก รวมถึงเทคนิคการเรียนรู้ของเครื่องจักรที่ล้ำสมัยซึ่งดีปไมด์มีความเกี่ยวข้องอย่างใกล้ชิด โดยเป็นการสาธิตของปัญญาประดิษฐ์ร่วมสมัยที่น่าทึ่ง และเรายินดีที่จะสามารถยอมรับด้วยรางวัลนี้”[77]

สังคมหมากล้อม แก้

หมากล้อมเป็นเกมยอดนิยมในประเทศจีน, ญี่ปุ่น และเกาหลี รวมถึงการแข่งขันปี ค.ศ. 2016 นั้น อาจมีผู้ชมทั่วโลกถึงหลายร้อยล้านคน[66][78] ผู้เล่นหมากล้อมระดับสูงหลายคนได้แสดงลักษณะการเล่นนอกรีตของแอลฟาโกะ ในฐานะที่เป็นการเดินที่น่าสงสัยซึ่งเริ่มสร้างความสับสนให้กับผู้ชม แต่มีเหตุผลในความเข้าใจถึงปัญหาหลังเหตุการณ์:[70] "ผู้เล่นทั้งหมดยกเว้นผู้เล่นหมากล้อมที่ดีที่สุดสร้างสรรค์รูปแบบของพวกเขาโดยเลียนแบบผู้เล่นระดับบน ส่วนแอลฟาโกะดูเหมือนว่าจะมีการเคลื่อนไหวต้นฉบับที่สร้างด้วยตนเองทั้งหมด"[66] แอลฟาโกะดูเหมือนจะแข็งแกร่งขึ้นอย่างไม่คาดคิด แม้จะเปรียบเทียบกับการแข่งขันในเดือนตุลาคม ค.ศ. 2015[79] ที่คอมพิวเตอร์ได้เอาชนะมืออาชีพของหมากล้อมเป็นครั้งแรกโดยที่ไม่มีข้อได้เปรียบจากแต้มต่อ[80] วันรุ่งขึ้นหลังจากความพ่ายแพ้ครั้งแรกของอี ผู้สื่อข่าวอย่างช็อง อารัม ได้นำหมากล้อมไปสู่หนึ่งในหนังสือพิมพ์รายวันที่ใหญ่ที่สุดของเกาหลีใต้ โดยกล่าวว่า "เมื่อคืนนี้มืดมนมาก... หลายคนดื่มแอลกอฮอล์"[81] ส่วนสมาคมหมากล้อมแห่งประเทศเกาหลี ซึ่งเป็นองค์กรที่ดูแลหมากล้อมระดับอาชีพในเกาหลีใต้ ได้มอบรางวัล 9 ดั้งกิตติมศักดิ์แก่แอลฟาโกะสำหรับการแสดงทักษะความคิดสร้างสรรค์และผลักดันความก้าวหน้าของเกม[82]

เคอ เจี๋ย อายุ 18 ปีของประเทศจีน ที่ได้รับการยอมรับว่าเป็นผู้เล่นที่ดีที่สุดในโลกในเวลานั้น[30][83] ซึ่งเริ่มแรกอ้างว่าเขาจะสามารถเอาชนะแอลฟาโกะได้ แต่ปฏิเสธที่จะเล่นกับมันเพราะกลัวว่าจะ "คัดลอกสไตล์ของผม"[83] ในขณะที่การแข่งขันดำเนินไป เคอ เจี๋ย กลับไปกลับมา โดยกล่าวว่า "มีโอกาสสูงที่ผม (อาจ) แพ้" หลังจากการวิเคราะห์สามแมตช์แรก[84] แต่คืนความมั่นใจหลังจากแอลฟาโกะแสดงข้อบกพร่องในแมตช์ที่สี่[85]

โทบี แมนนิง ผู้ตัดสินการแข่งขันของแอลฟาโกะกับฝาน ฮุย และอี ฮา-จิน เลขาธิการใหญ่ของสหพันธ์หมากล้อมนานาชาติ ทั้งสองให้เหตุผลในอนาคตว่าผู้เล่นหมากล้อมจะได้รับความช่วยเหลือจากคอมพิวเตอร์เพื่อเรียนรู้สิ่งที่พวกเขาทำผิดในเกมและพัฒนาทักษะของพวกเขา[80]

หลังจากเกมที่สอง อีบอกว่าเขารู้สึก "พูดไม่ออก": "จากจุดเริ่มต้นของการแข่งขัน, ผมไม่สามารถทำการยกมือขึ้นสำหรับการเดินครั้งเดียว มันเป็นชัยชนะทั้งหมดของแอลฟาโกะ"[86] อีขอโทษสำหรับความพ่ายแพ้ของเขา โดยกล่าวหลังจากเกมที่สามว่า "ผมประเมินความสามารถแอลฟาโกะผิดไปและรู้สึกไร้พลัง"[66] เขาย้ำว่าความพ่ายแพ้ครั้งนี้เป็น "ความพ่ายแพ้ของอี เซ-ดล" และ "ไม่ใช่ความพ่ายแพ้ของมนุษยชาติ"[32][74] อีกล่าวว่าการพ่ายแพ้ต่อเครื่องจักรของเขาในที่สุดนั้น "หลีกเลี่ยงไม่ได้" แต่ก็กล่าวด้วยว่า "หุ่นยนต์จะไม่เข้าใจความงามของเกมแบบเดียวกับที่มนุษย์เราทำ"[74] อีกล่าวถึงชัยชนะในเกมที่สี่ของเขาว่า "ชัยชนะอันล้ำค่าที่ผม (จะ) ไม่ยอมแลกเพื่ออะไรเลย"[32]

ระบบที่คล้ายกัน แก้

เฟซบุ๊กยังทำงานบนระบบการเล่นหมากล้อมของตัวเองด้วยดาร์กฟอเรสต์ ซึ่งขึ้นอยู่กับการรวมการเรียนรู้ของเครื่องและการค้นหาต้นไม้มงเต การ์โล[64][87] ถึงแม้ว่าผู้เล่นที่แข็งแกร่งได้เผชิญกับโปรแกรมหมากล้อมคอมพิวเตอร์อื่น ๆ ตั้งแต่ต้นปี ค.ศ. 2016 มันก็ยังไม่พ่ายแพ้ต่อผู้เล่นระดับอาชีพ[88] ทั้งนี้ ดาร์กฟอเรสต์แพ้ซอฟต์แวร์เครซีสโตนและเซน ซึ่งคาดว่ามีความแข็งแกร่งที่คล้ายกับเครซีสโตนและเซน[89]

ดีปเซนโกะ ซึ่งเป็นระบบที่พัฒนาขึ้นพร้อมการสนับสนุนจากเว็บไซต์แบ่งปันวิดีโออย่างโดวังโงะและมหาวิทยาลัยโตเกียว ได้เป็นฝ่ายแพ้ 2–1 เกมในเดือนพฤศจิกายน ค.ศ. 2016 แก่ผู้เชี่ยวชาญหมากล้อมอย่างโช ชีฮุน ผู้ครองสถิติชนะหมากล้อมสูงสุดในประเทศญี่ปุ่น[90][91]

ตามเอกสารปี ค.ศ. 2018 ในวารสารเนเจอร์ ได้อ้างถึงแนวทางของแอลฟาโกะในฐานะพื้นฐานสำหรับวิธีการใหม่ในการคำนวณโมเลกุลของยาที่อาจเกิดขึ้น[92]

เกมตัวอย่าง แก้

แอลฟาโกะ มาสเตอร์ (หมากขาว) ปะทะถัง เหวยซิง (31 ธันวาคม ค.ศ. 2016) แอลฟาโกะเป็นฝ่ายชนะโดยอีกฝ่ายยอมจำนน หมากขาวที่ 36 ได้รับการยกย่องอย่างกว้างขวาง

                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
การเดิน 99 ตาแรก
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
                                     
การเดินตาที่ 100–186 (149 ที่ 131, 150 ที่ 130)

อิทธิพลของหมากล้อม แก้

ภาพยนตร์สารคดีแอลฟาโกะ[93][94] ได้หยิบยกความหวังว่าอี เซ-ดล และฝาน ฮุย จะได้รับประโยชน์จากประสบการณ์การเล่นแอลฟาโกะ แต่ ณ เดือนพฤษภาคม ค.ศ. 2018 เรตติงของพวกเขาเปลี่ยนไปเล็กน้อย ซึ่งอี เซ-ดล อยู่ในอันดับที่ 11 ของโลก และฝาน ฮุย อันดับที่ 545[95] อย่างไรก็ตามสังคมหมากล้อมอาจพัฒนาขึ้นในวิธีการเล่นเกม[ต้องการอ้างอิง]

หมายเหตุ แก้

อ้างอิง แก้

  1. "Artificial intelligence: Google's AlphaGo beats Go master Lee Se-dol". BBC News. สืบค้นเมื่อ 17 March 2016.
  2. "AlphaGo | DeepMind". DeepMind.
  3. 3.0 3.1 3.2 3.3 3.4 "Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning". Google Research Blog. 27 January 2016.
  4. 4.0 4.1 4.2 4.3 "Google achieves AI 'breakthrough' by beating Go champion". BBC News. 27 January 2016.
  5. "Match 1 – Google DeepMind Challenge Match: Lee Sedol vs AlphaGo". 8 March 2016.
  6. "Google's AlphaGo gets 'divine' Go ranking". straitstimes.com. 15 March 2016. สืบค้นเมื่อ 9 December 2017.
  7. "AlphaGo Movie".
  8. "From AI to protein folding: Our Breakthrough runners-up". Science. 22 December 2016. สืบค้นเมื่อ 29 December 2016.
  9. 9.0 9.1 "中国围棋协会授予AlphaGo职业九段 并颁发证书" (ภาษาจีน). Sohu.com. 27 May 2017. สืบค้นเมื่อ 9 December 2017.
  10. 10.0 10.1 10.2 10.3 10.4 10.5 10.6 10.7 10.8 Silver, David; Huang, Aja; Maddison, Chris J.; Guez, Arthur; Sifre, Laurent; Driessche, George van den; Schrittwieser, Julian; Antonoglou, Ioannis; Panneershelvam, Veda; Lanctot, Marc; Dieleman, Sander; Grewe, Dominik; Nham, John; Kalchbrenner, Nal; Sutskever, Ilya; Lillicrap, Timothy; Leach, Madeleine; Kavukcuoglu, Koray; Graepel, Thore; Hassabis, Demis (28 January 2016). "Mastering the game of Go with deep neural networks and tree search". Nature. 529 (7587): 484–489. Bibcode:2016Natur.529..484S. doi:10.1038/nature16961. ISSN 0028-0836. PMID 26819042. สืบค้นเมื่อ 10 December 2017. 
  11. 11.0 11.1 "After Win in China, AlphaGo's Designers Explore New AI". 2017-05-27.
  12. Schraudolph, Nicol N.; Terrence, Peter Dayan; Sejnowski, J., Temporal Difference Learning of Position Evaluation in the Game of Go (PDF)
  13. 13.0 13.1 "Computer scores big win against humans in ancient game of Go". CNN. 28 January 2016. สืบค้นเมื่อ 28 January 2016.
  14. "Zen computer Go program beats Takemiya Masaki with just 4 stones!". Go Game Guru. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2016-02-01. สืบค้นเมื่อ 28 January 2016.
  15. "「アマ六段の力。天才かも」囲碁棋士、コンピューターに敗れる 初の公式戦". MSN Sankei News. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 24 March 2013. สืบค้นเมื่อ 27 March 2013.
  16. 16.0 16.1 16.2 John Riberio (14 March 2016). "AlphaGo's unusual moves prove its AI prowess, experts say". PC World. สืบค้นเมื่อ 18 March 2016.
  17. "Artificial intelligence breakthrough as Google's software beats grandmaster of Go, the 'most complex game ever devised'". Daily Mail. 27 January 2016. สืบค้นเมื่อ 29 January 2016.
  18. "Google AlphaGo AI clean sweeps European Go champion". ZDNet. 28 January 2016. สืบค้นเมื่อ 28 January 2016.
  19. 19.0 19.1 Metz, Cade (27 January 2016). "In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go". WIRED (ภาษาอังกฤษแบบอเมริกัน). สืบค้นเมื่อ 1 February 2016.
  20. "Special Computer Go insert covering the AlphaGo v Fan Hui match" (PDF). British Go Journal. สืบค้นเมื่อ 1 February 2016.
  21. "Première défaite d'un professionnel du go contre une intelligence artificielle". Le Monde (ภาษาฝรั่งเศส). 27 January 2016.
  22. "Google's AI AlphaGo to take on world No 1 Lee Sedol in live broadcast". The Guardian. 5 February 2016. สืบค้นเมื่อ 15 February 2016.
  23. "Google DeepMind is going to take on the world's best Go player in a luxury 5-star hotel in South Korea". Business Insider. 22 February 2016. สืบค้นเมื่อ 23 February 2016.
  24. Novet, Jordan (4 February 2016). "YouTube will livestream Google's AI playing Go superstar Lee Sedol in March". VentureBeat. สืบค้นเมื่อ 7 February 2016.
  25. "李世乭:即使Alpha Go得到升级也一样能赢" (ภาษาจีน). JoongAng Ilbo. 23 February 2016. สืบค้นเมื่อ 24 February 2016.
  26. 26.0 26.1 "이세돌 vs 알파고, '구글 딥마인드 챌린지 매치' 기자회견 열려" (ภาษาเกาหลี). Korea Baduk Association. 22 February 2016. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2016-03-03. สืบค้นเมื่อ 22 February 2016.
  27. Demis Hassabis [@demishassabis] (11 March 2016). "We are using roughly same amount of compute power as in Fan Hui match: distributing search over further machines has diminishing returns" (ทวีต). สืบค้นเมื่อ 14 March 2016 – โดยทาง ทวิตเตอร์.
  28. "Showdown". The Economist. สืบค้นเมื่อ 19 November 2016.
  29. Steven Borowiec (9 March 2016). "Google's AI machine v world champion of 'Go': everything you need to know". The Guardian. สืบค้นเมื่อ 15 March 2016.
  30. 30.0 30.1 Rémi Coulom. "Rating List of 2016-01-01". คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 18 March 2016. สืบค้นเมื่อ 18 March 2016.
  31. "Korean Go master proves human intuition still powerful in Go". The Korean Herald/ANN. 14 March 2016. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2016-04-12. สืบค้นเมื่อ 15 March 2016.
  32. 32.0 32.1 32.2 Yoon Sung-won (14 March 2016). "Lee Se-dol shows AlphaGo beatable". The Korea Times. สืบค้นเมื่อ 15 March 2016.
  33. "Google's AI beats world Go champion in first of five matches – BBC News". BBC Online. สืบค้นเมื่อ 9 March 2016.
  34. "Google AI wins second Go game against world champion – BBC News". BBC Online. สืบค้นเมื่อ 10 March 2016.
  35. "Google DeepMind AI wins final Go match for 4–1 series win". Engadget. สืบค้นเมื่อ 15 March 2016.
  36. "In Two Moves, AlphaGo and Lee Sedol Redefined the Future". WIRED (ภาษาอังกฤษแบบอเมริกัน). สืบค้นเมื่อ 2017-11-12.
  37. "黄士杰:AlphaGo李世石人机大战第四局问题已解决date=8 July 2016" (ภาษาจีน). คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2018-10-10. สืบค้นเมื่อ 8 July 2016.
  38. 38.0 38.1 Demis Hassabis (4 January 2017). "Demis Hassabis on Twitter: "Excited to share an update on #AlphaGo!"". Demis Hassabis's Twitter account. สืบค้นเมื่อ 4 January 2017.
  39. 39.0 39.1 39.2 Elizabeth Gibney (4 January 2017). "Google reveals secret test of AI bot to beat top Go players". Nature. สืบค้นเมื่อ 4 January 2017.
  40. 40.0 40.1 40.2 "Humans Mourn Loss After Google Is Unmasked as China's Go Master". Wall Street Journal. 5 January 2017. สืบค้นเมื่อ 6 January 2017.
  41. "The world's best Go player says he still has "one last move" to defeat Google's AlphaGo AI". Quartz. 4 January 2017. สืบค้นเมื่อ 6 January 2017.
  42. "横扫中日韩棋手斩获59胜的Master发话:我是阿尔法狗" (ภาษาจีน). 澎湃新闻. 4 January 2017. สืบค้นเมื่อ 11 December 2017.
  43. "Exploring the mysteries of Go with AlphaGo and China's top players". 2017-04-10. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2017-04-11. สืบค้นเมื่อ 2018-10-24.
  44. "World No.1 Go player Ke Jie takes on upgraded AlphaGo in May". 2017-04-10.
  45. "Ke Jie vs. AlphaGo: 8 things you must know". 2017-05-27. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2017-12-14. สืบค้นเมื่อ 2018-10-27.
  46. "8 things you should know about the AlphaGo vs. Ke Jie match". 2017-05-27.
  47. "Revamped AlphaGo Wins First Game Against Chinese Go Grandmaster". 2017-05-23.
  48. "Google's AlphaGo Continues Dominance With Second Win in China". 2017-05-25.
  49. "Full length games for Go players to enjoy". Deepmind. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2019-08-05. สืบค้นเมื่อ 2017-05-28.
  50. 50.0 50.1 50.2 50.3 50.4 Silver, David; Schrittwieser, Julian; Simonyan, Karen; Antonoglou, Ioannis; Huang, Aja; Guez, Arthur; Hubert, Thomas; Baker, Lucas; Lai, Matthew; Bolton, Adrian; Chen, Yutian; Lillicrap, Timothy; Fan, Hui; Sifre, Laurent; Driessche, George van den; Graepel, Thore; Hassabis, Demis (19 October 2017). "Mastering the game of Go without human knowledge". Nature. 550 (7676): 354–359. Bibcode:2017Natur.550..354S. doi:10.1038/nature24270. ISSN 0028-0836. สืบค้นเมื่อ 10 December 2017. 
  51. 51.0 51.1 51.2 51.3 51.4 "AlphaGo Zero: Learning from scratch". DeepMind official website. 18 October 2017. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2017-10-19. สืบค้นเมื่อ 19 October 2017.
  52. Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (5 December 2017). "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm". arXiv:1712.01815 [cs.AI].
  53. "AlphaZero: Reactions From Top GMs, Stockfish Author". chess.com. 8 December 2017. สืบค้นเมื่อ 13 December 2017.
  54. "Talking modern correspondence chess". Chessbase. 26 June 2018. สืบค้นเมื่อ 11 July 2018.
  55. "AlphaGo teaching tool". DeepMind.
  56. 56.0 56.1 "AlphaGo教学工具上线 樊麾:使用Master版本" (ภาษาจีน). Sina.com.cn. 11 December 2017. สืบค้นเมื่อ 11 December 2017.
  57. McMillan, Robert (18 May 2016). "Google Isn't Playing Games With New Chip". Wall Street Journal. สืบค้นเมื่อ 26 June 2016.
  58. Jouppi, Norm (May 18, 2016). "Google supercharges machine learning tasks with TPU custom chip". Google Cloud Platform Blog (ภาษาอังกฤษแบบอเมริกัน). Google. สืบค้นเมื่อ 2016-06-26.
  59. "AlphaGo官方解读让三子 对人类高手没这种优势" (ภาษาจีน). Sina. 25 May 2017. สืบค้นเมื่อ 2 June 2017.
  60. "各版alphago实力对比 master能让李世石版3子" (ภาษาจีน). Sina. 24 May 2017. สืบค้นเมื่อ 2 June 2017.
  61. "New version of AlphaGo self-trained and much more efficient". American Go Association. 24 May 2017. สืบค้นเมื่อ 1 June 2017.
  62. "【柯洁战败解密】AlphaGo Master最新架构和算法,谷歌云与TPU拆解" (ภาษาจีน). Sohu. 24 May 2017. สืบค้นเมื่อ 1 June 2017.
  63. Cade Metz (13 March 2016). "Go Grandmaster Lee Sedol Grabs Consolation Win Against Google's AI". Wired News. สืบค้นเมื่อ 29 March 2016.
  64. 64.0 64.1 Gibney, Elizabeth (27 January 2016). "Google AI algorithm masters ancient game of Go". Nature News & Comment. สืบค้นเมื่อ 3 February 2016.
  65. Chouard, Tanguy (12 March 2016). "The Go Files: AI computer clinches victory against Go champion". Nature. doi:10.1038/nature.2016.19553.
  66. 66.0 66.1 66.2 66.3 66.4 66.5 66.6 66.7 Steven Borowiec; Tracey Lien (12 March 2016). "AlphaGo beats human Go champ in milestone for artificial intelligence". Los Angeles Times. สืบค้นเมื่อ 13 March 2016.
  67. Connor, Steve (27 January 2016). "A computer has beaten a professional at the world's most complex board game". The Independent. สืบค้นเมื่อ 28 January 2016.
  68. "Google's AI beats human champion at Go". CBC News. 27 January 2016. สืบค้นเมื่อ 28 January 2016.
  69. Dave Gershgorn (12 March 2016). "GOOGLE'S ALPHAGO BEATS WORLD CHAMPION IN THIRD MATCH TO WIN ENTIRE SERIES". Popular Science. สืบค้นเมื่อ 13 March 2016.
  70. 70.0 70.1 "Google DeepMind computer AlphaGo sweeps human champ in Go matches". CBC News. Associated Press. 12 March 2016. สืบค้นเมื่อ 13 March 2016.
  71. Sofia Yan (12 March 2016). "A Google computer victorious over the world's 'Go' champion". CNN Money. สืบค้นเมื่อ 13 March 2016.
  72. "AlphaGo: Google's artificial intelligence to take on world champion of ancient Chinese board game". Australian Broadcasting Corporation. 8 March 2016. สืบค้นเมื่อ 13 March 2016.
  73. 73.0 73.1 Mariëtte Le Roux (12 March 2016). "Rise of the Machines: Keep an eye on AI, experts warn". Phys.org. สืบค้นเมื่อ 13 March 2016.
  74. 74.0 74.1 74.2 Mariëtte Le Roux; Pascale Mollard (8 March 2016). "Game over? New AI challenge to human smarts (Update)". phys.org. สืบค้นเมื่อ 13 March 2016.
  75. Tanya Lewis (11 March 2016). "An AI expert says Google's Go-playing program is missing 1 key feature of human intelligence". Business Insider. สืบค้นเมื่อ 13 March 2016.
  76. Mozur, Paul (20 July 2017). "Beijing Wants A.I. to Be Made in China by 2030". The New York Times. สืบค้นเมื่อ 11 April 2018.
  77. "Marvin Minsky Medal for Outstanding Achievements in AI". International Joint Conference on Artificial Intelligence (ภาษาอังกฤษ). 19 October 2017. สืบค้นเมื่อ 21 October 2017.
  78. CHOE SANG-HUN (16 March 2016). "Google's Computer Program Beats Lee Se-dol in Go Tournament". New York Times. สืบค้นเมื่อ 18 March 2016. More than 100 million people watched the AlphaGo-Lee matches, Mr. Hassabis said.
  79. John Ribeiro (12 March 2016). "Google's AlphaGo AI program strong but not perfect, says defeated South Korean Go player". PC World. สืบค้นเมื่อ 13 March 2016.
  80. 80.0 80.1 Gibney, Elizabeth (2016). "Go players react to computer defeat". Nature. doi:10.1038/nature.2016.19255.
  81. "How victory for Google's Go AI is stoking fear in South Korea". New Scientist. 15 March 2016. สืบค้นเมื่อ 18 March 2016.
  82. JEE HEUN KAHNG; SE YOUNG LEE (15 March 2016). "Google artificial intelligence program beats S. Korean Go pro with 4–1 score". Reuters. สืบค้นเมื่อ 18 March 2016.
  83. 83.0 83.1 Neil Connor (11 March 2016). "Google AlphaGo 'can't beat me' says China Go grandmaster". The Telegraph (UK). สืบค้นเมื่อ 13 March 2016.
  84. "Chinese Go master Ke Jie says he could lose to AlphaGo : The DONG-A ILBO". สืบค้นเมื่อ 17 March 2016.
  85. ""...if today's performance was its true capability, then it doesn't deserve to play against me."". M.hankooki.com. 2016-03-14. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2016-03-15. สืบค้นเมื่อ 2018-06-05.
  86. CHOE SANG-HUN (15 March 2016). "In Seoul, Go Games Spark Interest (and Concern) About Artificial Intelligence". New York Times. สืบค้นเมื่อ 18 March 2016.
  87. Tian, Yuandong; Zhu, Yan (2015). "Better Computer Go Player with Neural Network and Long-term Prediction". arXiv:1511.06410v1 [cs.LG].
  88. HAL 90210 (28 January 2016). "No Go: Facebook fails to spoil Google's big AI day". The Guardian (ภาษาอังกฤษแบบบริติช). ISSN 0261-3077. สืบค้นเมื่อ 1 February 2016.
  89. "Strachey Lecture – Dr Demis Hassabis". The New Livestream. สืบค้นเมื่อ 17 March 2016.
  90. "Go master Cho wins best-of-three series against Japan-made AI". The Japan Times Online. 24 November 2016. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2017-08-14. สืบค้นเมื่อ 27 November 2016.
  91. "Humans strike back: Korean Go master bests AI in board game bout". CNET. สืบค้นเมื่อ 27 November 2016.
  92. "Go and make some drugs The Engineer". www.theengineer.co.uk (ภาษาอังกฤษ). สืบค้นเมื่อ 2018-04-03.
  93. https://www.alphagomovie.com/
  94. "AlphaGo (2017)". Rotten Tomatoes. สืบค้นเมื่อ 2018-06-05.
  95. "Go Ratings". Go Ratings. สืบค้นเมื่อ 2018-06-05.

แหล่งข้อมูลอื่น แก้