อคติที่เกิดจากการเลือกตัวอย่าง

อคติที่เกิดจากการเลือกตัวอย่าง[1] หรือ ความเอนเอียงโดยการคัดเลือก[2] (อังกฤษ: Selection bias) คือความผิดพลาดทางสถิติ เนื่องมาจากวิธีการเลือกตัวอย่างหรือกลุ่มตัวอย่างในงานศึกษาทางวิทยาศาสตร์ ที่โดยเฉพาะหมายถึงการคัดเลือกบุคคล กลุ่ม หรือข้อมูลเพื่อทำการวิเคราะห์ โดยที่ไม่มีการสุ่ม (randomization) ที่สมควร และดังนั้นจึงทำให้ตัวอย่างที่ชัก ไม่สามารถเป็นตัวแทนประชากรที่ต้องการจะวิเคราะห์[3] ตัวอย่างเช่น[4]

  • การสำรวจที่ได้ข้อมูลจากอาสาสมัคร หรือบุคคลเฉพาะสถานที่ ที่ใดที่หนึ่ง ในช่วงเวลาช่วงใดช่วงหนึ่ง
  • งานศึกษาในคนไข้โรงพยาบาลที่อยู่ใต้การดูแลของหมอ โดยไม่ได้รวมบุคคลที่เสียชีวิตเพราะมีอาการรุนแรงจากโรคก่อนที่จะเข้าโรงพยาบาล ไม่ได้รวมคนที่ยังไม่ป่วยพอที่จะเข้าโรงพยาบาล และไม่ได้รวมคนที่อาจจะมีปัญหาเกี่ยวกับค่าใช้จ่าย การเดินทาง หรือปัญหาอื่น ๆ

เป็นปรากฏการณ์ที่บางครั้งเรียกว่า selection effect (ปรากฏการณ์การคัดเลือก) และหากไม่พิจารณาผลของความเอนเอียงจากการคัดเลือก จะทำให้การสรุปผลจากตัวอย่างงานวิจัยนั้นผิดพลาด

ประเภท แก้

ความเอนเอียงนี้มีหลายประเภท รวมทั้งหัวข้อย่อยต่าง ๆ ดังต่อไปนี้

ความเอนเอียงโดยการสุ่มตัวอย่าง แก้

ความเอนเอียงโดยการสุ่มตัวอย่าง[5] (อังกฤษ: Sampling bias) เป็นความผิดพลาดอย่างเป็นระบบเนื่องจากการชักตัวอย่างที่ไม่ได้สุ่มจากกลุ่มประชากร[6] ทำให้ชักบุคคลแต่ละพวกโดยโอกาสที่ไม่เท่ากัน มีผลเป็นตัวอย่างที่ไม่สมดุล (biased sample) ซึ่งมีนิยามว่า เป็นการชักตัวอย่างทางสถิติจากกลุ่มประชากร (หรือองค์อย่างอื่นที่ไม่เกี่ยวกับมนุษย์) ที่ไม่สมดุล ที่ไม่สามารถเป็นตัวแทนของกลุ่มประชากรได้[7]

ความเอนเอียงนี้ มักจะจำแนกว่าเป็นแบบย่อยของความเอนเอียงโดยการคัดเลือก[8] และบางครั้งจะเรียกอย่างเฉพาะเจาะจงว่า sample selection bias[9][10][11] แต่บางครั้งก็จัดเป็นความเอนเอียงต่างหากเช่นกัน[12] ตัวอย่างของความเอนเอียงโดยการสุ่มตัวอย่างก็คือ การที่ผู้ร่วมการทดลองจัดตัวเองเข้ากลุ่ม (เช่นเป็นอาสาสมัคร) การคัดเลือกผู้เข้าร่วมการทดลอง (pre-screening) การตัดข้อมูลผู้ป่วยหรือการตรวจสอบที่ไม่เสร็จบริบูรณ์ และการตัดข้อมูลผู้ป่วยที่ย้ายออกจากพื้นที่การศึกษา (migration bias)

โดยหยุดการทดลองที่ยังไม่เสร็จ แก้

  • หยุดการทดลองที่ยังทำไม่สมบูรณ์ ในขณะที่ผลกำลังสนับสนุนสมมุติฐานที่ต้องการ
  • หยุดการทดลองเพราะได้ค่าที่สุดโต่ง (บ่อยครั้งเพราะเหตุผลทางจริยธรรม) แต่ค่าสุดโต่งอาจจะมาจากตัวแปรที่มีค่าความแปรปรวนระดับสูงสุด แม้ว่า ตัวแปรที่เหลือจะมีค่าใกล้ ๆ กับค่าเฉลี่ย

โดยปัจจัยที่ได้รับ แก้

  • Susceptibility bias
    • Clinical susceptibility bias คือเมื่อโรคชนิดหนึ่งเพิ่มโอกาสให้เกิดโรคชนิดที่สอง การรักษาโรคแรก (ปัจจัยที่ได้รับ) จึงปรากฏผิดพลาดเหมือนกับเพิ่มโอกาสให้โรคที่สอง ยกตัวอย่างเช่นการหมดระดูเพิ่มโอกาสให้เกิดโรคมะเร็งเยื่อบุมดลูก ดังนั้น จึงโทษฮอร์โมนเอสโทรเจนที่ให้เพื่อแก้ปัญหาเกี่ยวกับการหมดระดู ว่าเป็นเหตุให้เกิดมะเร็ง[13]
    • Protopathic bias คือ เมื่อการรักษาอาการแรกที่เกิดขึ้นของโรคหรือของผลที่เป็นประเด็นศึกษา (ปัจจัยที่ได้รับ) ดูเหมือนจะเป็นเหตุให้เกิดผล เป็นความเอนเอียงที่อาจจะมีได้เมื่อช่วงระยะเวลาระหว่างการเกิดอาการแรกและการเริ่มการรักษา กับการวินิจฉัยว่ามีผลที่เป็นประเด็นเกิดขึ้นแล้ว ห่างกัน[13] ซึ่งสามารถบริหารได้ด้วยวิธี lagging ซึ่งก็คือ การไม่ถือเอาปัจจัยที่ได้รับ (เช่นการรักษา) ถ้าเกิดก่อนการวินิจฉัยเป็นช่วงระยะเวลาหนึ่ง[14]
    • Indication bias คือความเอนเอียงที่เกิดขึ้น เมื่อมีตัวชี้อย่างหนึ่งที่สัมพันธ์ทั้งกับการเริ่มให้การรักษา (หรือการได้ปัจจัย) และกับผลเช่นโรคที่เกิดขึ้น[15] ยกตัวอย่างเช่น การเริ่มรักษาบุคคลที่มีโอกาสเสี่ยงสูงที่จะเกิดโรค อาจทำให้คนที่ได้รับการรักษามีอัตราสูงกว่าในการเกิดโรค ทำให้ปรากฏอย่างผิด ๆ ว่า การรักษาโรคที่ให้ เป็นเหตุของโรค[16]

โดยข้อมูล แก้

  • การแบ่งข้อมูลเป็นส่วน ๆ โดยรู้ว่าในแต่ละส่วนมีข้อมูลอะไร แล้ววิเคราะห์ข้อมูล โดยวิธีที่ออกแบบให้ใช้กับข้อมูลที่ไม่รู้ว่าส่วนต่าง ๆ มีข้อมูลอะไร
  • การคัดทิ้งข้อมูล "เสีย" ตามอำเภอใจ โดยไม่ใช้กฎเกณฑ์ที่ได้ตั้งไว้หรือที่เป็นที่ยอมรับโดยทั่วไป
  • การคัดทิ้งข้อมูลแบบ "outliers" คือที่ต่างจากค่าอื่น ๆ จนกระทั่งสงสัยว่าเป็นความผิดพลาดทางสถิติ แต่ไม่ได้คำนึงถึงข้อมูลสำคัญที่อาจจะได้จากค่าเช่นนั้น[17]

โดยวิธีการศึกษา แก้

  • เลือกงานศึกษาอย่างไม่สมควร ที่จะใช้เป็นข้อมูลของงานวิเคราะห์อภิมาน (meta-analysis)
  • ทำการทดลองซ้ำ ๆ จนกว่าจะได้ผลที่ต้องการ โดยเรียกการทดลองที่ทำก่อน ๆ ว่าเป็น "การทดสอบเทียบมาตรฐาน" "ความคลาดเคลื่อนของเครื่องมือวัด" หรือ "การสำรวจเบื้องต้น"
  • แสดงผลที่มีนัยสำคัญจากงานที่ทดสอบสมมุติฐานเป็นจำนวนมากกับข้อมูลเดียวกัน (data dredging) ซึ่งมีโอกาสแสดงนัยสำคัญที่เป็นเรื่องบังเอิญ จริง ๆ แล้วเป็นความผิดพลาดที่เหมือนกับข้อที่แล้ว แต่ว่า พิจารณาว่า เป็นการทุจริตน้อยกว่า

โดยการลดจำนวนคน แก้

Attrition bias (ความเอนเอียงโดยลดจำนวนคน) เป็นความเอนเอียงโดยการคัดเลือกเพราะเหตุผู้ร่วมการทดลองลดจำนวนลง[18] ซึ่งเกิดจากการคัดออกซึ่งผู้ร่วมการทดลอง หรือค่าการทดสอบ ที่ไม่สามารถทำให้ถึงที่สุดได้ ซึ่งอาจจะเกิดจากการถอนตัว การไม่ส่งตอบข้อมูล หรือไม่ทำตามกฎเกณฑ์ เป็นการกระทำที่สร้างความเอนเอียงต่อผล เมื่อมีความไม่สมดุลเกี่ยวกับปัจจัยที่ได้รับ และ/หรือผลที่เกิดขึ้น ยกตัวอย่างเช่น ในงานศึกษาโปรแกรมควบคุมอาหาร นักวิจัยอาจจะทิ้งข้อมูลของทุก ๆ คนที่ถอนตัวจากการทดลอง แต่ว่า คนโดยมากอาจจะถอนตัวเพราะโปรแกรมไม่ได้ผล ดังนั้น การสูญเสียผู้ร่วมการทดลองทั้งในกลุ่มทดลองและในกลุ่มเปรียบเทียบ อาจจะเปลี่ยนลักษณะต่าง ๆ ของกลุ่มทั้งสอง และเปลี่ยนผลที่เกิดขึ้น ไม่ว่าปัจจัยทางสุขภาพอะไร (เช่นการควบคุมอาหาร) จะเป็นประเด็นการศึกษา[18]

โดยการคัดเลือกของผู้สังเกตการณ์ แก้

ข้อมูลไม่ได้เกิดการเลือกสรร โดยเหตุแบบการทดลองและการวัดค่าต่าง ๆ เท่านั้น แต่อาจจะเกิดเพราะมีผู้สังเกตการณ์ ความเอนเอียงโดยการคัดเลือกของผู้สังเกตการณ์ (observer bias) จะเกิดขึ้น ในสถานการณ์ที่การมีผู้สังเกตการณ์ หรือแม้แต่การมีการทดลอง มีสหสัมพันธ์กับข้อมูลที่ได้[19]

ยกตัวอย่างเช่น ประวัติการมีวัตถุอวกาศต่าง ๆ มากระทบโลกจะมีความเอนเอียงที่เกิดจากมีผู้สังเกตการณ์ คือ ถ้ามีวัตถุขนาดใหญ่มากระทบโลก ก็จะทำให้เกิดการสูญพันธุ์หมู่ สร้างความเสียหายกับระบบนิเวศ ขัดขวางวิวัฒนาการของผู้สังเกตการณ์ เป็นระยะเวลายาวนาน ดังนั้น จึงจะไม่มีใครที่จะสังเกตพบหลักฐานของวัตถุอวกาศขนาดใหญ่มากระทบโลกที่เกิดขึ้นเมื่อไม่นานมานี้ (ไม่เช่นนั้นแล้วคนสังเกตก็จะไม่มี) ดังนั้น อาจจะมีความเอนเอียงในประวัติการกระทบโลกของวัตถุอวกาศ[20] มหันตภัยทางดาราศาสตร์ ที่มีผลกระทบทั้งโลกแบบอื่น ๆ (นอกจากวัตถุอวกาศมากกระทบโลก) ก็อาจจะมีการประเมินโอกาสต่ำไปเช่นเดียวกัน[21]

การป้องกัน แก้

โดยทั่ว ๆ ไปแล้ว ความเอนเอียงโดยการคัดเลือกไม่สามารถแก้ได้โดยวิธีการวิเคราะห์ทางสถิติเพียงอย่างเดียว แม้ว่า วิธี Heckman correction อาจใช้ได้ในบางกรณี การประเมินระดับความเอนเอียงแบบอรูปนัย อาจทำได้โดยตรวจสอบสหสัมพันธ์ระหว่างตัวแปรภายนอก (exogenous หรือ background) กับตัวชี้บอกการรักษา (treatment indicator) แต่ปัญหาก็คือสหสัมพันธ์ระหว่างเหตุกำหนดผลที่ไม่รู้ กับตัวกำหนดการคัดเลือกตัวอย่างที่ไม่รู้ที่นำไปสู่การประเมินผลที่เอนเอียง จะไม่สามารถประเมินได้โดยตรงจากตัวชี้บอกการรักษาที่สังเกตได้[22]

ความเอนเอียงที่สัมพันธ์กัน แก้

ความเอนเอียงนี้สัมพันธ์กับ

  • ความเอนเอียงในการตีพิมพ์ (publication bias) ซึ่งเป็นรูปแบบของความเอนเอียงโดยการรายงาน (reporting bias) เป็นความบิดเบือนต่อความรู้ในชุมชนหรือในงานวิเคราะห์อภิมาน ที่เกิดจาการไม่ตีพิมพ์ผลที่ไม่น่าสนใจ (โดยปกติคือผลลบหรือผลว่าง) หรือผลที่ไม่เป็นไปตามความคาดหวังของผู้ทำการทดลอง ของผู้ให้เงินทุนสนับสนุน หรือของชุมชนโดยทั่วไป
  • ความเอนเอียงเพื่อยืนยัน (confirmation bias) เป็นความบิดเบือนที่เกิดขึ้นจากการทดลองที่มุ่งจะสืบหาหลักฐานที่ยืนยันสมมุติฐาน แทนที่จะพยายามพิสูจน์ความเท็จของสมมุติฐาน
  • exclusion bias (ความเอนเอียงโดยการยกเว้น) เป็นความบิดเบือนที่เกิดขึ้น เนื่องจากใช้กฎเกณฑ์ที่ต่างกัน ในการตรวจรับผู้ร่วมการทดลองเข้าในกลุ่มทดลองหรือในกลุ่มควบคุม

ดูเพิ่ม แก้

เชิงอรรถและอ้างอิง แก้

  1. "พบคำศัพท์ bias ทั้งหมด 28 รายการ". สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ. สืบค้นเมื่อ 23 April 2015.[ลิงก์เสีย]
  2. "ศัพท์บัญญัติอังกฤษ-ไทย, ไทย-อังกฤษ ฉบับราชบัณฑิตยสถาน (คอมพิวเตอร์) รุ่น ๑.๑", ให้ความหมายของ selection ว่า "การคัดเลือก, การเลือกสรร, และการเลือกหา"
  3. "Dictionary of Cancer Terms → selection bias". Dictionary of Cancer Terms. สืบค้นเมื่อ 23 September 2009.
  4. Last, John M. (2001). A Dictionary of Epidemiology (4 ed.). Oxford University Press. Selection bias - p. 166. ISBN 978-0-19-514169-6.
  5. sampling = [N] การสุ่มตัวอย่าง "Lexitron พจนานุกรมไทย<=>อังกฤษ รุ่น 2.6". หน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา, ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ, กระทรวงวิทยาศาสตร์และเทคโนโลยี. 2546.
  6. "Medical Dictionary - 'Sampling Bias'". คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 10 March 2016. สืบค้นเมื่อ 23 September 2009.
  7. Mosby's Medical Dictionary, 8th edition อ้างอิงโดย "TheFreeDictionary → biased sample". สืบค้นเมื่อ 23 September 2009.
  8. "Dictionary of Cancer Terms → Selection Bias". คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 9 June 2009. สืบค้นเมื่อ 23 September 2009.
  9. Ards, Sheila; Chung, Chanjin; Myers, Samuel L. (1998). "The effects of sample selection bias on racial differences in child abuse reporting". Child Abuse & Neglect. 22 (2): 103–115. doi:10.1016/S0145-2134(97)00131-2. PMID 9504213.
  10. Cortes, Corinna; Mohri, Mehryar; Riley, Michael; Rostamizadeh, Afshin (2008). "Sample Selection Bias Correction Theory" (PDF). Algorithmic Learning Theory. 5254: 38–53. doi:10.1007/978-3-540-87987-9_8.
  11. Cortes, Corinna; Mohri, Mehryar (2014). "Domain adaptation and sample bias correction theory and algorithm for regression" (PDF). Theoretical Computer Science. 519: 103–126. doi:10.1016/j.tcs.2013.09.027.
  12. Fadem, Barbara (2009). Behavioral Science. Lippincott Williams & Wilkins. p. 262. ISBN 978-0-7817-8257-9.
  13. 13.0 13.1 Feinstein, AR; Horwitz, RI (November 1978). "A critique of the statistical evidence associating estrogens with endometrial cancer". Cancer Res. 38 (11 Pt 2): 4001–5. PMID 698947.{{cite journal}}: CS1 maint: multiple names: authors list (ลิงก์)
  14. Tamim, H; Monfared, AA; LeLorier J (March 2007). "Application of lag-time into exposure definitions to control for protopathic bias". Pharmacoepidemiol Drug Saf. 16 (3): 250–8. doi:10.1002/pds.1360. PMID 17245804.{{cite journal}}: CS1 maint: multiple names: authors list (ลิงก์)
  15. Last, John M. (2001). A Dictionary of Epidemiology (4 ed.). Oxford University Press. Confounding by indication - p.38. ISBN 978-0-19-514169-6.
  16. Matthew R. Weir (2005). Hypertension (Key Diseases) (Acp Key Diseases Series). Philadelphia, Pa: American College of Physicians. p. 159. ISBN 1-930513-58-5.
  17. Kruskal, William H. (1960). "Some Remarks on Wild Observations". Technometrics. 2 (1): 1–3. doi:10.1080/00401706.1960.10489875. คลังข้อมูลเก่าเก็บจากแหล่งเดิมเมื่อ 2010-01-26. สืบค้นเมื่อ 6 May 2015.
  18. 18.0 18.1 doi:10.1093/ije/dyh406
    This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand
  19. Bostrom, Nick (2002). Anthropic Bias: Observation Selection Effects in Science and Philosophy. New York: Routledge. ISBN 0-415-93858-9.
  20. doi:10.1111/j.1539-6924.2010.01460.x
    This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand
  21. doi:10.1038/438754a
    This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand
  22. doi:10.2307/1912352
    This citation will be automatically completed in the next few minutes. You can jump the queue or expand by hand