تحيز الاختيار هو اختيار الأفراد أو الجماعات أو البيانات لتحليلها بطريقة لا تحقق التوزيع العشوائي الصحيح، وبهذه الطريقة ضمان أن العينة التي تم الحصول عليها لا تمثل السكان المزمع تحليلهم.[1] يشار إليها أحياناً باسم تأثير الاختيار. عبارة تحيز الاختيار غالبا ما تشير إلى تشويه التحليل الإحصائي، الناتج عن طريقة جمع العينات. إذا لم يؤخذ تحيز الاختيار بعين الاعتبار، عندها تصبح بعض استنتاجات الدراسة غير دقيقة. أحد أمثلة تحيز الاختيار هو انحياز استعياني، ويرتبط أيضاً أرتباطاً وثيقاً بالانحياز التأكيدي.
أنواع
هناك العديد من الأنواع لانحياز الاختيار، نذكر منها:
الانحياز الاستعياني
الانحياز الاستعياني هو خطأ منهجيّ يحدث نتيجة لعدم اختيار عيّنات الدراسة بشكلٍ عشوائي،[2] وهو ما يجعل من تمثيل بعض الأفراد في الدراسة أقلّ من تمثيل البعض الآخر، وينتج عن ذلك الحصول على عيّنة منحازة تعرّف على أنّها عيّنة إحصائيّة لمجموعة بشريّة ما (أو حتّى لمجموعات غير بشريّة) نصيب الأفراد بالتمثيل فيها غير متساوٍ أو غير موضوعيّ.[3] غالباً ما يتمّ تصنيف هذا النوع من الانحياز على أنّه نوع من انحياز الاختيار،[4] وأحياناً يسمّى بالانحياز في اختيار العيّنة،[5][6][7] but some classify it as a separate type of bias.[8] ويصنّفه البعض على أنّه نوع منفصلٍ من الانحياز.
إنّ ما يميّز الانحياز الاستعياني (وإن لم يكن مقبولاً على أنّه نوع منفصل من التحيّز بشكلٍ عام) أنّه يقوّض الصلاحيّة الخارجيّة للاختبار (بمعنى أنّه يقلّل من إمكانيّة تعميم النتائج على بقيّة المجتمعات) بينما يتطرّق تحيّز الاختيار بشكلٍ أساسيّ إلى الصلاحيّة الداخليّة للاختلافات والتشابهات الموجودة في العيّنة المدروسة. ومن هذا المنطلق فإنّ الأخطاء التي تحصل أثناء عمليّة تجميع العيّنات أو مجموعات الدراسة هي التي تتسبّب في الانحياز الاستعياني، وبالمقابل فإنّ حصول تحيّز الاختيار يعتمد على الأخطاء التي تحدث أثناء أي عمليّة تالية لعمليّة تجميع العينّات.
تتضمّن الأمثلة التي توضّح الانحياز الاستعياني أوّلاً انحياز الاختيار الذاتيّ، بمعنى إجراء الدّراسات المسبقة على الخاضعين للتجربة، ثانياً عدم أخذ بعض العيّنات أو الاختبارات التي لم يكتب لها النجاح بالحسبان، وثالثاً انحياز الانتقال الذي يحدث عند استبعاد العيّنات التي انتقلت مؤخّراً إلى داخل دائرة الدراسة أو إلى خارجها.
الفاصل الزمني
الانتهاء المبكّر من التجربة في الوقت الذي تدعم فيه النتائج النتيجة المرغوبة.
قد يتمّ إنهاء التجربة مبكّراً عند قيمة متطرّفة (لأسباب أخلاقيّة في الغالب)، ولكن من المرجّح أن يتمّ الوصول إلى القيمة المتطرّفة بواسطة المتغير ذي التباين الإحصائيّ الأكبر، حتى لو كان لكل المتغيّرات متوسّط واحد.
تعرّض
انحياز التأثّر يحصل انحياز التأثّر السريري عندما يهيّئ أحد الأمراض لمرض آخر، بمعنى أنّ يؤدّي علاج المرض الأوّل خطأً إلى المرض الثاني، عى سبيل المثال: تعطي أعراض ما بعد سنّ اليأس فرصةً أكبر لتطوّر سرطان بطانة الرحم، ولذلك فإنّه من الممكن أن يتحمّل الأستروجين الذي يُفرز في مرحلة ما بعد سنّ اليأس الملامةَ على التسبّب في حدوث سرطان بطانة الرحم.[9] انحياز أوّلي، ويحدث عندما يكون علاج الأعراض الأوّليّة للمرض أو لأيّ نتيجة له سبباً في حدوث النتيجة. هو انحياز محتمل الحدوث عندما يبدأ العلاج بعد فترة زمنيّة من ظهور أولى أعراض المرض قبل التشخيص الفعليّ له.[9] يمكن التقليل من احتماليّة حدوث هذا الانحياز عن طريق التأخّر، أي إقصاء حالات التعرّض التي تحصل في مرحلة معيّنة قبل تشخيص المرض.[10] انحياز الإشارة، وهو خليط محتمل الحدوث بين السبب والنتيجة، يحدث عندما يعتمد التعرّض على الإشارة، على سبيل المثال يتمّ إعطاء علاج للأشخاص المعرّضين بشكلٍ كبير لخطر الإصابة بالمرض، وهو ما يحتمل أن يتسبّب في زيادة أعداد الأشخاص المعالجين من المرض[11] مقارنة بأعداد المصابين به. وهو ما قد يتسبّب بظاهرة خاطئة تتجلّى بأن يتسبّب العلاج بظهور المرض.
بيانات
تجزئة (تقسيم) البيانات مع معرفة محتويات الأقسام، ومن ثم تحليلها باختبارات مصمّمة للأقسام المختارة بطريقة عشوائيّة.
تعديل تحيليات ما بعد الحدث للبيانات المستخلصة بالاعتماد على أسبابٍ اعتباطيّة أو ذاتيّة بما في ذلك: الالتقاطيّة: اختيار مجموعات فرعيّة محدّدة من البيانات بهدف دعم الاستنتاج (على سبيل المثال ذكر مجموعة من الأمثلة عن تحطّم الطائرة كدليلٍ على أنّ رحلات شركة طيران بعينها غير آمنة، وتجاهل المثال المقابل ذو فرصة الحصول الأكبر الذي يتمثّل بالرّحلات الجوّية العديدة التي تكتمل بأمان. انظر عقلية بحسب الظروف). رفض البيانات السيّئة بناءً على: 1 أسباب اعتباطيّة، بدلاً من الاعتماد على معايير مذكورة مسبقاً ومتّفق عليها عموماً أو 2 التخلّص من القيم المتطرّفة اعتماداً على أسسٍ فشلت في أن تراعي بيانات مهمّة يمكن استخلاصها من ملاحظات شاذّة.
المصادر
- Dictionary of Cancer Terms → selection bias. Retrieved on September 23, 2009.
- Medical Dictionary - 'Sampling Bias' Retrieved on September 23, 2009 نسخة محفوظة 10 مارس 2016 على موقع واي باك مشين.
- TheFreeDictionary → biased sample. Retrieved on 2009-09-23. Site in turn cites: Mosby's Medical Dictionary, 8th edition. نسخة محفوظة 17 يونيو 2019 على موقع واي باك مشين.
- Dictionary of Cancer Terms → Selection Bias. Retrieved on September 23, 2009. نسخة محفوظة 9 يونيو 2009 على موقع واي باك مشين.
- Ards, Sheila; Chung, Chanjin; Myers, Samuel L. (1998). "The effects of sample selection bias on racial differences in child abuse reporting". Child Abuse & Neglect. 22 (2): 103–115. doi:10.1016/S0145-2134(97)00131-2. PMID 9504213.
- Cortes, Corinna; Mohri, Mehryar; Riley, Michael; Rostamizadeh, Afshin (2008). Sample Selection Bias Correction Theory ( كتاب إلكتروني PDF ). Algorithmic Learning Theory. 5254. صفحات 38–53. arXiv:. CiteSeerX . doi:10.1007/978-3-540-87987-9_8. . مؤرشف من الأصل ( كتاب إلكتروني PDF ) في 27 سبتمبر 2018.
- Cortes, Corinna; Mohri, Mehryar (2014). "Domain adaptation and sample bias correction theory and algorithm for regression" ( كتاب إلكتروني PDF ). Theoretical Computer Science. 519: 103–126. CiteSeerX . doi:10.1016/j.tcs.2013.09.027. مؤرشف من الأصل ( كتاب إلكتروني PDF ) في 27 سبتمبر 2018.
- Fadem, Barbara (2009). Behavioral Science. Lippincott Williams & Wilkins. صفحة 262. . مؤرشف من الأصل في 24 مارس 2017.
- Feinstein AR; Horwitz RI (November 1978). "A critique of the statistical evidence associating estrogens with endometrial cancer". Cancer Res. 38 (11 Pt 2): 4001–5. PMID 698947.
- Tamim H; Monfared AA; LeLorier J (March 2007). "Application of lag-time into exposure definitions to control for protopathic bias". Pharmacoepidemiol Drug Saf. 16 (3): 250–8. doi:10.1002/pds.1360. PMID 17245804.
- Matthew R. Weir (2005). Hypertension (Key Diseases) (Acp Key Diseases Series). Philadelphia, Pa: American College of Physicians. صفحة 159. .