التحقق من الصحة المتقاطع هي تقنية لتقييم مدى أداء نموذج معين لعينة من البيانات بالنسبة للبيانات المستقبلية، وذلك عن طريق تقسيم البيانات لمجموعتين: مجموعة التدريب وهي التي يتم عليها التطبيق، ومجموعة الاختبار وهي التي يتم حساب نسبة الخطأ الناتج عليها.[1][2][3] تستخدم هذه التقنية عادة في الإحصاء لعمل ارتداد لمجوعه من البيانات، وأيضًا في عملية اختيار أفضل نموذج لحل مشكله معينة، كما وتستخدم في التصنيف، وفي اختيار السمات.
مراجع
- "Newbie question: Confused about train, validation and test data!". مؤرشف من الأصل في 14 مارس 201514 نوفمبر 2013.
- Picard, Richard; Cook, Dennis (1984). "Cross-Validation of Regression Models". Journal of the American Statistical Association. 79 (387): 575–583. doi:10.2307/2288403. JSTOR 2288403.
- Devijver, Pierre A.; Kittler, Josef (1982). Pattern Recognition: A Statistical Approach. London, GB: Prentice-Hall.