المصنف البايزي الساذج (naive Bayes classifier) هي عائلة من المصنفات الاحتمالية البسيطة على أساس تطبيق نظرية بايز مع افتراضات استقلالية (ساذجة) قوية بين الميزات.[1][2] هم من أبسط نماذج شبكة بايز. ولكن يمكن أن يقترن بتقدير كثافة النواة و تحقيق مستويات دقة أعلى.[2] هذه الخوارزمية نموذج مصنف توليدي (generative algorithm).[3][4] تمت دراسة بايز ساذج على نطاق واسع منذ الستينيات. تم إدخاله (على الرغم من أنه ليس تحت هذا الاسم) في مجتمع استرجاع المعلومات في أوائل الستينيات، ولا يزال طريقة شائعة لتصنيف النص.[1]
نظرية
بشكل عام، خوارزمية بايز ساذج هي نموذج احتمال شرطي: افترض أننا نريد تصنيف مثال جديد يسمى ، والذي يحتوي على n متغيرات (المتغيرات المستقلة). وافترض أن لدينا K تصنيفات. يتم احتساب احتمال أن ينتمي هذا المثال إلى تصنيف Ck على النحو التالي:
باستخدام نظرية بايز ، يمكن إعادة كتابة الاحتمال الشرطي على النحو التالي:
لقد افترضنا بالفعل أن المتغيرات مستقلة. لذا، يمكننا إعادة كتابة هذا الاحتمال بضرب n من الاحتمالات.
مراجع
- Hastie, Trevor. (2001). The elements of statistical learning : data mining, inference, and prediction : with 200 full-color illustrations. Tibshirani, Robert., Friedman, J. H. (Jerome H.). New York: Springer. . OCLC 46809224. مؤرشف من الأصل في 15 أبريل 2020.
- Piryonesi S. Madeh; El-Diraby Tamer E. (2020-06-01). "Role of Data Analytics in Infrastructure Asset Management: Overcoming Data Size and Quality Problems". Journal of Transportation Engineering, Part B: Pavements. 146 (2): 04020022. doi:10.1061/JPEODX.0000175. مؤرشف من الأصل في 12 أبريل 2020.
- Ng, A. Y., & Jordan, M. I. (2002). On discriminative vs. generative classifiers: A comparison of logistic regression and naive bayes. In Advances in neural information processing systems (pp. 841-848).
- "Piryonesi, S. M. (2019). The Application of Data Analytics to Asset Management: Deterioration and Climate Change Adaptation in Ontario Roads (Doctoral dissertation)". مؤرشف من الأصل في 02 ديسمبر 2019.