تندرج متجهات آلات دعم التمييز (أو شبكات دعم التمييز) تحت خوارزمات تعلم الآلة المراقبة(المرمزة) لتحليل البيانات من أجل تصنيفها تصنيفا احصائيا وعمل تحليل الإنحدار اللازم لها. يكون المدخل للعملية هي جزء من البيانات من أجل مران الخوارزم وتكون مرمزة بتصنيفها لإحدى الفصيلتين؛ منتمية للنوعية س أو لا منتمية لها.عندما ترسم البيانات على محاور الخصائص، يقوم الخوارزم بإيجاد إطار خطى للفصل بين خصائص كلٍ من النوعيتين بحيث أن تكون الهوة بينهما متسعة قدر ما يمكن. ثم تتم عملية التعلم نفسها عقب المران حيث يتم تصنيف جزء آخر من البيانات تبعا للإطار الذي وجد في عملية المران. إلى جانب قدرة خوارزم الدعم الآلى على إيجاد الإطار الخطى، تتمكن أيضا من إيجاد أُطر غير خطية بتطبيق خدعة المصفوفة
يعد من أشهر طرق التصنيف الأتوماتيكي تعلم آلي، تعتمد على إيجاد منحني أو مستوي فائق يفصل العينات المدخلة عن بعضها البعض، ويتميز بانحصاره في تصنيف المسائل ذات الفئات الثنائية. 1 للعينات الإيجابية أو -1 للعينات السلبية، على سبيل المثال: لتصنيف عينات بيانات مرضى تخص مرض الإيدز، إذا كان الخرج 1 يعني أن الشخص مصاب بمرض الإيدز، وفي حال كان الخرج -1 أي أن الشخص غير مصاب مرض الإيدز [1][2].
التعريف
تقوم هذه الخوارزمية بحساب سطح أو مجموعة أسطح في بعد آخر يختلف طوله عن طول متجه الخصائص. تحدد دقة الخوارزم بقدرته على الفصل بين النوعيتين بحيث تكون أقرب عينة من كلى النوعيتين أبعد ما يكون عن بعضهما البعض وهو ما يسمى بالحافة، وبصفة عامة كلما زادت الحافة أو هامش الفصل، كلما قل الخطأ في حالة التعميم لجزء البيانات الغير خاص بمرحلة المران. بالرغم مما تبدو عليه المشكلة من سهولة، إلا أنه في أغلب الأحيان لا يمكن الفصل بين النوعيتين خطياً، وحينها نلجأ لتحويل محاور متجهات الخصائص لبعد أعلى بحيث يتم الفصل بينهم بسطح. ويراعى في هذا المنظور العبء الحسابى فيتم حساب الضرب القياسى للمتجهات بواسطة دالة المصفوفة، حيث يكون السطح الفاصل معرف بمجموعة من النقاط نتاج ضربهم القياسى مع متجه في الإحداثيات الجديدة (ذات البعد الأعلى) تكون ثابتة.
التاريخ
في عام 1963، اخترع العالمان فلاديمير فابنك وأليكسى شيرفونينكيز خوارزم متجه آلات دعم التمييز. أما الخوارزم المعتمد المستخدم حاليا (الهامش المرن) فقد طرحه كورينا كورتز وفابنك على 1993 ونُشر عام 1995.
التحفيز
إن عملية تصنيف البيانات تعد من أكثر عمليات تعلم الآلة شيوعاً. بوجود نقاط البيانات التي تنتمى لنوع من اثنين، يكون الهدف هو تصنيف نقطة جديدة وتحديد لأىٍ من النوعيتين تنتمى. ينظر لنقطة البيان على أنها متجه له عدد ج من الخصائص، وإذا تم الفصل بسطح بُعده ينقص عن ج بواحد يكون التصنيف خطياَ، ويكون غير خطيا ما عدا ذلك. وفي حالة توافر أكثر من فاصل خطى، يتم اختيار الفاصل الذي يضمن هامش أوسع بين أقرب نقطتين من نوعيتين مختلفتين لبعضهم وهو ما يسمى بالمستوى ذو الهامش الأكبر.
طریقة عمل متجهات آلات دعم التمييز الخطية
تكون المعطيات مجموعة من النقاط س عددها ن ويكون متجه خصائصها طوله ج والمتجه ص بطول ن
و كل قيمة فيه تكون إما واحد (منتمية للنوعية المعنية) أو سالب واحد (لا منتمية لها).
كل متجه س ك يكون طوله ص حيث تتراوح قيمة ك بين 1 ون.
يكمن هدف خوارزم في إيجاد المستوى الذي يفصل بين الفصيلتين (المرمزة 1 وعكسها وتكون مرمزة 1-) مع وجود أكبر وأوسع هامش بين الفصيلتين.
العينات من البيانات التي تقع على هذا الهامش تسمى بمتجهات الدعم التي تحقق المعادلة
س . ف – ب =0
و تمثل علامة النقطة (.) الضرب القياسى للمتجهات، ويمثل ب/‖ف‖ مقدر إزاحة المستوى الفاصل عن نقطة الأصل باتجاه المتجه ف العمودى على هذا المستوى. أما مقدار الهامش فيكون 2/‖ف‖ ويهدف الخوارزم لتقليل المتجه ف بحيث تزيد قيمة هامش (حافة)الفصل.
تخضع العينات الإيجابية (المنتمية للنوعية) للمعادلة س . ف – ب ≥ 1، أما العينات السلبية فتخضع للمعادلة س . ف – ب ≤ 1-.
و بإعادة تنسيق المعادلات نصل إلى مشكلة الأمثلة
و تصبح إيجاد أقل‖ف‖^2/2 خاضعة لشرط
ص ك (س ك . ف – ب) ≥ 1 لكل قيم ك ما بين 1 ون[3].
طریقة عمل متجهات آلات دعم التمييز اللاخطية
في عام 1992 اقترح برنارد بوسر، ايزابيل جيون، وفلاديمير فابنك طريقة لخلق خوارزم التصنيف غير الخطى بتطبيق خدعة المصفوفة (المُقتَر من قِبَل إيزارمان وآخرون). الخوارزم النهائى يكون شبيه بالخطى مع استبدال كل عملية ضرب قياسى بمصفوفة لا خطية، وبذلك يقوم الخوارزم بإيجاد المستوى ذو الهامش الأقصى في إحداثيات الخصائص بعد تحويلها.
و من أشهر تلك المصفوفات:
- متعددة الحدود المتجانسة : ع (س ك، س ل) = (س ك . س ل )^ز
- متعددة الحدود الغير متجانسة: ع (س ك، س ل) = (س ك . س ل +1 )^ز
- دالة جاوس المعتمدة قيمتها على البعد من نقطة الأصل: ع (س ك، س ل) =ه(-γ || س ك- س ل ||^2) ، حيث تكون γ > 0
حيث ع هي دالة المصفوفة
متجهات آلات دعم التمييز الخطية ذات الهامش المرن
في عام 1995، اقترح كورينا كورتز وفلاديمير فابنك خوارزم معدِل لفكرة الهامش الأقصى مع السماحية بوجود عينات يتم ترميزها برمز خاطئ. إذا تعذر وجود مستوى يفصل بين العينات الموجبة والسالبة، تقوم فكرة الهامش المرن على إيجاد مستوى يفصل بين نوعى العينتين بأقل خطأ ممكن بحيث تتواجد (تُرمز) أقل عدد من العينات برمز خاطئ.
و تصبح مشكلة الأمثلة هي إيجاد
أقل ‖ف‖^2/2 + دك∑ * ط لكل قيم ك ما بين 1 ون
و تكون خاضعة ً لشرط ص ك (س ك . ف – ب) ≥ 1- دك لكل قيم ك ما بين 1 ون، حيث تحدد المتغيرات دك الغير سالبة درجة خطأ التمييز للعينة س ك.[4]
مقالات ذات صلة
مراجع
- [1]H. Byun and S.-W. Lee, "Applications of support vector machines for pattern recognition: A survey," in Pattern recognition with support vector machines, ed: Springer, 2002, pp. 213-236.
- [1]C. Cortes and V. Vapnik, "Support-vector networks," Machine learning, vol. 20, pp. 273-297, 1995.
- Gino J. Lim and Eva K. Lee (2008). Optimization in Medicine and Biology. New York: Auerbach Publications.
- Richard O. Duda, Peter E. Hart, and David G. Stork (2000). Pattern Classification (2nd ed.).
وصلات خارج ويكي
An Idiot’s guide to Support vector machines SVMs
من أشهر المكتبات التطبيقة لشعاع الدعم الآلي، تضم تطبيقات في العديد من لغات البرمجة libsvm