الرئيسيةعريقبحث

التنقيب في البيانات في علم الأرصاد


☰ جدول المحتويات


علم الأرصاد هو دراسة علمية متعددة الاختصاصات لـ الغلاف الجوي. حيث يراقب التغيرات في درجة الحرارة والضغط الجوي والرطوبة واتجاه الرياح. وعادة، ما تُعتبر درجة الحرارة والضغط وقياسات الرياح والرطوبة المتغيرات التي يتم قياسها بواسطة الثرمومتر والبارومتر والمرياح والمرطاب، على التوالي. وهناك العديد من الطرق لجمع البيانات حيث يُعد الرادار والليدار والسواتل بعضًا منها. ويحدث التنبؤ الجوي عن طريق جمع البيانات الكمية حول الوضع الحالي للغلاف الجوي. وأهم ما يكون عن هذا التنبؤ هو أنه يشمل خصائص بُعدية عالية. وللتغلب على هذه المشكلة، من الضروري أولاً تحليل وتبسيط البيانات قبل استكمال التحليلات الأخرى. حيث تتناسب بعض تقنيات التنقيب في البيانات مع هذا السياق.

ما هو التنقيب في البيانات؟

تنقيب في البيانات، هو استخراج المعلومات التنبؤية الكامنة من قواعد البيانات الكبيرة، حيث تُعتبر تقنية جديدة قوية ذات إمكانيات كبيرة لتحليل المعلومات المهمة في مستودعات البيانات. وبناء على ذلك، يكون التنقيب في البيانات أكثر من جمع وتحليل البيانات، حيث يشتمل على التحليل والتنبؤات. ومن ثم يمكن أن تشتمل الأدوات المستخدمة للتحليل على نماذج إحصائية وخوارزميات رياضية وطرق التعلم الآلي. وتشتمل هذه الطرق على الخوارزميات التي تعمل على تحسين أدائها تلقائيًا من خلال التجربة، مثل الشبكات العصبونية أو أشجار القرار[1]

ويمكن تقريبًا أن تنقسم هندسة الشبكات وطريقة الإشارة المستخدمة في تصميم نموذج الجهاز العصبي إلى ثلاثة فئات، حيث يستند كل منها إلى فلسفة مختلفة.

  1. التغذية الأمامية للشبكة العصبونية: تحدد معلومات الإدخال الإشارات الأولية إلى مجموعة من إشارات المخرجات.[2]
  2. شبكة التغذية الاسترجاعية: تحدد معلومات الإدخال حالة النشاط الأولية لنظام التغذية الاسترجاعية، وبعد مرحلة الإحلال، يُمكن تحديد الحالة النهائية المقاربة كنتيجة للإحصاء.[2]
  3. تتنافس الخلايا المجاورة في الشبكة العصبونية في أنشطتها عن طريق التفاعلات الجانبية المتبادلة وتتطور إلى كاشفات محددة للأنماط الإشارية المختلفة. ويسمى التعلم في هذه الفئة، التعلم التنافسي أو التعلم بدون معلم أو ذاتي التنظيم.[3]

الخرائط ذاتية التنظيم

الخرائط ذاتية التنظيم (SOM) هي واحدة من نماذج الشبكة العصبونية الأكثر شيوعًا، والمناسبة بشكل خاص لتصور البيانات البُعدية العالية والتجميع والنمذجة. وتستخدم التعلم بدون معلم لتكوين مجموعة من موجهات النموذج البدائي الذي يمثل البيانات. ولذا قُدمت لعلوم الأرصاد الجوية والمناخية في أواخر التسعينيات من القرن العشرين كتجميع وطريقة لتمييز الأنماط.[4] وفي هذه الأيام، طُبقت الخرائط ذاتية التنظيم في العديد من مشاكل الأرصاد الجوية، مثل طرق تصنيف المناخ و تصنيف السحب، [5] وتصنيف بيانات درجة الحرارة، [6] والطقس الشديد وتحليل أنماط هطول الأمطار. وجدير بالذكر أن الخرائط ذاتية التنظيم تضع الخطط للبيانات الداخلة للفضاء البُعدي (ثنائية الأبعاد عادة) المنخفض.[3] حيث تحافظ على علاقات تلاحم البيانات الداخلة، ومن ثم تعتبر الخرائط ذاتية التنظيم هي أسلوب المحافظة على الطوبولوجيا. وهناك أنواع عديدة من الطبولوجيا المستخدمة في الخرائط ذاتية التنظيم: وخطوط الشبكات والسداسي الأضلاع والعشوائيات هي بعض منها.[6] وترتب الخلايا العصبية الناتجة وفقًا للطوبولوجيا المحددة. ومن ثم تُحسب المسافات بين الخلايا العصبية باستخدام دالة المسافة.[6] وهناك العديد من دالات المسافة التي يمكن استخدامها مثل المسافة الإقليدية ومسافة المربع ومسافة الرابط وهندسة سيارة الأجرة.

ووفقًا للمدخلات الأولى للأنظمة الموجهة الداخلة، يختار النظام الخلايا العصبية الناتجة (الخلايا العصبية الفائزة) التي تتطابق بشكل وثيق مع الأنظمة الموجهة الداخلة المحددة. ثم تحدد الالتحام بالخلايا العصبية المثارة حول الفائز؛ وأخيرًا، تحدث جميع الخلايا العصبية المثارة. لذا، ينبغي اختيار دالة الالتحام التي تسمح بحساب العُقد "الأقرب" للفائز.[6] بعض دالات الالتحام هي دالة غاوس ودالة بوبل ودالة أي بي.[6] ويعاد تشكيل الوزن الناتج للكمية الموجهة لعُقد الخرائط ذاتية التنظيم لتكوين أنماط البيانات المميزة. ويؤدي هذا الإجراء التعليمي إلى الترتيب الطوبولوجي لوضع خرائط للبيانات المدخلة. وتوضع خطط للأنماط المماثلة على المناطق المجاورة في الخريطة، في حين تقع الأنماط المتباينة بعيدة عن بعضها البعض.

المراجع

  1. Seifert, W. (2004). "Data Mining:An Overview". CRS.
  2. Kohonen, T. (2002 ). "The Self-Organizing Map". IEEE. صفحات 1464–1480.
  3. Liu, Y., & Weisberg, R. H. "A Review of Self-Organizing Map Applications in Meteorology and Oceanography". Self Organizing Maps - Applications and Novel Algorithm Design . صفحة 2011.
  4. COFIÑO, A., GUTIÉRREZ, J., JAKUBIAK, B., & MELONEK, M. (2003). "IMPLEMENTATION OF DATA MINING TECHNIQUES FOR METEOROLOGICAL APPLICATIONS". World Scientific. صفحات 215–240.
  5. Hong Y., HSU, K., SOROOSHIAN, S., & GAO, X. . (2004). "Precipitation Estimation from Remotely Sensed Imagery Using an Artificial Neural". JOURNAL OF APPLIED METEOROLOGY. 43. صفحات 1834–1852.
  6. Lahoz, D., & Miguel, M. S. (2004.). "CLASSIFICATION TEMP DATA WITH SELF-ORGANIZING MAPS". Monografías del Seminario Matemático García de Galdeano. صفحات 389–397.

وصلات خارجية

موسوعات ذات صلة :