في الحوسبة، المعالجة التحليلية المتصلة (OLAP: Online Analytical Processing)، هو نهج للإجابة التحليلية متعددة الأبعاد بسرعة (multi-dimensional analytical: MDA) على الاستعلامات[1] . OLAP هو جزء من فئة أوسع من ذكاء الأعمال، والذي يشمل أيضا قواعد بيانات علائقية، كتابة التقارير واستخراج البيانات [2] . وتشمل التطبيقات العملية من OLAP تقارير الأعمال للمبيعات والتسويق والتقارير الإدارية، وإدارة عمليات الأعمال، [3] وضع الموازنات والتنبؤ، وإعداد البيانات المالية ومجالات مماثلة، مع التطبيقات الجديدة القادمة، مثل الزراعة. مصطلح OLAP تم إنشائه بمثابة تعديل طفيف على مصطلح قاعدة بيانات التقليدي المعالجة العملياتية المتصلة [4] OLTP.
أدوات OLAP تمكن المستخدمين من تحليل البيانات بشكل تفاعلي متعدد الأبعاد من وجهات نظر متعددة. يتكون OLAP من ثلاث عمليات تحليلية أساسية: التوحيد (لفة متابعة)، والحفر إلى أسفل، وتشريح وتقطيع [5] توطيد ينطوي على تجميع البيانات التي يمكن المتراكم وحسابها في أبعاد واحد أو أكثر. على سبيل المثال، يتم إرجاع جميع مكاتب مبيعات تصل إلى تقسيم قسم المبيعات أو المبيعات لتوقع اتجاهات المبيعات. على النقيض من ذلك، فإن الحفر إلى أسفل هو الاسلوب الذي يتيح للمستخدمين التنقل من خلال التفاصيل. على سبيل المثال، يمكن للمستخدمين عرض مبيعات المنتجات الفردية التي تشكل مبيعات المنطقة. تشريح وتقطيع هي ميزة حيث يمكن للمستخدمين إخراج (تشريح) مجموعة محددة من البيانات من المكعب OLAP وعرض (تقطيع) شرائح من وجهات نظر مختلفة.
قواعد البيانات التي تكون منها OLAP تستخدم نموذج بيانات متعدد الأبعاد، مما يتيح المجال لاستعلامات تحليلية مخصصة ومعقدة مع وقت التنفيذ السريع. .[6] وهي تستعير جوانب من قواعد البيانات الملاحية، قواعد البيانات الهرمية وقواعد البيانات العلائقية.
نظرة عامة على أنظمة المعالجة التحليلية المتصلة OLAP
يعتير مكعب OLAP جزء من صميم المعالجة التحليلية المتصلة (ويسمى أيضا "مكعب متعدد الأبعاد" أو المكعب الزائدي). وهو يتألف من الحقائق الرقمية (المقاييس measures) التي يتم تصنيفها من قبل أبعاد مستودع البيانات Datawarehouse. يتم وضع المقاييس على تقاطعات المكعب، والتي تمتد من الأبعاد كفضاء عامودي. الواجهة المعتادة للتحكم بمكعب OLAP هي مصفوفة مثل الجدول المحوري Pivot Table في برنامج جدول بيانات، الذي ينفذ عمليات الإسقاط على طول الأبعاد، مثل التجميع أو حساب المتوسط.
وعادة ما يتم إنشاء البيانات الوصفية للمكب من المخطط النجمي Star Schema أو مخطط ندفة الثلج Snowflake Schema من الجداول في قواعد البيانات العلائقية . وتستمد المقاييس من السجلات بجداول الحقيقة مستمدة أبعاد من جدول البعد.
كل قياس يمكن اعتباره وجود مجموعة من العناوين، أو البيانات الوصفية المرتبطة بها. البعد هو ما يصف هذه العناوين؛ أنه يوفر المعلومات حول القياس.
مثال بسيط قد يكون عبارة عن مكعب يحتوي مبيعات متجر كقياس وتاريخ/وقت كبعد. حيث كل عملية بيع لها تاريخ وتوقيت
+-------------+----------+ | sale_amount | time_id | +-------------+----------+ Time Dimension | 2008.10| 1234 |---+ +---------+-------------------+ +-------------+----------+ | | time_id | timestamp | | +---------+-------------------+ +---->| 1234 | 20080902 12:35:43 | +---------+-------------------+
قواعد بيانات متعددة الأبعاد
تعرف البنية متعددة الأبعاد ب "الاختلاف من النموذج العلائقي الذي يستخدم بنى متعددة الأبعاد لتنظيم البيانات والتعبير عن العلاقات بين البيانات". (المرجع:اوبراين وماراكاس، 2009، ص 177). يتم تقسيم الهيكل إلى مكعبات ومكعبات قادرة على تخزين البيانات والوصول إلى داخل حدود كل مكعب. "كل خلية داخل بنية متعددة الأبعاد تحتوي على البيانات المجمعة المتعلقة بالعناصر طول كل واحد من أبعادها". (المرجع:اوبراين وماراكاس، 2009، ص 178) وحتى عندما يتم التحكم لايزال الوصول إليها سهلاً. وتواصل تشكيل تنسيق قاعدة بيانات موجزة، والبيانات تبقى مترابطة. البنى متعددة الأبعاد لها شعبية كبيرة في قواعد البيانات التحليلية التي تستخدم تطبيقات المعالجة التحليلية المتصلة (OLAP). (المرجع:اوبراين وماراكاس، 2009، ص 177). قواعد البيانات التحليلية تستخدم قواعد البيانات هذه بسبب قدرتها على تقديم إجابات على الاستعلامات التجارية المعقدة بسرعة. يمكن الاطلاع على البيانات من زوايا مختلفة، مما يعطي منظور أوسع من مشكلة على عكس النماذج الأخرى.(المرجع: وليامز، C.، غارزا، VR، تاكر، S، ماركوس، 1994).
التجميع Aggregations
من المعتقد أن الاستعلامات المعقدة باستخدام مكعبات OLAP يمكن أن تنتج جوابا في حوالي 0.1٪ من الوقت اللازم لنفس الاستعلام على المعالجة العملياتية المتصلة البيانات العلائقية. الآلية الأكثر أهمية في OLAP الذي يسمح لها لتحقيق هذا الأداء هو استخدام التجميع. يتم بناء التجميعات من جداول الحقيقة عن طريق تغيير التحبب على أبعاد محددة وتجميع البيانات احتياطيا على طول هذه الأبعاد. يتم تحديد عدد من تجميعات محتملة من قبل كل تركيبة ممكنة من الحبيبات البعدية.
مزيج من كل التجميعات الممكنة والبيانات الأساسية يحتوي على إجابات لكل الاستعلام الذي يمكن إجابته من البيانات. لأنه عادة ما يكون هناك العديد من التجميعات التي يمكن أن تحسب، في كثير من الأحيان عدد محدد سلفا تتم حسابته بشكل كامل. يتم حل الباقي على الطلب. مشكلة تحديد التجميعات التي يجب أن تحسب سلفاً تعرف بمشكلة اختيار المشهد view selection. اختيار المشهد يمكن يمكن تقييده بالحجم الإجمالي لمجموعة مختارة من التجميعات، الوقت لتحديثها من التغييرات في البيانات الأساسية، أو كليهما. والهدف من اختيار المشهد هو عادة لتقليل متوسط الوقت للرد على استعلامات OLAP، على الرغم من أن بعض الدراسات أيضا تقلل الوقت الازم للتحديث. تم استكشاف الكثير من النهج لهذه المشكلة، بما في ذلك خوارزمية الجشع ق، بحث العشوائية، الخوارزمية الجينية ق و A * خوارزمية البحث.
أنواع المعالجة التحليلية المتصلة
لقد تم تصنيف أنظمة OLAP تقليديا باستخدام التصنيف التالي [Pendse2006] كما يلي:
متعددة الأبعاد MOLAP
MOLAP هو "المعالجة التحليلية المتصلة متعدد الأبعاد. وهو الشكل "الكلاسيكي" من OLAP والتي يشار إليه أحيانا فقط OLAP. تخزن أنظمة MOLAP البيانات في مصفوفات مثلى متعددة الأبعاد، وليس في قاعدة بيانات علائقية. وبالتالي فإنها تتطلب حساب ومعالجة مسبقة قبل تخزين المعلومات في المكعب - العملية المعروفة باسم المعالجة. أدوات MOLAP تستخدم عموما مجموعة من البيانات المحسوبة مسبقا المشار إليها بمكعب البيانات. مكعب البيانات يحتوي على جميع الإجابات الممكنة لمجموعة معينة من الأسئلة. أدوات MOLAP لها وقت استجابة سريع جدا وقدرة على كتابة البيانات بسرعة في مجموعة البيانات.
مزايا MOLAP
- أداء الاستعلام السريع يرجع إلى التخزين الأمثل والفهرسة متعددة الأبعاد والتخزين المؤقت.
- أصغر حجم على القرص من البيانات مقارنة بالبيانات المخزنة في قواعد البيانات العلائقية بسبب تقنيات الضغط.
- الحساب الآلي للمجاميع عالية المستوى.
- متوافقة جدا مع مجموعات البيانات منخفضة الأبعاد.
- نماذج المصفوفات توفر الفهرسة الطبيعية.
- استخراج البيانات الفعال يتخقق من خلال مرحلة ما قبل هيكلة البيانات المجمعة.
مساوئ MOLAP
- في بعض الحلول، خطوة تجهيز (تحميل البيانات) يمكن أن تكون طويلة جدا، وخصوصا مع كميات كبيرة من البيانات. وعادة ما يتم علاج ذلك عن طريق القيام بمعالجة تدريجية، أي معالجة البيانات فقط التي تم تغييرها (عادة البيانات الجديدة) بدلا من إعادة معالجة مجموعة البيانات بأكملها.
- بعض المنهجيات MOLAP تتسبب في تكرار البيانات.
أنواع
وقد تم تصنيف أنظمة OLAP تقليديا باستخدام التصنيف التالي Pendse2006
متعددة الأبعاد
- مقالة مفصلة: MOLAP
MOLAP هو "المعالجة التحليلية عبر الإنترنت متعدد الأبعاد". "MOLAP" هو الشكل "الكلاسيكي" من OLAP والتي يشار إليها أحيانا فقط OLAP. مخازن MOLAP هذه البيانات في تخزين مجموعة متعددة الأبعاد الأمثل، وليس في قاعدة بيانات علائقية. وبالتالي فإنه يتطلب قبل حساب وتخزين المعلومات في المكعب - العملية المعروفة باسم المعالجة. أدوات MOLAP الاستفادة عموما مجموعة من البيانات المحسوبة مسبقا المشار إليها كما مكعب البيانات. المكعب البيانات يحتوي على جميع الإجابات الممكنة لمجموعة معينة من الأسئلة. أدوات MOLAP لها وقت استجابة سريع جدا والقدرة على الكتابة بسرعة العودة البيانات إلى مجموعة البيانات.
مزايا MOLAP
- أداء الاستعلام السريع يرجع إلى التخزين الأمثل والفهرسة متعددة الأبعاد والتخزين المؤقت.
- أصغر حجم على القرص من البيانات مقارنة البيانات المخزنة في قواعد البيانات العلائقية بسبب تقنيات ضغط.
- الحساب الآلي المجاميع مستوى أعلى من البيانات.
- ومن الميثاق جدا لمجموعات البيانات البعد منخفضة.
- نماذج صفيف توفر الفهرسة الطبيعية.
- استخراج البيانات الفعال تحققت من خلال مرحلة ما قبل هيكلة البيانات المجمعة.
مساوئ MOLAP
- وفي بعض الحلول MOLAP الخطوة تجهيز (تحميل البيانات) يمكن أن تكون طويلة جدا، وخصوصا على كميات كبيرة من البيانات. وعادة ما يتم علاج ذلك عن طريق القيام معالجة فقط تدريجي، أي معالجة البيانات فقط التي تم تغييرها (عادة البيانات الجديدة) بدلا من إعادة معالجة مجموعة البيانات بأكملها.
- بعض المنهجيات MOLAP إدخال تكرار البيانات.
العلائقية
ROLAP يعمل مباشرة مع قواعد البيانات العلائقية. يتم تخزين البيانات الأساسية وجداول الأبعاد كما الجداول العلائقية، ويتم إنشاء جداول جديدة لعقد المعلومات المجمعة. ذلك يعتمد على تصميم مخطط المستخدم. وتعتمد هذه المنهجية على التلاعب في البيانات المخزنة في قاعدة بيانات علائقية لإعطاء مظهر يشبه تشريح OLAP التقليدي ووظائف التكعيب. في جوهرها، كل عمل من تشريح وتقطيع يعادل إضافة شربط "حيث WHERE" في بيان SQL. أدوات ROLAP لا تستخدم مكعبات البيانات المحسوبة مسبقا، ولكن بدلا من ذلك تطرح الاستعلامات في قاعدة بيانات علائقية قياسية من أجل جلب البيانات المطلوبة للإجابة على السؤال. أدوات ROLAP تتميز بالقدرة على طرح أي سؤال لأن المنهجية لا تتحدد بمحتويات المكعب. ل ROLAP أيضا القدرة على الحفر أسفل إلى أدنى مستوى من التفاصيل في قاعدة البيانات.
الهجينة
ليس هناك اتفاق واضح في صناعة ما يشكل "OLAP الهجين"، إلا أن قاعدة بيانات تقسم البيانات بين علائقية وتخزين متخصص. على سبيل المثال، بالنسبة لبعض المزودين، قاعدة بيانات HOLAP تستخدام الجداول ذات العلاقة لتخزين كميات أكبر من البيانات التفصيلية، واستخدام التخزين متخصص لبعض نت جوانب كميات صغيرة من البيانات التجميعية بشكل أكثر أو أقل تفصيلا. يتناول HOLAP أوجه القصور في MOLAP وROLAP من خلال الجمع بين قدرات كلا النهجين. يمكن لأدوات HOLAP الاستفادة من كل من مكعبات محسوبة مسبقا ومصادر البيانات العلائقية.
مقارنة
كل نوع له فوائد معينة، على الرغم من أن هناك خلاف حول خصوصيات المنافع بين مقدمي الخدمات.
- بعض التطبيقات MOLAP عرضة للانفجار في قاعدة بيانات، وهي ظاهرة تسبب كميات هائلة من مساحة التخزين لاستخدامها من قبل قواعد البيانات MOLAP عندما يتم استيفاء بعض الشروط المشتركة: ارتفاع عدد الأبعاد، والنتائج المحسوبة مسبقا وبيانات متعددة الأبعاد متفرق.
- MOLAP يقدم عموما أداء أفضل نظرا لفهرسة وتخزين البيانات. أيضا يحتاج MOLAP أقل مساحة التخزين مقارنة ROLAP لأن التخزين المتخصص يتضمن عادة ضغط البيانات.
- ROLAP عموما أكثر استيعاباً للبيانات. ولكن إذا كان حجم ما قبل المعالجة كبير فمن الصعب تنفيذه بكفاءة لذلك كثيرا ما تخطي. وبالتالي فإن أداء الاستعلام في ROLAP يعاني بشكل كبير.
- بما أن ROLAP تعتمد أكثر على قاعدة البيانات لإجراء عمليات حسابية، فإنه يعاني المزيد من القيود في وظائف متخصصة يمكن استخدامها.
- HOLAP يشمل مجموعة من الحلول التي تحاول خلط أفضل من ROLAP وMOLAP. ويمكن أن ينجز مرحلة ما الحساب المسبق عموما بسرعة.
أنواع أخرى
المرادفات التالية هي أيضا تستخدم في بعض الأحيان، على الرغم من أنها ليست على نطاق واسع مثل تلك المذكورة أعلاه:
- WOLAP - معتمد على الإنترنت OLAP
- DOLAP - كمبيوتر سطح المكتب OLAP
- RTOLAP - الوقت الحقيقي OLAP
واجهات برمجة التطبيقات ولغات الاستعلام
على عكس قواعد البيانات العلائقية التي تستخدم SQL كلغة استعلام رئيسية، وعلى نطاق واسع واجهة برمجة التطبيقات API مثل ODBC و JDBC و OLEDB، لم تكن هناك واجهة موحدة ل OLAP لفترة طويلة. كان أول API معيار حقيقي OLE DB ل OLAP من قبل مايكروسوفت والتي ظهرت في عام 1997 وقدمت لغة استعلام ذات تعبيرات متعددة الأبعاد MDX. لاحقاً، قام عدة مزودين OLAP - كلا من مزودي الخادم والعميل - بتبني اللغة. في عام 2001 قام كل من Microsoft وشركة حلول هايبريون بالإعلان عن مواصفات XML، والتي أيدها معظم مزودي OLAP. وهذه المواصفات تتضمن أيضاً استخدام MDX كلغة استعلام، وبذا أصبح MDX أمراً واقعاً.
المنتجات
التاريخ
يعتبر Express المنتج الأول الذي يمكنه تنفيذ استعلامات OLAP والذي صدر في عام 1970 (حصلت عليه شركة أوراكل) في عام 1995 من مصادر المعلومات). ومع ذلك، لم يظهر مصطلح OLAP حتى العام 1993 عندما صيغ من قبل إدجار كود، الذي وصف بأنه "والد قواعد البيانات العلائقية". وفي عام 2007 حصلت أوراكل على الحقوق الحصرية للمنتج، كنوع من انقلاب التسويق. وكانت الشركة قد أطلقت المنتج OLAP الخاص بها Essbase قبل عام. ونتيجة لذلك كانت "اثني عشر قانوناً للمعالجة التحليلية المتصلة"
المراجع
- Codd E.F., Codd S.B., and Salley C.T. (1993). "Providing OLAP (On-line Analytical Processing) to User-Analysts: An IT Mandate" ( كتاب إلكتروني PDF ). Codd & Date, Inc05 مارس 2008.
- Deepak Pareek (2007). Business Intelligence for Telecommunications. CRC Press. صفحات 294 pp. 18 مارس 2008.
- Apostolos Benisis (2010). Business Process Management:A Data Cube To Analyze Business Process Simulation Data For Decision Making. VDM Verlag Dr. Müller e.K. صفحات 204 pp. .
- "OLAP Council White Paper" ( كتاب إلكتروني PDF ). OLAP Council. 1997. مؤرشف من الأصل ( كتاب إلكتروني PDF ) في 23 يونيو 201618 مارس 2008.
- O'Brien & Marakas, 2011, p. 402-403
- Hari Mailvaganam (2007). "Introduction to OLAP - Slice, Dice and Drill!". Data Warehousing Review. مؤرشف من الأصل في 28 سبتمبر 201818 مارس 2008.
1. Codd E.F., Codd S.B., and Salley C.T. (1993). "Providing OLAP (On-line Analytical Processing) to User-Analysts: An IT Mandate". Codd & Date, Inc. Retrieved 2008-03-05.
2. Deepak Pareek (2007). Business Intelligence for Telecommunications. CRC Press. pp. 294 pp. . Retrieved 2008-03-18.
3. Apostolos Benisis (2010). Business Process Management:A Data Cube To Analyze Business Process Simulation Data For Decision Making. VDM Verlag Dr. Müller e.K. pp. 204 pp. .
4. Abdullah, Ahsan (2009). "Analysis of mealybug incidence on the cotton crop using ADSS-OLAP (Online Analytical Processing) tool , Volume 69, Issue 1". Computers and Electronics in Agriculture 69 (1): 59–72. doi:10.1016/j.compag.2009.07.003.
5. "OLAP Council White Paper" (PDF). OLAP Council. 1997. Retrieved 2008-03-18.
قواعد بيانات التي تدعم OLAP تستخدم نموذج بيانات متعدد الأبعاد، مما يسمح بإنشاء استعلامات غرضية تحليلية ومعقدة مع وقت التنفيذ قصير. وهي تستعير ميزات من قواعد البيانات الملاحية وقواعد البيانات الهرمية وقواعد البيانات العلائقية.
قواعد بيانات التي تدعم OLAP تستخدم نموذج بيانات متعدد الأبعاد، مما يسمح بإنشاء استعلامات غرضية تحليلية ومعقدة مع وقت التنفيذ قصير. [7] وهي تستعير ميزات من قواعد البيانات الملاحية وقواعد البيانات الهرمية وقواعد البيانات العلائقية.