معالج Intelxoen هو أحد معالجات الحاسوب من إنتاج شركة انتل. كان وما زال الهدف من تطوير الأنظمة الحاسوبية هو رفع الأداء بعض التقنيات التي تستخدم لزيادة الأداء التطوير النظام الحاسوبي لذلك تم إيجاد ما يسمى بالبنى المتوازية عمل أكثر من معالج على التوازي سنتحدث عن معالج IntelXoen بشكل بسيط.
لمحة عن معالج intelxoen
معالج IntelXeon5500 Series يستطيع أن يقدم الكفاءة العالية لبنى IT ويمكن أن يزود المشاريع بقدرات عالية.
خصائص هذه التكنولوجيا:
- الأداء العالي الذي يحسن الأداء بشكل أتوماتيكي لملائمة متطلبات التطبيق والعمل
- المرونة الافتراضية التي تقدم أفضل أداء في الصنف وقدرة على الإدارة
مخدمات العمل العالية الحجم القياسية ومحطات العمل التي بنيت بهذا الجيل الجديد من المعالجات التي تحمل الاسم Nehalem تقدم فرصة لتزويد المشاريع بقدرات عالية.
هذا بعضاً مما جاء في موقع Intel عن معالجات Intelxeon550 لوصف قدرات هذا النوع من المعالجات التي حلت محل المعالجات التي استخدمت (FSB(Front Side Bus لربط الذاكرة مع المعالج هذا المعالج يعتمد على نفس البنية الصغرية مثل IntelCorei7 بالإضافة إلى أن معالج xeon يدعم NUMA(Non Unform Memory Acess). وهو من البنى المتوازية MIMD.
على الرغم من أن معالج intelxeon لا يطبق في الأنظمة التفرعية الحالية لكن لمعالجات intelxoen دور أساسي في أنظمة العناقيد أو ما يسمى ب clusters
حيث أن غالبية العقد في Beowulf clusters من هذا النوع لهذا السبب سنناقش هذا النوع من المعالجات.سنركز على xoen,the server xeon version من عائلة intel64 هذا النوع الذي يوجد في العناقيد يوجد عادة في عقد2-sockets وبشكل متزايد في عقد 4-sockets و8-sockets.لهذا النوع من المعالجات أكثر من إصدار سنناقش هنا ما يسمى بNehalem أو x500 series معالج IntelXeon5500 Series يستطيع أن يقدم الكفاءة العالية لبنى IT ويمكن أن يزود المشاريع بقدرات عالية.
Black diagram of an Intel Nehalem processor
حالياً كل رقاقة (chips) لها متحكم ذاكرة خارجي وثلاث قنوات ذاكرة موصولة من ذاكرة DDR3 إلى رقاقة بالإضافة إلى ذلك لوصل chips مع مساري PCI Express قدمت intel ما يسمى QPI(Quick Path Interface) ذات عرض حزمة 25.6GB/S دور الساعة في هذا النوع من المعالجات أصغر من أدوار المعالجات التي ظهرت سابقاً 2.93,2.66,2.33 على التوالي.
أكبر عرض حزمة من الذاكرة إلى المعالج 32GHZ/S(10.833GB/S/channel) على كل حال عادة تيم الحصول على عرض الحزمة(bandwidth) من خلال برامج STREM triad benchmark.
كما هو واضح أن عرض الحزمة الفعلي لا يمكن أن يتجاوز مواصفات التصميم.
المعالج الجديد ظهر في نيسان 2009 وتم استخدامه في جميع أنظمة cluster vender الأساسية
لقد تحسن عرض الحزمة من 16GB/S إلى 32GB/S لكن بسبب memory controller المتكاملة الاختلاف للعديد من التطبيقات يمكن أن تكون أكبر حتى عملياً.
الNehalem EP معالج رباعي القنوات الذي ظهرت إحدى قنواته في الشكل السابق بينما الوصل إلى الذاكرة يظهر في الرابط التالي :
Diagram of the connection of Nehalem processor
لقد تحسن التنبؤ بالقفز لهذا المعالج ويوجد فيه مستويي TLB وكما في بنى القنوات الأولى أربع عمليات يمكن أن تنجز في الدورة الواحدة بالإضافة إلى بعض العمليات الصغرية التي يمكن أن تنجز في أقل معالجة. وبالإضافة إلى ذلك يمكن لهذا النوع من المعالجات أن ينجز عمليتين صغريتين إضافيتين مقارنة بالنوى السابقة كما تشاهد في الشكل 2.17 cores المعالج لها execution trace التي تحوي بشكل جزئي التعليمات التي حللت.
هكذا مرحلة ذهاب التعليمات المرمزة الذي قد يحدث فجوة في قنوات توارد التعليمات المجمع يبعث التعليمات المرمزة إلى محطات الحجز اتلي يمكن أن تصدر بحدود ست عمليات صغرية
في الدور الواحد إلى وحدات التنفيذ يدعى بExcution Engine.حوالي 128 عملية صغرية يمكن أن تكون طور التنفيذ أي وقت. الشكل 2.17 يظهر أن المنفذ ذو الرقم 0 والمنفذ ذو الرقم 5 يقود اثنتين من IntegerALU بالإضافة إلى وحدة IntegerSSE المنافذ 1,5,0 تهتم بعمليات الفاصلة العائمة.وحدتي الحساب والمنطق للأعداد الصحيحة في المنفذين 0,5 بسيطتين لكي يكون قادراً على إدارتهم مرتين في دور الساعة.
بالإضافة إلى ذلك لدينا ALU في المنفذ 1 لعمليات الأعداد الصحيحة المعقدة التي لا يمكن تنفيذها في دور ساعة واحد.
وحدات الفاصلة العائمة تضم بالإضافة إلى ذلك وحدات إضافية التي تنفذ ما يسمى ب SSe4
(streaming SIMD extension4) ذخيرة التعليمات.
التعليمة مجموعة من أكثر من 190 تعليمة التي تعنى بالعمليات الشعاعية مثل الصوت والصورة و التطبيقات الثلاثية الأبعاد, لكن أيضاً من الفائدة للعمليات الشعاعية المنتظمة في الجبر الخطي طول المعامل في هذه الوحدة 128 بت.
مترجم intel لديه القدرة على عنونة SSE4 هذا يعطيه من حيث المبدأ أداء أعلى في الفواصل العائمة.
المنافذ 2,3,4 تخدم وحدة التحميل وتخزين العناوين وتخزين المعطيات على التوالي.
التحسين البارز أن Nehalem تدعم تقنية MultiThreading كثيراً في نموذج IBM'S Simultaneous Threading وتسمى ب Intel HyperThreading. HyperThreading ظهر في وقت سابق في معالجات البنتيوم لكن اختفى في معالجات Intel التالية لأن الربح في الأداء كان منخفض جداً.
الآن مع عرض حزمة أعلى وذواكر خابية أكبر سرع أكثر من 30% في HyperThreading
و يوجد ميزة أخرى ما يسمى بTrubo Mode هذا يعني أن دور الساعة سيرتفع من سرعته 2.93GHZ إلى سرعة مختلفة تماماً بخطوة من 133 ميغاهرتز إلى أكثر من 3 غيغاهرتز طالما الطاقة الحرارية للرقاقة لم يتم تجاوزها.
لذا عندما بعض القنوات cores عاطلة نسبياً يمكن للقنوات الأخرى أن تستفيد من سرعة الساعة الأعلى.
الذواكر الخابية في المستوى الأول لها نفس الحجم كما في المعالجات التي ظهرت سابقاً لكن الذواكر الخابية في المستوى الثاني أصغر بكثير 256 كيلوبايت بدلاً من 6 ميغابايت وهي أسرع بكثير على كل حال وقادرة على تسليم المعطيات المطلوبة في عشر أدوار أو أقل
إضافة إلى ذلك هناك ذاكرة خابية في المستوى الثالث مشتركة تستخدم من قبل الأربع قنوات المكون منها المعالج.
الذاكرة الخابية L3 شاملة هذا يعني أنها تحوي كل البيانات الموجودة في المستوى L1,L2 نتيجة ذلك عندما لا توجد المعطيات المطلوبة في المستوى L3 فهي غير موجودة في مستويات الذاكرة الأخرى لباقي القنوات وبالتالي لا يتم البحث فيهم.
نلاحظ من الشكل 2.18 أن 72GB Memory/Processer على كل حال هذا يمكن أن يعمل على حساب سرعة مساري الذاكرة.
أخيراً هناك خياران على سبيل المثال لأنظمة قاعدة البيانات التي تستفيد من الذاكرة الكبيرة ليس من الضروري أن يكون في السرعة الأعلى.لأغراض HPC الصور فقط مع ذاكرة واحدة.
المراجع
PDF Intel® 64 and IA-32 Architectures optimization Reference Manual