الرئيسيةعريقبحث

تكرار الحروف العربية


☰ جدول المحتويات


تكرار الحروف العربية غالبًا ما تتم دراسة تكرار الحروف في النص لاستخدامها في تحليل الشفرات والتكرار بشكل خاص.

لا توجد لغة لها توزيع دقيق لتردد الحروف، حيث يكتب جميع الكتاب بشكل مختلف قليلاً. كقاعدة عامة، سيكون للنصوص بلغات مختلفة باستخدام النص العربي (مثل العربية والتركية العثمانية والفارسية والأردية) ترددات حروف مختلفة، وبشكل أكثر وضوحًا في حالة الحروف التي تستخدم فقط في بعض اللغات (مثل الحروف الفارسية پ و چ ، گ، غير مستخدمة للكتابة باللغة العربية).

تم ابتكار طرق ترميز الأحرف الأكثر تكرارًا مع أقصر الرموز بواسطة رموز التلغراف، وتستخدم في تقنيات ضغط البيانات الحديثة مثل تشفير هوفمان.

ما الذي يحسب في الكتابة العربية المدخلة؟

الجدول (1): الحروف العربية التي يمكن إنتاجها باستخدام لوحة المفاتيح.
الجدول 1: الأبجدية العربية. الحروف من 1 إلى 28 هي الحروف الأساسية. الحروف 29 إلى 36 هي الحروف المعدلة.
الجدول 2: الأبجدية العربية ، مع الحروف المعدلة مقطوعة على أشكالها الأولية.
توزيع تردد الحروف للحروف المحسوبة: يتم تصنيف بيانات المدرج التكراري على قيمة يونيكود
توزيع تردد الحروف للحروف المحسوبة: يتم تصنيف بيانات المدرج التكراري على التردد

تتكون الأبجدية العربية من 28 حرفًا أساسيًا، وهذه هي الأحرف من 1 إلى 28 الجدول رقم (1)، وتستخدم الأحرف الثمانية المعدلة المدرجة في المواضع من 29 إلى 36 في نفس الجدول. إذا تم دمج هذه الأشكال الثمانية المعدلة في القائمة الأولية بناءً على الشكل أو التشابه الصوتي، فستظهر النتيجة كما هو موضح في الجدول 2. للحصول على تحليل دقيق للتردد، يحصل كل من الـ 36 حرفًا من الجدول (1) على تواتر حسابه بشكل مستقل.

يعتبر ترتيب الحروف الأبجدية الموضحة في الجداول أكثر منطقية؛ مما يستخدمه معيار يونيكود.

الشكل 1: الأحرف العربية التي يمكن إنتاجها باستخدام لوحة مفاتيح الحروف العربية.

الجدول 1: الأبجدية العربية. الحروف من 1 إلى 28 هي الحروف الأساسية. الحروف 29 إلى 36 هي الحروف المعدلة.

الجدول 2: الأبجدية العربية ، مع الحروف المعدلة مقطوعة على أشكالها الأولية.

توزيع تردد الحروف للحروف المحسوبة: يتم تصنيف بيانات المدرج التكراري على قيمة يونيكود.

توزيع تردد الحروف للحروف المحسوبة: يتم تصنيف بيانات المدرج التكراري على التردد

على الرغم من أن المجموعة الكاملة من الأحرف العربية تتضمن حوالي عشرة علامات التشكيل كما هو مبين في الشكل 1، إلا أن تحليل تردد الأحرف العربية معني فقط بحساب تكرار الحروف الأبجدية الموضحة في الجدول 2.

مصادر بأكثر من خمسة ملايين حرف

المراجع


وصلات خارجية

موسوعات ذات صلة :