في نظرية الاحتمال و الإحصائيات، يعد التوزيع المنتظم المتقطع هو توزيع الاحتمالات حيث يكون عددًا محدودًا من القيم المتباعدة بالتساوي ويمكن ملاحظتها بشكل متساوٍ تقريبًا؛ فكل قيمة من القيم n يكون لها احتمال متساوٍ مع 1/n. وبمعنى آخر فإن "التوزيع المنتظم المتقطع" سيكون "عددًا معرفًا من النتائج المتباعدة بالتساوي والتي لها نفس نسبة احتمال الحدوث".
إذا كان لمتغير عشوائي أي من قيم المحتملة المتباعدة بالتساوي والتي لها نفس نسبة الاحتمال، إذا فلها نفس التوزيع المنتظم المتقطع. ويكون احتمال أي نتيجة هو is . هناك مثال بسيط للتوزيع المنتظم المتقطع وهو رمي النرد العادل (نرد) القيم الممكنة للمتغير هي 1، 2، 3، 4، 5، 6؛ وفي كل مرة يتم رمي النرد فيها، يكون الاحتمال المتوقع نتيجة من 1/6. إذا ألقي حجر نرد، وأضيفت قيمتهما، فإن التوزيع المنتظم المتقطع لا يكون مناسبًا لأن القيم من 2 حتي 12 ليس لها احتمالات حدوث متساوية.
إن دالة التوزيع التراكمي (CDF) للتوزيع المنتظم المتقطع يمكن التعبير عنها في شكل توزيع متطابق مثل
حيث دالة هيفسايد الدرجية هي دالة توزيع تراكمي للتوزيع المتطابق المتركز على , مستخدمًا التعبير الاصطلاحي
تقدير الحد الأقصى
يوصف هذا المثال بالقول بأنه يتم الحصول على عينة من ملاحظات k من التوزيع المنتظم للأعداد الصحيحة ، مع ظهور مشكلة تقدير الحد الأقصى غير المعروف للمتغير N. تعرف هذه المشكلة بشكل عام على أنها مشكلة الدبابات الألمانية، نظراً لتطبيق أقصى تقدير لتقديرات إنتاج الدبابة الألمانية خلال الحرب العالمية الثانية.
إن مقدر UMVU للحد الأقصى ينتج من خلال
حيث m هي الحد الأقصى للعينة و k هي حجم العينة، ويكون أخذ العينات دون إبدال.[1][2] يمكن أن ينظر إلى ذلك على أنه حالة بسيطة جدًا لتقدير الحد الأقصى للمسافة.
ويمكن فهم المعادلة بشكل بديهي على النحو التالي:
- "الحد الأقصى للعينة مضاف إليه متوسط الفارق بين الملاحظات في العينة"،
يضاف الفارق للتعويض عن التحيز السلبي للحد الأقصى للعينة كمقدر للحد الأقصى لعدد السكان.[notes 1]
ويكون الفارق في هذا كالتالي.[1]
لذلك يكون الانحراف المعياري للتقريب في ، هو حجم متوسط (السكان) للفارق بين العينات؛ يقارن مع أعلاه.
كما أن الحد الأقصى للعينة هو مُقدر الحد الأقصى للاحتمال للحد الأقصى لعدد السكان، ولكنه منحاز، كما ذكر أعلاه.
إذا لم يتم ترقيم العينات ولكن كانت قابلة للتعريف أو محددة بالعلامات، يمكن للمرء بدلاً من ذلك أن يقدر حجم السكان عبر طريقة الاستعادة- وإعادة الاستعادة.
التبديل العشوائي
انظر الأرقام المصفوفية لحساب توزيع الاحتمالات لعدد النقاط الثابتة لتوزيع متساوٍ من عشوائية التبديل.
ملاحظات
- إن الحد الأقصى للعينة لا يتجاوز أبدًا الحد الأقصى لعدد السكان، ولكنه يمكن أن يكون أقل وبالتالي فهو مقدر منحاز: وسيميل إلى تقليل الحد الأقصى لعدد السكان.
المراجع
- Johnson, Roger (1994), "Estimating the Size of a Population", Teaching Statistics, 16 (2 (Summer)), doi:10.1111/j.1467-9639.1994.tb00688.x نسخة محفوظة 26 مايو 2009 على موقع واي باك مشين.
- Johnson, Roger (2006), "Estimating the Size of a Population", Getting the Best from Teaching Statistics, مؤرشف من الأصل ( كتاب إلكتروني PDF ) في 14 يوليو 2014