إجراء أخذ العينات الاحتمالية المتناسبة مع الحجم (PPC) هو أحد أشكال أخذ العينات متعددة المراحل حيث يكون احتمال اختيار PSU متناسبًا مع حجمها، ويتم أخذ عينات من عدد متساوٍ من العناصر داخل كل PSU.
إذا كان عدد سكان إحدى وحدات المعاينة الأولية ضعف عدد سكان وحدة أخرى، فسيتم منحها فرصة مضاعفة ليتم اختيارها.
إذا تم اختيار نفس العدد من الأشخاص من كل وحدة من وحدات المعاينة الأولية المحددة، فإن الاحتمال الإجمالي للاختيار لأي شخص سيكون هو نفسه. وبالتالي فإن أخذ عينات PPS الدقيقة لوحدات PSU يحقق التحكم الكامل في حجم العينة.
تكون طريقة اختيار PPS مفيدة عندما تختلف وحدات PSU بشكل كبير في الحجم.
والفرق المتأصل بين أخذ العينات العشوائية البسيطة وأخذ العينات PPS هو أن احتمال سحب أي وحدة محددة في أي سحب معين هو نفس الطريقة السابقة.
وفي المقابل، فإن احتمالية الطريقة الأخيرة تختلف من رسم إلى آخر. ونتيجة لذلك، فإن نظرية أخذ العينات PPS أكثر تعقيدًا من أخذ العينات العشوائية البسيطة.
كيف تعمل في الواقع العملي؟ وسنوضح الطريقة (وتسمى طريقة المجموع التراكمي) بمثال.
مثال لأخذ عينات PPS
يتكون عدد السكان من 10 قرى تضم إجمالي 212 أسرة. ويبين العمود الثاني من الجدول المرافق عدد الأسر المقابلة لكل قرية. سيتم اختيار عينة مكونة من 6 قرى بطريقة PPS.
وللقيام بذلك اتبع الخطوات التالية:
- قم بإعداد عمود الإجمالي التراكمي مع الأسر في العمود 2. وتظهر هذه المجاميع في العمود 3.
- أنشئ عمودًا يعرض النطاق الذي تشير إليه الإجماليات التراكمية.
- اقرأ الأرقام العشوائية من الملحق. هذه الأرقام العشوائية هي 173، 95،210، ..،32. (تجاهل كافة الأرقام العشوائية الموجودة خارج النطاق 001-212).
- الأعمدة المقابلة للأرقام العشوائية التي اخترناها ستكون القرى التي تم أخذ عينات منها.
- يوضح الجدول 5.9 القرى المختارة التي تم أخذ عينات منها مع وبدون استبدال.
وقد ضمن هذا الإجراء أن تكون احتمالات الإدراج متناسبة مع حجم القرى (عدد الأسر) في كل سحب.
إذا لم تكن أحجام الأسرة معروفة، فيمكن استخدام بعض المتغيرات المساعدة الأخرى، المرتبطة بشكل كبير بحجم الأسرة (مثل حجم السكان) بدلاً من ذلك كمقياس للحجم.
الجدول: اختيار عينة PPS
قرية | عدد الأسر | المجموع التراكمي | يتراوح | احتمال الاختيار |
1 | 35 | 35 | 001-035 | 35/212 |
2 | 28 | 63 | 036-063 | 28/212 |
3 | 20 | 83 | 064-083 | 20/212 |
4 | 25 | 108 | 084-108 | 25/212 |
5 | 30 | 138 | 109-138 | 30/212 |
6 | 19 | 157 | 139-157 | 19/212 |
7 | 10 | 167 | 158-167 | 10/212 |
8 | 12 | 179 | 168-179 | 12/212 |
9 | 18 | 197 | 180-197 | 18/212 |
10 | 15 | 212 | 198-212 | 15/212 |
المجموع | 212 | – | – | 1.000 |
عشوائي#173 | 95 | 210 | 119 | 140 | 152 | 32 |
قرية # 8 | 4 | 10 | 5 | 6 | 6 | 1 |
إس دبليو آر 1 | 2 | 3 | 4 | 5 | 6 | – |
أقسم * 1 SWR أخذ العينات مع الاستبدال، SWOR: أخذ العينات دون استبدال | 2 | 3 | 4 | 5 | – | 6 |
PPS أخذ العينات المنهجية
أنت بالفعل على دراية بمفهوم أخذ عينات PPS. ويوضح هذا القسم كيف يمكن استخدام هذه الطريقة في أخذ العينات المنهجية أيضًا.
ونوضح هذا النهج من خلال المثال السابق لأخذ العينات دون استبدال. ولملاءمة المشكلة في سياق أخذ العينات الخطية المنهجية، قمنا باختيار 4 قرى بحيث يكون إجمالي 212 قرية قابلاً للقسمة على حجم العينة.
ارجع إلى الأعمدة الأربعة الأولى من الجدول 5.7. الآن لاختيار 4 قرى، اتبع الخطوات كما هو مفصل أدناه:
- اقسم إجمالي عدد الأسر (هنا 212) على 4، حجم العينة. وهذا يعطي الفاصل الزمني لأخذ العينات ك=53.
- اختر رقمًا عشوائيًا بين 1 و33 ضمنًا. لنفترض أن هذا الرقم هو 20. وقد وجد أنه يقع في النطاق 001-035. يؤدي هذا إلى تحديد القرية التي تحمل الرقم التسلسلي 1 كاختيارنا الأول.
- يضيف ك (=53) إلى الرقم 20 الذي تم اختياره في الخطوة 2. وينتج عن ذلك 53+20=73، والذي يقع في النطاق 64-83. وهذا يقودنا إلى اختيار القرية التي تحمل الرقم التسلسلي 3.
- لاختيار الوحدة الثالثة، أضف 53 إلى 73، لتحصل على 126، الذي يقع في النطاق 109-138. هذا يملي علينا اختيار قرية تحمل الرقم التسلسلي 5.
- وأخيرًا، أضف 53 إلى 126، مما يؤدي إلى إجمالي 179. يؤدي هذا إلى تحديد القرية 8.
- هذا يكمل إجراء اختيار العينة. لقد اخترنا القرى ذات الأرقام التسلسلية: 1،3،5 و8.
لو كانت هذه حالة ن = 6، ك كان من الممكن أن يكون 35.33 يقود إجراء الاختيار إلى أخذ العينات الدائرية المنهجية.
لإنجاز المهمة بموجب هذا الإجراء، نقوم بتقريب الفاصل الزمني لأخذ العينات إلى الرقم الأعلى التالي، 36. وكما تملي الطريقة، نختار رقمنا العشوائي بين 1 و212 ضمنًا لضمان اختيار احتمالي متساوٍ.
من السهل التحقق من أن اختيار أي رقم عشوائي في النطاق من 1 إلى 32 لن يسبب أي مشكلة في اختيار 6 قرى. وإذا تجاوزت ذلك، فيجب عليك اتباع استراتيجية أخذ العينات المنهجية الدائرية لضمان 6 قرى.
لنفترض أن الرقم العشوائي الذي اخترته هو 40. يقع هذا في النطاق 36-63، مما يمنحنا القرية 2 كاختيارنا. أضف الآن 36 إلى 40، مما ينتج عنه 76. يقع هذا في النطاق 64-83، مما يحدد القرية 3 باعتبارها اختيارنا الثاني.
واستمرارًا للعملية، فإن القرى الأربع المختارة المتبقية هي تلك التي تحمل الأرقام التسلسلية 5، 6، 9، و1. يوضح الجدول المرفق الرقم العشوائي الذي تم اختياره والقرى المختارة المرتبطة به.
رقم عشوائي | يتراوح | قرى مختارة |
---|---|---|
40 | 036-063 | 2 |
76 | 064-083 | 3 |
112 | 109-138 | 5 |
148 | 139-157 | 6 |
184 | 180-197 | 8 |
220 | 001-035 | 1 |
220-212=8، والتي تقع في النطاق الأول، وتحديد القرية الأولى. |