عينة عشوائية بسيطة

عينة عشوائية بسيطة

أخذ العينات العشوائية البسيطة هو إجراء يمنح كل وحدة أخذ عينات في المجتمع احتمالًا متساويًا ومعروفًا غير صفري للاختيار. يمكن اختيار عينة عشوائية بسيطة بمساعدة برامج الكمبيوتر، أو جدول الأرقام العشوائية، أو الآلة الحاسبة العلمية.

في معظم الحالات، يتم استخدام أرقام عشوائية لاختيار العينات. يضمن إجراء الاختيار هذا أن يكون لكل وحدة سكانية احتمالية متساوية لإدراجها في العينة.

يتطلب رسم عينة عشوائية بسيطة من مجتمع ما أن يتم تعيين احتمالية متساوية للاختيار لكل وحدة سكانية مؤهلة في كل سحب. مما يضمن العشوائية في الاختيار مما يجعل العينة مستقلة عن الحكم البشري.

وفي الواقع يتم سحب عينة عشوائية بسيطة وحدة وحدة.

إذا توفرت قائمة (إطار أخذ العينات) للوحدات السكانية، فقد يتم اختيار العينة العشوائية بسهولة باستخدام أرقام عشوائية.

يمكن اتباع الإجراء التالي المكون من 8 خطوات لسحب عينة عشوائية بسيطة من ن الوحدات باستخدام أرقام عشوائية من سكان ن وحدات.

  1. قم بتعيين الأرقام التسلسلية للوحدات في السكان من 1 إلى
  2. حدد جدول الأرقام العشوائية الذي سيتم استخدامه.
  3. اختر رقمًا عشوائيًا مكونًا من رقم N من أي نقطة في جدول الأرقام العشوائية.
  4. إذا كان هذا الرقم العشوائي أقل من أو يساوي ن، هذه هي الوحدة الأولى التي اخترتها.
  5. انتقل إلى الرقم العشوائي التالي الذي لا يتجاوز ن، عموديًا أو أفقيًا أو في أي اتجاه آخر بشكل منهجي واختر وحدتك الثانية.
  6. إذا تجاوز الرقم العشوائي الذي تم اختياره في أي مرحلة من اختيارك ن، تجاهله، واختر الرقم العشوائي التالي.
  7. إذا تم تكرار أي رقم عشوائي، فيجب أيضًا التخلص منه واستبداله برقم عشوائي جديد يظهر بعد ذلك.
  8. تتوقف العملية بمجرد وصولك إلى حجم العينة المطلوب.

تم تصميم الأمثلة التالية لتوضيح كيفية اختيار العناصر السكانية في الممارسة العملية.

مثال 1: سحب عينة عشوائية بسيطة بحجم 5 من مجتمع مكون من 150 وحدة باستخدام طريقة أخذ العينات العشوائية البسيطة.

هنا ن = 5 و 7 فولت = 150. قم بتعيين الأرقام التسلسلية 001، 002،….150 إلى 150 وحدة من السكان. وبما أن 150 هو رقم مكون من ثلاثة أرقام، فإننا نقرأ فقط الأرقام العشوائية المكونة من ثلاثة أرقام الواردة في الملحق.

لنفترض أننا بدأنا من الرقم الموجود في أقصى يسار الصف الأول من جدول الأرقام العشوائية في الملحق 1 ونتقدم نحو الأسفل حتى نصل إلى عينة مكونة من 5 وحدات.

وكانت الأرقام العشوائية على النحو التالي:

277130802108541603497786666440
414945416502413258061608809195
493063609923779381396840474433
642668724210953407582895154121

لاحظ أننا نختار فقط تلك الأرقام التي تقع في النطاق 001-150. يتم حذف أي رقم يقع خارج هذا النطاق لأنه لا يتوافق مع أي وحدة من السكان. تتوقف العملية بمجرد وصولنا إلى خمسة أرقام.

لاحظ أن الأرقام المحددة هي 130 و108 و61 و63 و121. وقد تم وضع خط تحت هذه الأرقام بأوجه غامقة. كل هذه الأرقام متميزة.

إذا حدث رقم عشوائي مرتين، فسيتم حذف التكرار الثاني، ويتم تحديد رقم آخر كبديل له.

المثال رقم 2: افترض أن هناك 77 = 1000 سجل للأجور اليومية للعاملين في صناعة الأدوية. ارسم عينة مكونة من 25 سجلاً باستخدام الأرقام العشوائية الموضحة في الملحق 1 لسحب عينة مكونة من 25 سجلاً.

الخطوة الأولى هي ترتيب أجور 1000 موظف، وتخصيص رقم من 000 إلى 999. أي أن لدينا 1000 رقم مكون من ثلاثة أرقام حيث يمثل 001 السجل الأول، و999 يمثل 999ذ سجل و 000 1000ذ.

قد نستخدم الأرقام الثلاثة الأولى من العمود الثاني من الأرقام العشوائية في الملحق 1، والذي يتكون من 10 أرقام عشوائية مع حذف آخر 7 أرقام من كل رقم عشوائي. ونرى أن الرقم المحدد الأول هو 853، والثاني 540، والثالث 985، وهكذا. وبالانتقال إلى أسفل العمود، يتم اختيار الأرقام العشوائية التالية:

853540985903266
373920164998073
495496641417906
906715883744104
467236159118782

لاحظ أن إعادة ترقيم المسلسلات جعلت مهمة اختيار الحالات أسهل بكثير، ولم يحدث أي رفض في هذه العملية.

إذا كانت سجلات أجور الموظفين مرقمة بالفعل، فإننا نختار فقط السجلات ذات الأرقام المقابلة، وتمثل هذه السجلات عينة عشوائية بسيطة بحجم w=25 من .¥=1000.

نوضح أدناه بمثال طريقة فعالة نسبيا لسحب عينة عشوائية بسيطة ذات معدل رفض أقل.

المثال رقم 3: الرجوع إلى المثال رقم 1. المجتمع الذي سيتم اختيار عينة مكونة من 5 أفراد يحتوي على 150 وحدة. لاختيار وحدة من 001 إلى 150 اتبع الخطوات التالية:

  1. اختر رقمًا عشوائيًا من جدول الأرقام العشوائية المقدم لك (راجع الأرقام العشوائية الموضحة في المثال 5.3). وهذا الرقم هو 277، وهو يتجاوز 150.
  2. اقسم 277 على 150. والباقي هو 127. الوحدة التي تحمل الرقم 127 في التعداد السكاني هي الوحدة الأولى التي اخترتها.
  3. لاختيار الوحدة الثانية، اختر الرقم العشوائي التالي. هذا الرقم هو 130، وهو أقل من 150. وقد اخترنا هذا الرقم مباشرةً باعتباره الوحدة الثانية في العينة.
  4. الرقم العشوائي التالي هو 802، وينتج عنه باقي 52 عند القسمة على 150. الوحدة المقابلة لهذا الرقم هي الوحدة الثالثة المختارة.
  5. بمواصلة هذه العملية، نصل إلى العددين التاليين. هذه هي 108 و 91.
  6. الأرقام العشوائية المختارة هي 52، 91، 108، 127، و130.

يشار إلى الإجراء أعلاه باسم طريقة الباقي. يتمتع هذا الإجراء بميزة انخفاض معدل الرفض في عملية الاختيار.

تحديد حجم العينة في العينة العشوائية البسيطة

واحدة من أهم المشاكل في التخطيط لمسح العينة هي تحديد حجم العينة المطلوبة لتكون التقديرات موثوقة بدرجة كافية لتحقيق أهداف المسح.

القرار مهم لعدة أسباب. تتطلب العينة الكبيرة جدًا تكلفة كبيرة وقوى عاملة ومواد ووقتًا كبيرًا، في حين أن العينة الصغيرة جدًا تبطل النتائج. ثم السؤال هو: ما هو الحجم الأمثل للعينة؟

على الرغم من صعوبة وضع القواعد العامة لحجم العينة دون معرفة مجموعة السكان المحددة، يبدو أن حوالي 30 حالة هي الحد الأدنى للدراسات التي يجب إجراء تحليل البيانات الإحصائية فيها (Champion 1970: 89).

ومع ذلك، فإن العديد من الباحثين يعتبرون 50 حالة، ويرى البعض أن 100 حالة هي الحد الأدنى (فيشر وآخرون 1991).

أحد الأسباب هو أنه غالبًا ما يكون هناك العديد من المجموعات السكانية الفرعية التي يرغب الباحثون في دراستها بشكل منفصل أو عدة متغيرات ليتم التحكم فيها.

إذا لم تكن هناك حالات كافية في كل مجموعة فرعية من السكان، فمن الصعب أحيانًا تلبية افتراض الاختبارات الإحصائية القياسية مثل مربع كاي على وجه الخصوص. وبالإضافة إلى ذلك، فإن النسب المئوية المحسوبة على أساس أقل من 30 حالة تميل إلى عدم الاعتماد عليها.

فيشر وآخرون. (1991) يقترح نهجًا بسيطًا في الحالات التي ينوي فيها المرء تحليل البيانات في أ طاولة الطوارئ. يضمن هذا النهج الحد الأدنى لعدد الحالات كترددات الخلايا في جدول مشترك من المتغيرات.

باتباع هذا النهج، دعونا ننظر في مشكلة تحليل الارتباط بين المعرفة الغذائية للأمهات ومستوى تعليمهن. ومن أجل تحليل مثل هذا الجدول، يجب مراعاة نقطتين عند تحديد حجم العينة:

  • يجب أن تحتوي كل فئة من المتغير المستقل على عدد محدد من الحالات على الأقل؛
  • يجب أن يكون العدد المتوقع للحالات في كل خلية 5 حالات على الأقل (للسماح بالاختبارات الإحصائية، مثل مربع كاي).

في المثال الحالي، التعليم هو المتغير المستقل، في حين أن المعرفة الغذائية هي المتغير التابع. ليكن لمتغير "التعليم" أربعة مستويات كما يلي:

مستوى التعليم% من الأمهات
لا أحد60
أساسي20
ثانوي15
فوق الثانوية5
المجموع100

افتراضنا هو أن الفئات الأربع المذكورة أعلاه تشكل على التوالي 60%، و20%، و15%، و5% من جميع المستجيبين في السكان (انظر العمود 2 في الجدول أعلاه).

وبالتالي، من أجل الحصول على عينة كبيرة بما يكفي لضمان وجود 30 حالة على الأقل (على سبيل المثال) في أصغر فئة للمتغير (هنا 5% حالات) من إجمالي عدد الحالات، فإن حجم العينة المطلوب هو

تحديد حجم العينة بطريقة العينة العشوائية البسيطة

لنفترض الآن أن المعرفة الغذائية للأمهات تنقسم إلى 3 فئات: "لا معرفة" و"المعرفة المعتدلة" و"المعرفة العالية" والتي تمثل على التوالي 30% و20% و50% من جميع الأمهات.

مستوى المعرفة% من الأمهات
لا معرفة30
معرفة معتدلة20
معرفة عالية50
المجموع100

للعثور على الحد الأدنى لحجم العينة اللازم لضمان تردد خلية متوقع لا يقل عن 5، نقسم 5 على ناتج النسبة التي تقع في أصغر فئات المتغيرين (أي: 5% لما فوق الثانوي، و20% للمتغيرين المتوسطين). معرفة):

تحديد حجم العينة بالطريقة العشوائية البسيطة 2

وبما أن حجم العينة المطلوب يجب أن يستوفي كلا المعيارين (30 حالة في كل فئة متغيرة و5 حالات في كل خلية)، فيجب اعتماد أكبر التقديرين (600 مقابل 500) كحجم العينة النهائي.

يؤدي هذا المعيار إلى اختيار n=600 كحجم العينة النهائي. يمكننا التحقق من أن الإجراء أعلاه يضمن عدم احتواء أي من الخلايا على أقل من 5 حالات، وفي الوقت نفسه تحتوي فئة المتغير المستقل على 30 حالة على الأقل:

الجدول: جدول متقاطع لمستوى التعليم والتغذية
مستوى التعليم
مستوى التغذيةلا أحدأساسيثانويفوق الثانويةالمجموع (٪)
لا معرفة10836279180
(30%)
معرفة معتدلة7224186120
(20%)
معرفة عالية180604515300
(50%)
المجموع3601209030600
(%)(60%)(20%)(15%)(5%)(100%)

يتم حساب قيم الخلايا في الجدول أعلاه كمنتج لنسب الصفوف والأعمدة وحجم العينة المقدر (ن = 600). على سبيل المثال، يتم حساب القيمة الأولى 108 على النحو التالي:

108=0.30×0.60×600

وبالمثل، يتم حساب القيمة الثانية 60 في الصف الثالث على النحو التالي

60=0.50×0.20×600

نقدم الآن أدناه نهجًا أكثر صحة من الناحية الإحصائية لتحديد حجم العينة. وفي ذلك نتناول حالتين:

  1. تحديد حجم العينة (ن) في تقدير النسبة السكانية؛
  2. تحديد حجم العينة (ن) في تقدير متوسط ​​السكان.

حجم العينة عند تقدير النسبة السكانية

في الدراسات الاستقصائية بالعينة، كثيرًا ما نواجه مشكلة تقدير النسب أو النسب المئوية للسكان مثل نسبة الأشخاص المدخنين، ونسبة الأطفال الذين يعانون من سوء التغذية، ونسبة الناخبين الذين يفضلون مرشحًا معينًا، ونسبة العملاء الذين يصلون إلى متجر كبير به بطاقة الائتمان وما شابه ذلك.

وهكذا إذا ص إذا كانت هذه النسبة لها سمة معينة، فبالنسبة لعدد كبير بما فيه الكفاية من السكان، تكون صيغة تقدير حجم العينة حيث:

  • ن0 = حجم العينة المطلوب
  • z = الانحراف الطبيعي القياسي يتم تحديده عادة عند 1.96، وهو ما يتوافق مع مستوى الثقة 95%.
  • p = النسبة المفترضة في المجموعة السكانية المستهدفة التي يُقدر أنها تتمتع بخاصية معينة.
  • د = الخطأ الهامشي المسموح به في تقدير نسبة السكان.

مثال: سيتم إجراء مسح للتغذية في مخيم للاجئين. لنفترض أن 40% من الأطفال يعانون من سوء التغذية. ما هو حجم العينة اللازمة للتأكد بنسبة 95% من أن معدل الانتشار المقدر لا يختلف عن معدل الانتشار الحقيقي بأكثر من 0.05؟

بافتراض أن عدد السكان كبير، نستخدم الصيغة (ج) أعلاه. هنا z=1.96,6/=0.05 و /y=0.40. نريد الآن تقدير النسبة الحقيقية بين السكان في حدود 5 نقاط مئوية ص. وهذا في الداخل ع = 0.40 ± 0.05. هكذا

حجم العينة عند تقدير النسبة السكانية 1

إذا لم تكن p معروفة أو يصعب افتراضها، فسيكون الإجراء الأكثر أمانًا اعتبارها 0.50، مما يزيد التباين المتوقع إلى الحد الأقصى وبالتالي يشير إلى حجم العينة الذي من المؤكد أنه كبير بدرجة كافية. إذا كانت النسبة متوقعة بين قيمتين، يتم تحديد القيمة الأقرب إلى 50%. على سبيل المثال، إذا كان يُعتقد أن p يتراوح بين 15% و30%، فيجب اختيار 30% (الأكبر بين الاثنين) كقيمة p لحساب n.

الاختيار الشائع لـ d هو 0.05. لا يبدو أن هذه القيمة واقعية بالنسبة للسيناريوهات التي تكون فيها القيمة الحقيقية لـ p خارج النطاق 0.2 <p<0.8 when a small value for or consideration of a relative margin of error r is recommended. The quantity r is computed as portion of the assumed true proportion p. Consideration of this relative rate of allowable error margin would convert the equation to:

حجم العينة عند تقدير النسبة السكانية مثال - 1

نتحقق أدناه من أن الصيغة (ج) تعطي قيمة 139 لـ n عندما تكون cZ=0.5 وp=0.90:

عينة عشوائية بسيطة

بنفس القيم r (0.05) وp (0.90)، (c*) ينتج:

حجم العينة عند تقدير النسبة السكانية مثال - 3

إذا كانت N صغيرة، فإن الصيغة التي سيتم استخدامها تفترض النموذج التالي:

حجم العينة عند تقدير النسبة السكانية مثال - 4

يمكن أيضًا التعبير عن الصيغة (د) أعلاه على النحو التالي:

حجم العينة عند تقدير النسبة السكانية مثال - 5

عمليا، نقوم أولا بحساب n0. Fi n0/N مهمل، ثم n0 س هو تقريب مرضي ل ن .

على افتراض أنه من الصعب إصلاح p مقدمًا، فإننا نعتبرها 0.50. في هذا الحدث

حجم العينة عند تقدير النسبة السكانية مثال - 6

لنفترض أن jV = 2000، ونحن نعتبر هذا عددًا صغيرًا من السكان. ثم سنقوم بمراجعة تقديراتنا لـ ن على النحو التالي:

حجم العينة عند تقدير النسبة السكانية مثال - 7

يقدم ياماني (1967) صيغة أكثر بساطة للحساب ن. هذا هو

حجم العينة عند تقدير النسبة السكانية مثال - 8

عندما يتم تطبيق (e*) على الحالة المذكورة أعلاه؛

حجم العينة عند تقدير النسبة السكانية مثال - 9

كما يمكن ملاحظة أن حجم العينة باستخدام الصيغة (هـ) يؤدي إلى أخذ عينات من الأطفال أقل من الصيغة (ج).

ومن السهل أيضًا التحقق من تلك الصيغة (ج) بشكل محدد ض و د القيم، سوف تعطي نفس حجم العينة بغض النظر عن حجم السكان. يقارن الجدول التالي بين الصيغتين عدديا:

جدول: مقارنة بين صيغتين لحجم العينة لـ p=0.5، < £=0.05 وz=1.96
حجم السكانحجم العينة المقدر متى ن هو كبيرحجم العينة المقدر متى ن صغير
5038545
10038580
500385218
1,000385279
5,000385357
10,000385371
50,000385382

في الدراسات المقارنة، عادة ما يرغب المرء في إثبات وجود فرق كبير بين المجموعتين. إذا افترضنا أن عدد الحالات متساوي (ن&نbsp;1 = ن&نbsp;2 = ن) في المجموعتين السكانيتين الفرعيتين، صيغة ن يشبه إلى حد كبير ما ورد أعلاه:

حجم العينة عند تقدير النسبة السكانية مثال - 10

حجم العينة لتقدير متوسط ​​المجتمع

في كثير من الأحيان، نريد استخلاص استنتاج حول المتوسط ​​والقيمة الإجمالية للمتغيرات مثل الدخل أو الإنفاق أو العمر أو مؤشر كتلة الجسم.

يختلف حجم العينة اللازم لإجراء مثل هذا الاستدلال إلى حد ما عن الحجم الذي تمت مناقشته بالنسبة للنسبة. في المتوسط، الصيغة هي أين <r2 is the population variance.

حجم العينة لتقدير متوسط عدد السكان

مثال: بالنسبة لمجموعة سكانية مكونة من 10000 امرأة، أظهر توزيع مؤشر كتلة الجسم (BMI) تباينًا قدره 15. ما حجم العينة التي يجب أن نسحبها إذا أردنا أن نكون واثقين بنسبة 95٪ من أن تقديرنا لمتوسط ​​مؤشر كتلة الجسم لدى السكان غير صحيح؟ بنسبة ± 0.3؟

حجم العينة لتقدير متوسط السكان مثال

هنا 7V = 10000، أ2 =15، < £=0.3. ومن ثم لتقدير المتوسط يتم الحصول على حجم العينة من (g) كما يلي: 

وبالتالي ستكون هناك حاجة لعينة مكونة من 602 امرأة لتحقيق درجة الثقة المطلوبة في التقدير. لو ن كانت كبيرة، ن لكان بحكم (ح);

حجم العينة لتقدير متوسط المجتمع مثال 2