الصدق في التجريب

الصدق في التجريب

قد يعاني التصميم التجريبي من تهديدات الصلاحية، ويحتاج البحث إلى معرفة الصلاحية في التجربة للتغلب على هذه التهديدات.

ما هي الصلاحية في التجربة؟

في تصميم البحث العلمي والتجريب، تشير الصلاحية إلى ما إذا كانت الدراسة قادرة على الإجابة علميًا على الأسئلة التي تنوي حلها. إن صلاحية النتيجة التجريبية هي الدرجة التي تقيس بها ما يفترض أن تقيسه.

وهذا يختلف عن الموثوقية، وهي المدى الذي يعطي فيه القياس نتائج متسقة. ضمن الصلاحية، لا يجب أن يكون القياس متشابهًا دائمًا، كما هو الحال في الموثوقية.

حتى عند إجراء تجربة باستخدام تصميم مثالي، فقد تواجه أنواعًا مختلفة من الأخطاء التي قد تقلل من موثوقية وصحة النتائج التجريبية.

أنواع الصدق في التجربة

يتم النظر هنا في نوعين رئيسيين من الصلاحية التجريبية: توثيق داخلي و صلاحية خارجية.

الصدق في التجريب

توثيق داخلي

توثيق داخلي يشير إلى ما إذا كان العلاج التجريبي هو السبب الوحيد للتغيرات الملحوظة في المتغير التابع. بمعنى آخر، تتناول الصلاحية الداخلية الأسباب "الحقيقية" للنتائج التي نلاحظها في دراستنا.

تعني الصلاحية الداخلية القوية أنه ليس لدينا فقط مقاييس موثوقة لمتغيراتنا المستقلة والتابعة ولكن أيضًا مبرر قوي يربط متغيراتنا المستقلة بالمتغيرات التابعة بشكل سببي.

وبعبارة أخرى، تشير الصلاحية الداخلية القوية إلى التعيين الواضح للأسباب للنتائج.

إن التقنيات التجريبية الجيدة، التي يتم فيها دراسة تأثير متغير مستقل على متغير تابع في ظل ظروف شديدة التحكم، تسمح عادة بدرجات أعلى من الصلاحية الداخلية مقارنة، على سبيل المثال، بتصميمات الحالة الفردية.

قام كامبل وستانلي (1963) وكوك وكامبل (1979) بإدراج ثمانية أنواع من المتغيرات المربكة التي يمكن أن تتداخل مع الصلاحية الداخلية (أي مع محاولة عزل العلاقات السببية).

التهديدات التي تتعارض مع الصلاحيات الداخلية

هذه التهديدات هي؛

  • تاريخ
  • اختيار
  • اختبارات
  • الأجهزة
  • إنضاج
  • الوفيات التجريبية
  • الانحدار الإحصائي
  • التفاعل بين الاختيار والنضج

ونناقش هذه التهديدات تباعًا أدناه.

تاريخ

خلال فترة إجراء التجربة، قد تحدث بعض الأحداث غير المتوقعة وغير المخطط لها والتي تربك العلاقة قيد الدراسة. هذا ال تأثير التاريخ.

في العديد من التصاميم التجريبية نقوم بأخذ قياس أولي (O1) للمتغير التابع قبل إدخال التدخل (X). بعد التدخل نقوم بإجراء القياس البعدي (O2).

ثم الفرق بين O1 و يا2 هو التغيير الذي نعتقد أن التدخل قد سببه.

بين O1 و يا2ومع ذلك، يمكن أن تحدث العديد من الأحداث غير المتوقعة لتأثيرات مربكة للتدخل، والتي تظل خارجة عن سيطرة المجرب.

وهذا يجعل من المستحيل على المجرب معرفة ما إذا كان التغيير بسبب التدخل أم أنه كان نتيجة لأحداث غير متوقعة (عوامل خارجية).

مثال

يتم تنظيم برنامج تدريبي مدته ستة أسابيع بين مجموعة من موظفي البنك لتعزيز مستواهم الحالي من المعرفة حول إدارة البنك.

وبعد بضعة أشهر يتم إجراء التقييم، وتشير نتائج التقييم إلى عدم وجود أي تحسن في الأداء مقارنة بفترة ما قبل التدريب. وبطبيعة الحال، سوف يستنتج المقيم أن التدريب لم يكن له أي فائدة.

لماذا هو كذلك؟

وعند الاستفسار، تبين أنه بعد فترة وجيزة من التدريب، دخل موظفو البنك في إضراب غير مخطط له لتحقيق بعض مطالبهم الطويلة الأمد. يمثل الإضراب أ تهديد التاريخ على صحة التقييم.

وحتى لو تمكنا من التحكم في تأثير الضربة، فإننا سنظل نتساءل: ما هو التأثير الحقيقي والصالح للبرنامج التدريبي؟

تعتمد الإجابة على هذا السؤال على نوع التصميم الذي يستخدمه الباحث في دراسته.

اختيار

يتم مواجهة تهديد مهم للصلاحية الداخلية إذا لم تكن مواضيع المجموعة التجريبية (المجموعة التي يتم التدخل فيها) والمجموعة الضابطة (مجموعة بدون تدخل) متكافئة في جميع النواحي، على سبيل المثال، العمر، والمهنة، والعرق، خصائص أخرى مماثلة.

إذا تم تعيين المواضيع بشكل عشوائي إلى المجموعات التجريبية والضابطة، فيمكن التغلب على مشكلة الاختيار هذه إلى حد كبير.

مثال

النظر في المثال السابق. لنفترض أن الموظفين منقسمون إلى مجموعتين: المجموعة أ والمجموعة ب.

يتم تنظيم برنامج تدريبي للمجموعة أ (المجموعة التجريبية) ولكن ليس للمجموعة ب (مجموعة التحكم). وبعد عام واحد، تم تقييم أداء المجموعتين.

ويلاحظ أن المجموعة التجريبية حققت تحسينات كبيرة في أدائها. هل يمكننا أن نستنتج أن هذا يرجع إلى تأثير التدريب المقدم إلى المجموعة أ؟

وبعد التدقيق تبين أن المشاركين في المجموعة أ كانوا أصغر سنا وحيوية وأفضل تعليما من المشاركين في المجموعة ب.

أي أن المجموعتين تختلفان في خصائصهما الخلفية.

ومن هنا جاء المشاركون في المجموعة أ من المرجح أن يكونوا أكثر كفاءة، وبالتالي يمكنهم التقاط الأشياء بسرعة أكبر، مما يؤدي إلى أداء أفضل من المجموعة الضابطة.

يشير هذا إلى تأثير الاختيار. نحن نشعر أنه لو كانت كلتا المجموعتين متشابهتين في الخصائص في البداية، فمن المحتمل أن نكون في وضع أكثر أمانًا لاستنتاج تأثير البرنامج التدريبي.

وبالتالي نحن بحاجة إلى تصميم يكون قادرًا على عزل تأثير تدخل البرنامج.

اختبارات

يمكن أن تؤثر عملية إجراء الاختبار القبلي على درجات أو قياسات الاختبار البعدي. ويحدث هذا فقط لأن تجربة إجراء الاختبار الأول من المرجح أن يكون لها تأثير تعليمي أو انتشاري يميل إلى التأثير على نتائج الاختبار الثاني.

كيف يحدث هذا؟

يصبح الأشخاص الذين يخضعون للاختبار القبلي أكثر وعيًا وإدراكًا لحجم المشكلة، وبالتالي من المرجح أن يتذكروا بعض الأسئلة وبعض الأخطاء التي ارتكبوها عندما أجروا الاختبار البعدي. ومن المرجح أن يكون أداؤهم أفضل إلى حد ما في الاختبار البعدي مما فعلوه في الاختبار القبلي.

قد لا يكون لهذا الاختلاف أو الأداء الأفضل في الاختبار البعدي أي علاقة بتدخل البرنامج، ولكنه بدلاً من ذلك يرجع بالكامل إلى تأثير الاختبار القبلي.

وبالتالي، كلما تم إعطاء الاختبار بشكل متكرر لنفس المجموعة من الأفراد، هناك احتمال كبير لمواجهة تهديد لصحة هذا النوع.

مثال

إذا سألت مندوب مبيعات في متجر متعدد الأقسام: كم عدد المواد الغذائية التي تحتفظ بها في متجرك؟

وقد يكون جوابه غير صحيح في هذا الصدد لأنه لم يكن مستعدا للإجابة على هذا السؤال.

وبعد أسبوع، إذا طُرح عليه نفس السؤال، فقد يجيب عليه بشكل أكثر دقة فقط لأنه بحلول الوقت الذي يصبح فيه أكثر دراية بأصناف المتجر.

وبالتالي تؤدي القياسات المتكررة إلى بيانات صحيحة.

وبالتالي، إذا تم تنظيم التدريب للموظفين لجعلهم مألوفين، فمن الصعب عزل التأثير المستقل لتدخل البرنامج بسبب تأثير الاختبار. وبالتالي فإن التصميم الصالح يستدعي هذا الغرض.

الأجهزة

يتطلب قياس المتغير التابع في التجربة استخدام استبيان أو اختبار أو أشكال أخرى من أدوات القياس.

أي تغيير في صياغة الأسئلة، أو تغيير في القائمين على المقابلات، أو تغيير في إجراءات أخرى لقياس المتغير التابع يؤدي إلى تأثير الأجهزة.

وهذا قد يؤدي إلى تهديد الصلاحية الداخلية.

على سبيل المثال، قد يكتسب القائمون على المقابلات، الذين تم استخدامهم في القياس القبلي، معرفة ومهارة متزايدة في إجراء المقابلات أثناء الاختبار البعدي، أو قد يصابون بالإرهاق ويقررون إعادة صياغة الاستبيان بأسلوبهم.

ونتيجة لذلك، قد يحصل القائم بإجراء المقابلة من ذوي الخبرة على معلومات كاملة من أحد المشاركين مقارنة بالمحاور عديم الخبرة.

قد تكون المعلومات الإضافية التي تم الحصول عليها بسبب أن القائم بالمقابلة أصبح أكثر مهارة في طرح الأسئلة أو مراقبة الأحداث، وليس بسبب تأثير تدخل البرنامج.

مثال

سُئل أحد المجيبين أثناء الاختبار: في أي عمر تزوجت؟ وفي وقت لاحق (الاختبار البعدي)، سئل نفس المجيب: في أي سنة وشهر من السنة تزوجت؟

وقد يؤدي السؤالان إلى إجابتين مختلفتين إذا كان هدف الدراسة معرفة سن زواج المبحوث.

إنضاج

تأثير النضج هو تأثير على نتائج التجربة ناجم عن التغيرات في المواد التجريبية مع مرور الوقت.

إنها وظيفة الوقت وليس استجابة لحدث معين. في برنامج تدريبي طويل، على سبيل المثال، ليس من غير المعتاد أن يشعر المتدربون بالتعب أو الجوع أو الملل، أو حتى في بعض الأحيان بالإحباط.

في الدراسات الطولية التي تغطي فترة طويلة، عادةً ما يصبح المشاركون أكثر خبرة، وأكثر معرفة، وأكثر حكمة، وأحيانًا أكثر مقاومة، وبالطبع أكبر سنًا.

بمعنى آخر، ينضج الأشخاص بمرور الوقت، ويمكن لعملية النضج هذه أن تنتج تغييرات مستقلة عن التغييرات التي يهدف تدخل البرنامج إلى إنتاجها.

الوفيات التجريبية

يحدث هذا عندما يتغير تكوين مجموعات الدراسة أثناء الاختبار.

الاستنزاف محتمل بشكل خاص في المجموعة التجريبية، ومع كل تسرب، تتغير المجموعة. تشير آثار الوفيات إلى هذه الخسائر. نظرًا لأن أعضاء المجموعة الضابطة لا يتأثرون بحالة الاختبار، فهم أقل عرضة للانسحاب.

إذا كانت الحالات التي تسربت (فقدت للمتابعة) مختلفة عن تلك التي لم تفعل ذلك، فمن المرجح أن تحصل على فرق كبير بين قياسات الاختبار القبلي والاختبار البعدي.

وقد ترجع هذه الاختلافات إلى فقدان الحالات وليس إلى تأثير تدخل البرنامج.

الانحدار الإحصائي

يعمل هذا العامل عندما يتم اختيار المجموعات بناءً على درجاتها القصوى وفي الاختبار الثاني تميل إلى العودة نحو متوسط ​​النتيجة للمجموعة.

لنفترض أننا قمنا بقياس أداء جميع العاملين في متجر متعدد الأقسام لبضعة أيام قبل إجراء التجربة، ثم أجرينا التجربة مع العمال الذين حصلوا على أعلى درجات إنتاجية 25% وأدنى 25% فقط.

بغض النظر عما يحدث بين O1 (قياس ما قبل الاختبار) وO2 (القياس البعدي)، هناك ميل قوي لمتوسط ​​الدرجات العالية عند O1 للانخفاض عند O2 وللحصول على درجات منخفضة في O، لزيادة.

ينتج هذا الاتجاه عن القياس غير الكامل الذي، في الواقع، يسجل بعض الأشخاص مرتفعين بشكل غير طبيعي ومنخفضين بشكل غير طبيعي عند O1. وفي القياس الثاني، يميل أعضاء كلا المجموعتين إلى تسجيل درجات أقرب إلى متوسط ​​درجاتهم على المدى الطويل (Cooper and Schindler, 1995).

التفاعل بين الاختيار والنضج

يشير هذا إلى النضج التفاضلي لأعضاء المجموعتين التجريبية والضابطة.

على عكس التأثير المستقل لعامل واحد فقط، فإن هذا التهديد للصحة يأتي من عاملين قد يؤثران على النتائج التجريبية.

لمعرفة مدى فعالية طريقة تدريب معينة، يتم اختيار مجموعتين من الأفراد، واحدة تتكون من الذكور والأخرى تتكون من إناث من نفس العمر وخلفية تعليمية مماثلة. لنفترض أن قياسات الاختبار القبلي التي أجريت على مجموعتين أظهرت مستويات أداء متساوية.

وبعد إجراء الاختبار القبلي، تم تدريب الإناث بينما لم يتم تدريب الذكور. ثم تم إجراء القياس الثاني لكلا المجموعتين.

إذا أظهر مقياس الاختبار البعدي مستوى أداء أفضل، فهل يمكننا القول أن الأداء الأفضل يرجع بالكامل إلى التدخل الذي تم إجراؤه على الإناث؟

ربما لا. ومن الممكن أنه بين الاختبار القبلي والاختبار البعدي، كان تأثير النضج أكثر وضوحًا بين الإناث منه بين الذكور، مما ساهم في الحصول على درجة عالية للإناث. إذا كان الأمر كذلك، فإننا نسميها أ اختيار تأثير التفاعل النضج.

إن تهديدات الصلاحية التي أوضحناها للتو تحتاج إلى النظر فيها بعناية أثناء تصميم الدراسة.

قبل أن نستنتج أن المتغير المستقل له علاقة سببية مع المتغير التابع، من المهم التأكد من أن تهديدات الصلاحية لم تلوث العلاقات.

يجب التأكد من أن اختيار تصميم الدراسة كان بحيث يستبعد أكبر عدد ممكن من التفسيرات البديلة للتأثير الملحوظ.

صلاحية خارجية

تتعلق الصلاحية الخارجية بمدى إمكانية اعتبار نتائج الدراسة (الصالحة داخليًا) صحيحة بالنسبة لحالات أخرى، على سبيل المثال، لأشخاص أو إعدادات أو أماكن أو أوقات مختلفة.

وبعبارة أخرى، يتعلق الأمر بما إذا كان من الممكن تعميم النتائج بشكل صحيح.

ويسعى إلى الإجابة على السؤال التالي: لو أجريت نفس الدراسة البحثية في تلك الحالات الأخرى، فهل ستحصل على نفس النتائج؟

ما هي المجموعات السكانية والإعدادات ومتغيرات العلاج ومتغيرات القياس التي يمكن تعميم هذه النتائج عليها؟

إن دراسة طلاب الصف الخامس، على سبيل المثال، في مدرسة ريفية وجدت أن إحدى طرق التدريس متفوقة على أخرى قد لا تكون قابلة للتطبيق على الطلاب من صف مماثل أو من صف مختلف في مدرسة حضرية.

وكمثال ثان، لنفترض أنك قمت باختيار مرضى من مستشفى عام لدراسة موقفهم تجاه الخدمات التي يتلقونها من المستشفى. قد يبقى السؤال حول ما إذا كان بإمكانك استقراء النتائج لجميع المستشفيات العامة في البلاد.

أو لنأخذ في الاعتبار دراسة تطلب فيها من مجموعة من السكان المشاركة في تجربة ما، لكن عددًا كبيرًا منهم يرفضون ذلك.

إذا أجريت التجربة فقط مع أولئك الذين وافقوا على المشاركة، فهل يمكن تعميم النتائج على جميع السكان؟

وهذا يثير مسألة الصلاحية الخارجية.

يمكن تقسيم الصلاحية الخارجية إلى نوعين متميزين: الصلاحية السكانية والصلاحية البيئية.

صلاحية السكان يشير إلى مدى إمكانية تعميم نتائج الدراسة من العينة المحددة التي تمت دراستها على مجموعة كبيرة من الأشخاص.

على سبيل المثال، إذا كانت العينة مأخوذة من مجموعة سكانية يمكن الوصول إليها بدلاً من مجموعة سكانية مستهدفة، فإن تعميم نتائج البحث من مجموعة السكان التي يمكن الوصول إليها على السكان المستهدفين يعد أمرًا محفوفًا بالمخاطر.

على الجانب الآخر، صحة البيئية يشير إلى مدى إمكانية تعميم نتائج التجربة من مجموعة الظروف البيئية التي أنشأها الباحث على الظروف البيئية الأخرى (الإعدادات والظروف).

خاتمة

النوعان الرئيسيان من الصلاحية التجريبية هما الصلاحية الداخلية والصلاحية الخارجية.

ما الذي تشير إليه الصلاحية في تصميم البحث العلمي وتجريبه؟

في تصميم البحث العلمي والتجريب، تشير الصلاحية إلى الدرجة التي يمكن بها للدراسة الإجابة بشكل علمي على الأسئلة التي تنوي حلها. فهو يحدد ما إذا كانت الدراسة تقيس ما يفترض أن تقيسه.

كيف تختلف الصلاحية عن الموثوقية؟

تتعلق الصلاحية بما إذا كانت الدراسة تقيس ما تنوي قياسه، في حين تشير الموثوقية إلى المدى الذي يعطي فيه القياس نتائج متسقة. ضمن الصلاحية، لا يجب أن تكون القياسات متشابهة دائمًا، على عكس الموثوقية.

ما الذي تتناوله الصلاحية الداخلية في الدراسة؟

تشير الصلاحية الداخلية إلى ما إذا كان العلاج التجريبي هو السبب الوحيد للتغيرات الملحوظة في المتغير التابع. فهو يتناول الأسباب "الحقيقية" للنتائج التي تمت ملاحظتها في الدراسة، مما يضمن أن التغييرات ناتجة عن التدخل وليس عن عوامل أخرى.

ما هي بعض التهديدات للصلاحية الداخلية؟

تشمل التهديدات التي تواجه الصلاحية الداخلية التاريخ، والاختيار، والاختبار، والأجهزة، والنضج، والوفيات التجريبية، والانحدار الإحصائي، والتفاعل بين الاختيار والنضج.

ما هي الصلاحية الخارجية المعنية؟

تتعلق الصلاحية الخارجية بمدى إمكانية تعميم نتائج الدراسة على حالات أخرى، مثل الأشخاص أو الإعدادات أو الأماكن أو الأوقات المختلفة. ويحدد ما إذا كان من الممكن تطبيق النتائج بشكل صحيح بما يتجاوز الظروف المحددة للدراسة.

ما هما النوعان المتميزان من الصلاحية الخارجية؟

هناك نوعان متميزان من الصلاحية الخارجية هما الصلاحية السكانية، والتي تشير إلى تعميم النتائج من عينة محددة إلى مجموعة أكبر، والصلاحية البيئية، والتي تشير إلى تعميم النتائج من مجموعة من الظروف البيئية إلى أخرى.