Validité en expérimentation

Validité en expérimentation

Une conception expérimentale peut souffrir de menaces en matière de validité, et la recherche doit apprendre la validité de l'expérimentation pour les surmonter.

Qu’est-ce que la validité dans l’expérimentation ?

Dans la conception et l’expérimentation de la recherche scientifique, la validité fait référence à la capacité d’une étude à répondre scientifiquement aux questions qu’elle entend résoudre. La validité d’un résultat expérimental est la mesure dans laquelle il mesure ce qu’il est censé mesurer.

Ce n’est pas la même chose que la fiabilité, c’est-à-dire la mesure dans laquelle une mesure donne des résultats cohérents. En matière de validité, la mesure ne doit pas toujours être similaire, comme c'est le cas pour la fiabilité.

Même lorsqu'une expérience est réalisée selon un plan idéal, elle peut rencontrer divers types d'erreurs susceptibles de réduire la fiabilité et la validité des résultats expérimentaux.

Types de validité dans l'expérimentation

Deux grands types de validité expérimentale sont considérés ici : validité interne et validité externe.

Validité en expérimentation

Validité interne

Validité interne fait référence à la question de savoir si le traitement expérimental était la seule cause des changements observés dans la variable dépendante. En d’autres termes, la validité interne s’intéresse aux « véritables » causes des résultats que nous observons dans notre étude.

Une validité interne forte signifie que nous disposons non seulement de mesures fiables de nos variables indépendantes et dépendantes, mais également d'une justification solide qui relie causalement nos variables indépendantes à nos variables dépendantes.

En d’autres termes, une forte validité interne fait référence à l’attribution sans ambiguïté des causes aux effets.

Les bonnes techniques expérimentales, dans lesquelles l'effet d'une variable indépendante sur une variable dépendante est étudié dans des conditions hautement contrôlées, permettent généralement des degrés de validité interne plus élevés que, par exemple, les plans d'études à cas unique.

Cambell et Stanley (1963) puis Cook et Cambell (1979) ont répertorié huit types de variables confusionnelles susceptibles d'interférer avec la validité interne (c'est-à-dire avec la tentative d'isoler des relations causales).

Menaces qui interfèrent avec la validité interne

Ces menaces sont :

  • Histoire
  • Sélection
  • Essai
  • Instrumentation
  • Maturation
  • Mortalité expérimentale
  • Régression statistique
  • Interaction sélection-maturation

Nous discutons tour à tour de ces menaces ci-dessous.

Histoire

Pendant la durée d'une expérience, des événements imprévus et imprévus peuvent survenir et brouiller la relation étudiée. C'est un effet d'histoire.

Dans de nombreuses conceptions expérimentales, nous effectuons une mesure préalable (O1) de la variable dépendante avant d’introduire l’intervention (X). Après l'intervention, nous effectuons une mesure post-test (O2).

Alors la différence entre O1 et O2 C'est le changement que nous pensons que l'intervention a provoqué.

Entre O1 et O2Cependant, de nombreux événements inattendus pourraient survenir et entraîner des effets confondants de l'intervention, qui restent hors du contrôle de l'expérimentateur.

Cela rend impossible pour l'expérimentateur de savoir si le changement était dû à l'intervention ou s'il était le résultat d'événements imprévus (facteurs superflus).

Exemple

Un programme de formation de six semaines est organisé auprès d'un groupe d'employés de la banque pour améliorer leur niveau actuel de connaissances en matière de gestion bancaire.

Quelques mois plus tard, une évaluation est réalisée et les résultats de l'évaluation indiquent qu'il n'y a eu aucune amélioration des performances par rapport à la période de pré-formation. Naturellement, l'évaluateur conclura que la formation n'a été d'aucune utilité.

Pourquoi cela est-il ainsi?

Après enquête, il a été révélé que peu après la formation, les employés de la banque avaient entamé une grève imprévue pour concrétiser certaines de leurs revendications de longue date. La grève représente un menace historique à la validité de l’évaluation.

Même si nous pouvions contrôler l’effet de la grève, nous nous demanderions quand même : quel est l’effet réel et valable du programme de formation ?

La réponse à cette question dépend du type de conception utilisé par le chercheur pour son étude.

Sélection

Une menace importante pour la validité interne survient si les sujets du groupe expérimental (un groupe auquel une intervention est donnée) et du groupe témoin (un groupe sans intervention) ne sont pas équivalents à tous égards, par exemple, l'âge, la profession, la race et d'autres caractéristiques similaires.

Si les sujets sont répartis au hasard dans des groupes expérimentaux et témoins, ce problème de sélection peut être largement surmonté.

Exemple

Prenons l'exemple précédent. Supposons que les employés soient divisés en deux groupes : Groupe UN et Groupe B.

Un programme de formation est organisé pour le Groupe UN (groupe expérimental) mais pas pour le groupe B (groupe de contrôle). Après un an, les performances des deux groupes ont été évaluées.

On observe que le groupe expérimental a apporté des améliorations significatives dans ses performances. Peut-on conclure que cela est dû à l'effet de la formation dispensée au Groupe UN?

Après examen, il est apparu que les participants du Groupe UN étaient plus jeunes, énergiques et mieux instruits que les participants du groupe B.

Autrement dit, les deux groupes diffèrent par leurs caractéristiques de base.

D'où les participants du Groupe UN sont plus susceptibles d'être efficaces et pourraient donc comprendre les choses plus rapidement, ce qui se traduirait par de meilleures performances que le groupe témoin.

Cela fait référence au effet de sélection. Nous Nous pensons que si les caractéristiques des deux groupes avaient été similaires au départ, nous serions probablement dans une position plus sûre pour conclure sur l'impact du programme de formation.

Nous avons donc besoin d'une conception capable d'isoler l'effet de l'intervention du programme.

Essai

Le processus de réalisation d'un pré-test peut affecter les scores ou les mesures d'un post-test. Cela se produit simplement parce que l’expérience du premier test est susceptible d’avoir un effet d’apprentissage ou de diffusion qui tend à influencer les résultats du deuxième test.

Comment cela peut-il arriver?

Les personnes qui subissent un pré-test deviennent plus conscientes de la dimension du problème et sont donc susceptibles de se souvenir de certaines des questions et de certaines des erreurs qu'elles ont commises lors du post-test. Il est probable qu’ils obtiendront de meilleurs résultats au post-test qu’au pré-test.

Cette différence ou cette meilleure performance au post-test pourrait n’avoir rien à voir avec une intervention du programme, mais plutôt être entièrement due à l’effet du pré-test.

Ainsi, chaque fois qu’un test est administré de manière répétée au même groupe d’individus, il y a toutes les chances que l’on se trouve confronté à une menace quant à la validité de cette nature.

Exemple

Si vous demandez à un vendeur dans un grand magasin : combien de produits alimentaires conservez-vous dans votre magasin ?

Sa réponse est peut-être incorrecte à cet égard car il n'était pas prêt à répondre à cette question.

Une semaine plus tard, si la même question lui est posée, il pourra y répondre plus correctement uniquement parce qu'au fur et à mesure qu'il se familiarisera davantage avec les articles du magasin.

Des mesures répétées conduisent ainsi à des données valides.

Ainsi, si une formation est organisée pour les employés afin de les familiariser, l'effet indépendant de l'intervention du programme est difficile à isoler en raison de l'effet test. Une conception valide nécessite donc cet objectif.

Instrumentation

La mesure de la variable dépendante dans une expérience nécessite l'utilisation d'un questionnaire, d'un test ou d'autres formes d'instruments de mesure.

Tout changement dans la formulation des questions, un changement d'enquêteurs ou un changement dans d'autres procédures pour mesurer la variable dépendante provoque un effet d'instrumentation.

Cela peut conduire à une menace pour la validité interne.

Par exemple, les enquêteurs qui ont été utilisés pour la mesure du prétest peuvent acquérir des connaissances et des compétences accrues en matière d'entretien au cours du post-test, ou bien ils peuvent développer une certaine lassitude et décider de reformuler le questionnaire dans leur style.

En conséquence, un intervieweur expérimenté peut obtenir des informations complètes auprès d'un répondant qu'un intervieweur inexpérimenté.

Les informations supplémentaires obtenues peuvent être dues au fait que l'enquêteur est devenu plus habile à poser des questions ou à observer des événements, et non à l'effet de l'intervention du programme.

Exemple

Lors d'un prétest, on demande à un répondant : à quel âge vous êtes-vous marié ? À une date ultérieure (post-test), on a demandé au même répondant : En quelle année et en quel mois de l'année vous êtes-vous marié ?

Les deux questions pourraient conduire à deux réponses différentes si l'objectif de l'étude est de connaître l'âge au mariage de l'enquêté.

Maturation

L'effet de maturation est un effet sur les résultats d'une expérience provoqué par les changements intervenus chez les sujets expérimentaux au fil du temps.

C'est une fonction du temps plutôt qu'une réponse à un événement spécifique. Dans le cadre d'un programme de formation de longue durée, par exemple, il n'est pas rare que les stagiaires se sentent fatigués, affamés ou s'ennuient, voire parfois même découragés.

Dans les études longitudinales couvrant une longue période, les répondants deviennent généralement plus expérimentés, plus informés, plus sages, parfois plus résistants et, bien sûr, plus âgés.

En d’autres termes, les gens mûrissent avec le temps, et ce processus de maturation peut produire des changements indépendants des changements qu’un programme d’intervention est censé produire.

Mortalité expérimentale

Cela se produit lorsque la composition des groupes d'étude change au cours du test.

L'attrition est particulièrement probable dans le groupe expérimental, et à chaque abandon, le groupe change. Les effets de mortalité font référence à ces pertes. Étant donné que les membres du groupe témoin ne sont pas affectés par la situation des tests, ils sont moins susceptibles de se retirer.

Si les cas qui ont été abandonnés (perdus de suivi) sont différents de ceux qui ne l'ont pas été, il y a alors toutes les chances d'obtenir une grande différence entre les mesures du pré-test et du post-test.

Ces différences peuvent être dues à la perte de cas plutôt qu'à l'effet de l'intervention du programme.

Régression statistique

Ce facteur intervient lorsque les groupes ont été sélectionnés en fonction de leurs scores extrêmes et qu'au deuxième test, ils ont tendance à revenir vers le score moyen du groupe.

Supposons que nous mesurions les performances de tous les travailleurs d'un grand magasin quelques jours avant une expérience, puis que nous menions l'expérience avec uniquement les travailleurs figurant dans les scores de productivité les plus élevés de 25% et les plus bas de 25%.

Peu importe ce qui se passe entre O1 (la mesure pré-test) et O2 (la mesure post-test), il existe une forte tendance pour la moyenne des scores élevés à O1 décliner en O2 et pour les faibles scores en O, augmenter.

Cette tendance résulte d'une mesure imparfaite qui, en effet, enregistre certaines personnes anormalement hautes et anormalement basses à O.1. Dans la deuxième mesure, les membres des deux groupes ont tendance à obtenir des scores plus proches de leurs scores moyens à long terme (Cooper et Schindler, 1995).

Interaction sélection-maturation

Cela fait référence à la maturation différentielle des membres des groupes expérimentaux et témoins.

Contrairement à l’effet indépendant d’un seul facteur, cette menace pour la validité provient de deux facteurs susceptibles d’influencer les résultats expérimentaux.

Pour évaluer l'efficacité d'une méthode de formation spécifique, deux groupes d'individus, l'un composé d'hommes et l'autre de femmes du même âge et d'une formation similaire, sont choisis. Supposons que les mesures prétest effectuées sur deux groupes montrent des niveaux de performance égaux.

Après la mesure du pré-test, les femelles ont reçu la formation alors que les mâles ne l'ont pas été. Ensuite, une deuxième mesure a été prise pour les deux groupes.

Si la mesure du post-test montre un meilleur niveau de performance, peut-on dire que cette meilleure performance est entièrement due à l’intervention administrée aux femmes ?

Peut-être pas. Il est possible qu'entre le prétest et le posttest, l'effet de maturité ait agi de manière plus prononcée chez les femelles que chez les mâles, ce qui a contribué à un score élevé pour les femelles. Si c'est le cas, nous appelons cela un effet d'interaction de maturation de sélection.

Les menaces de validité que nous venons d’élaborer doivent être soigneusement prises en compte lors de la conception d’une étude.

Avant de conclure qu’une variable indépendante a une relation causale avec la variable dépendante, il est important de s’assurer que les menaces de validité n’ont pas contaminé les relations.

Il faut s'assurer que le choix de la conception de l'étude a été tel qu'il exclut autant d'explications alternatives que possible d'un effet observé.

Validité externe

La validité externe concerne la mesure dans laquelle les résultats (valides en interne) d'une étude peuvent être considérés comme vrais pour d'autres cas, par exemple pour des personnes, des contextes, des lieux ou des moments différents.

En d’autres termes, il s’agit de savoir si les résultats peuvent être valablement généralisés.

Il cherche à répondre à la question : si la même étude de recherche était menée dans ces autres cas, obtiendrait-elle les mêmes résultats ?

À quelles populations, contextes, variables de traitement et variables de mesure ces résultats peuvent-ils être généralisés ?

Une étude menée auprès d'élèves de cinquième année, par exemple, dans une école rurale, qui a révélé qu'une méthode d'enseignement était supérieure à une autre, peut ne pas être applicable aux élèves d'un niveau similaire ou d'un niveau différent dans une école urbaine.

Comme deuxième exemple, supposons que vous sélectionniez des patients d'un hôpital public pour étudier leur attitude à l'égard des services qu'ils reçoivent de l'hôpital. La question reste peut-être de savoir si l’on peut extrapoler les résultats à tous les hôpitaux publics du pays.

Ou pensez à une étude dans laquelle vous demandez à un échantillon représentatif d’une population de participer à une expérience, mais un nombre important refuse.

Si l’on expérimente uniquement avec ceux qui acceptent de participer, les résultats peuvent-ils être généralisés à l’ensemble de la population ?

Cela pose la question de la validité externe.

La validité externe peut être divisée en deux types distincts : la validité de population et la validité écologique.

Validité de la population fait référence à la mesure dans laquelle les résultats d'une étude peuvent être généralisés à partir de l'échantillon spécifique étudié à un grand groupe de sujets.

Par exemple, si l’échantillon est tiré d’une population accessible plutôt que d’une population cible, il est risqué de généraliser les résultats de la recherche de la population accessible à la population cible.

Habilidade de comunicação para um gerente é obrigatória. O gestor deve ser capaz de transmitir ideias e informações a outras pessoas e receber informações e ideias de outras pessoas de forma eficaz. la validité écologique fait référence à la mesure dans laquelle les résultats d'une expérience peuvent être généralisés à partir d'un ensemble de conditions environnementales créées par le chercheur à d'autres conditions environnementales (paramètres et conditions).

Conclusion

Les deux principaux types de validité expérimentale sont la validité interne et la validité externe.

À quoi fait référence la validité dans la conception et l’expérimentation de la recherche scientifique ?

Dans la conception et l’expérimentation de la recherche scientifique, la validité fait référence au degré auquel une étude peut répondre scientifiquement aux questions qu’elle entend résoudre. Il détermine si l’étude mesure ce qu’elle est censée mesurer.

En quoi la validité diffère-t-elle de la fiabilité ?

La validité dépend du fait qu'une étude mesure ce qu'elle a l'intention de mesurer, tandis que la fiabilité fait référence à la mesure dans laquelle une mesure donne des résultats cohérents. En termes de validité, les mesures ne doivent pas toujours être similaires, contrairement à la fiabilité.

Qu’aborde la validité interne dans une étude ?

La validité interne fait référence à la question de savoir si le traitement expérimental était la seule cause des changements observés dans la variable dépendante. Il aborde les « véritables » causes des résultats observés dans une étude, garantissant que les changements sont dus à l'intervention et non à d'autres facteurs.

Quelles sont les menaces qui pèsent sur la validité interne ?

Les menaces à la validité interne comprennent l'histoire, la sélection, les tests, l'instrumentation, la maturation, la mortalité expérimentale, la régression statistique et l'interaction sélection-maturation.

De quoi s’agit-il en matière de validité externe ?

La validité externe concerne la mesure dans laquelle les résultats d'une étude peuvent être généralisés à d'autres cas, tels que des personnes, des contextes, des lieux ou des moments différents. Il détermine si les résultats peuvent être valablement appliqués au-delà des conditions spécifiques de l’étude.

Quels sont les deux types distincts de validité externe ?

Les deux types distincts de validité externe sont la validité de population, qui fait référence à la généralisation des résultats d'un échantillon spécifique à un groupe plus large, et la validité écologique, qui fait référence à la généralisation des résultats d'un ensemble de conditions environnementales à un autre.