Fiabilité et validité des mesures

Fiabilité et validité des mesures

Qu’est-ce que la mesure ?

La mesure est au cœur de toute discipline scientifique. La fonction première de la mesure est d'attribuer des numéros à des objets ou à des événements selon certaines règles. C'est le processus par lequel les données empiriques sont organisées selon une relation systématique avec le concept étudié.

Bryman identifie trois raisons principales pour lesquelles la mesure est une préoccupation dans la recherche quantitative :

  • La mesure nous permet de délimiter de fines différences entre les personnes concernant les caractéristiques en question.
  • La mesure nous fournit un outil ou un critère cohérent pour établir de telles distinctions.
  • La mesure fournit la base d'estimations plus précises du degré de relation entre les concepts (par exemple, grâce à l'analyse de corrélation).

La théorie de la mesure soutient que, aussi précis que soient nos instruments de mesure et aussi prudents que soient nos efforts d'observation, il y aura toujours des erreurs introduites dans nos mesures. C'est ce que nous appelons erreur de mesure.

La formulation centrale de la théorie de la mesure stipule qu'une mesure observée (score) est égale au score réel plus une certaine erreur (au-dessus ou en dessous du score réel), qui se produit nécessairement lors du processus d'observation du phénomène.

Ainsi si X est un score observé, T un vrai score et e une erreur de mesure, alors la relation entre X, T, et e pour le je-ème individu peut être exprimé comme suit :

validité de fiabilité dans l'exemple de mesure 1

Ainsi pour une mesure spécifiée je, l'erreur de mesure e1 est la différence entre X, et 7) :

validité de fiabilité dans l'exemple de mesure 2

Chaque fois qu’un attribut est mesuré, trois types d’erreurs sont susceptibles d’être générés dans le processus de mesure. Il s’agit de (i) une erreur aléatoire, (b) une erreur systématique et (c) une erreur situationnelle.

Un hasard erreur apparaît comme une variation inexpliquée. Cela se produit de manière aléatoire. Une erreur aléatoire ne présente aucune tendance systématique à être négative ou positive.

Si les erreurs sont véritablement aléatoires, elles s’annuleront et la moyenne globale de ces erreurs sera nulle.

C'est-à-dire;

validité de fiabilité dans l'exemple de mesure 3

Parfois, les gens ne connaissent pas leur âge exact. Lors de leur déclaration, certaines personnes surestimeront leur âge, tandis que d’autres le sous-estimeront. Cela produira des erreurs aléatoires.

L'inexactitude des mesures qui se produit à plusieurs reprises et pour les mêmes raisons est étiquetée erreur systématique.

Les observations surestiment ou sous-estiment systématiquement la valeur réelle sont sujettes à une erreur systématique. Des erreurs systématiques se produisent fréquemment à la suite de procédures de recherche inappropriées telles que :

  • Conceptualisation erronée du problème de recherche.
  • Un instrument de recherche mal conçu.
  • Le parti pris du chercheur. et
  • Opérationnalisation incorrecte des variables.

Contrairement aux erreurs aléatoires, la somme des erreurs systématiques ne totalise pas zéro.

Dans la mesure de l’utilisation des contraceptifs, par exemple, si les personnes déclarent systématiquement une utilisation plus élevée, parce qu’elles pensent que l’enquêteur ou les responsables du programme l’apprécieraient, des erreurs se produiraient systématiquement, donnant un taux faussement élevé d’utilisation des contraceptifs.

De même, une balance défectueuse ou tout autre appareil de mesure défectueux est susceptible de produire une erreur systématique dans le processus de mesure.

Erreurs situationnelles sont ceux qui ne se produisent ni au hasard ni systématiquement, mais qui résultent de caractéristiques personnelles particulières d'un ou de plusieurs individus ou d'autres circonstances particulières pouvant influencer le processus de mesure.

La fatigue, par exemple, des répondants ou une atteinte environnementale inhabituelle, peuvent générer une erreur situationnelle.

Les chercheurs en sciences sociales emploient principalement deux critères pour évaluer la qualité de leurs mesures.

Ceux-ci sont;

  1. fiabilité, et
  2. validité.

Ces deux critères cherchent à répondre ;

  • dans quelle mesure il est cohérent ou fiable (ce qui fait référence à la fiabilité), et
  • Les informations obtenues sont-elles exactes (ce qui fait référence à la validité) ?

Nous discutons tour à tour de ces concepts dans les sections suivantes.

Fiabilité et sa mesure

En termes simples, la fiabilité est la mesure dans laquelle une procédure de mesure produit des résultats similaires, c'est-à-dire cohérents, lorsqu'elle est répétée dans des conditions similaires.

Un tailleur mesurant le tissu avec un ruban à mesurer obtient une valeur de longueur du tissu de 20 pouces.

Si le tailleur prend des mesures répétées du tissu et obtient à chaque fois la même longueur, on dit que le mètre ruban est fiable.

Les conditions essentielles dans un tel processus de mesure sont que l'administration répétée du même instrument doit être effectuée dans des conditions essentiellement similaires et que l'objet ne sera pas modifié au fil du temps.

Les instruments fiables sont robustes ; ils fonctionnent bien à différents moments et dans différentes conditions.

Cependant, si la valeur de l’objet mesuré change, la mesure de fiabilité indiquera ce changement.

Comment un instrument de mesure peut-il ne pas être fiable ?

Si votre poids reste constant à 60 kilogrammes, mais que des mesures répétées sur votre pèse-personne montrent que votre poids fluctue, le manque de fiabilité peut être dû à un ressort faible à l'intérieur du pèse-personne.

Dans le cas d recherche sociale, le manque de fiabilité du questionnaire en tant qu'instrument de mesure peut survenir lors de la mesure de tout concept, car des éléments tels que les catégories de questions ou de réponses sont si ambigus que le répondant ne sait pas exactement comment il doit répondre.

Dans les circonstances données, le défendeur ne répond pas de manière cohérente. Cela conduit au manque de fiabilité de l'instrument de mesure (ici le questionnaire).

La crédibilité et la testabilité de toute théorie dépendent donc principalement d’outils ou de dispositifs de mesure adéquats en recherche sociale.

La fiabilité d’une mesure peut être décrite en termes de trois concepts interdépendants :

  • La stabilité;
  • Équivalence; et
  • La cohérence interne.

Une mesure est dite stable si vous pouvez obtenir des résultats cohérents avec des mesures répétées des mêmes individus ou objets avec les mêmes instruments.

Une procédure d'observation ou un appareil de mesure est stable s'il donne la même lecture sur un individu ou un objet lorsqu'il est répété une ou plusieurs fois.

La deuxième perspective sur la fiabilité, c'est-à-dire équivalence, considère le degré d'erreur qui peut être introduit par différents enquêteurs (en observation) ou différents échantillons d'éléments étudiés (en questionnement ou en échelles).

Ainsi, alors que la stabilité concerne les fluctuations personnelles et situationnelles d’un moment à l’autre, l’équivalence concerne les variations à un moment donné parmi les observateurs et les échantillons d’éléments.

Un bon moyen d’évaluer l’équivalence des mesures effectuées par différents observateurs est de comparer leurs scores ou évaluations du même événement.

Dans l’enquête de 1993 sur la prévalence des DID au Bangladesh, par exemple, huit médecins ont mesuré le degré de goitre d’une seule personne à un moment donné pour évaluer l’étendue des erreurs de mesure imputables aux médecins.

La troisième approche de la fiabilité, c'est-à-dire la la cohérence interne, utilise une seule administration d'un instrument ou d'un test pour évaluer la cohérence ou l'homogénéité entre les éléments.

Il faut toujours garder à l’esprit que la fiabilité fait référence à un instrument de mesure spécifique appliqué à une population spécifique dans des conditions spécifiques.

Pour évaluer la fiabilité de tout test basé au moins sur des données d'intervalle, nous pouvons utiliser, en général, le coefficient de corrélation produit-moment de Pearson. r, et la corrélation résultante sera notre estimation du coefficient de fiabilité.

Le coefficient varie entre « 0 » (pas de corrélation et donc pas de cohérence interne) à « 1 » (corrélation parfaite et donc cohérence interne complète).

On s'attend généralement à ce qu'un coefficient de 0,8 et plus implique un niveau de fiabilité acceptable.

La corrélation doit être statistiquement significative pour établir la fiabilité, et la force de la corrélation fournit des informations sur la fiabilité des mesures impliquées.

Pour estimer la fiabilité, on peut utiliser différentes sources de variation des valeurs de mesure.

L'approche la plus simple est celle dite de la variance, qui utilise l'équation précédente [ (a), à savoir. Xt =Tje+eje. ]

L'ensemble des scores observés a une variance totale Vo (dire). De même, les vrais scores (Tj) et les erreurs de mesure e aura des écarts Ft et Ve, respectivement.

La variance totale est la somme de la variance vraie et de la variance d'erreur, c'est-à-dire ;

validité de fiabilité dans l'exemple de mesure 4

Le rapport entre la variance vraie et la variance totale est le coefficient de fiabilitét. C'est-à-dire;

validité de fiabilité dans l'exemple de mesure 5

Depuis Vt est inférieur ou égal à Ko, le coefficient de fiabilité peut prendre une valeur maximale de 1.

Lorsque tel est le cas, on dit que les scores observés sont les mêmes que les véritables plaies, et dans ce cas, une fiabilité parfaite est supposée atteinte.

Une formule alternative pour le coefficient de fiabilité peut être obtenue en divisant les deux côtés de l'expression (d) par Vq.

Ainsi;

validité de fiabilité dans l'exemple de mesure 6

Après quelques réaménagements ;

validité de fiabilité dans l'exemple de mesure 7

Il existe plusieurs autres techniques populaires disponibles pour mesurer la fiabilité. Ceux-ci sont

  • Méthode test-retest
  • Méthode des formes parallèles
  • Méthode divisée en deux,
  • Formule de Kuder-Richardson et
  • ANOVA

Les trois dernières techniques sont utilisées pour évaluer l’aspect cohérence interne de la fiabilité.

Comment augmenter la fiabilité

Les techniques suivantes peuvent augmenter la fiabilité estimée d'un test :

  • Augmentez la durée d'un test en ajoutant plus d'éléments. Plus le test est long, plus la fiabilité probable est élevée. Il ne faut ajouter que les éléments qui ont été sélectionnés dans la même population d'éléments.
  • Vous pouvez obtenir une fiabilité accrue grâce à une meilleure cohérence des enquêteurs en faisant appel uniquement à des personnes bien formées, supervisées et motivées pour mener la recherche.
  • Augmentez la variance en rendant le test plus discriminant. Ajoutez des éléments qui séparent les personnes le long d'un continuum, avec certains éléments pour lesquels seuls les meilleurs scores obtiendront de bons résultats, d'autres uniquement pour les pires scores se tromperont, et ainsi de suite sur toute la ligne. Veuillez vous débarrasser des éléments sur lesquels tout le monde a raison (ainsi que de ceux sur lesquels tout le monde a tort), car ils ne confèrent aucun pouvoir de discrimination. Un test à 2 items ne peut évidemment pas produire autant de variation qu'un test à 100 items, et le test à 2 items ne fournira pas non plus beaucoup d'informations sur le pouvoir discriminant des items, si ce n'est, au mieux, peut-être en triant ce qui est supérieur à la moyenne de ce qui est inférieur à la moyenne. -moyenne.
  • Augmentez la taille de l’échantillon testé. Quel que soit le nombre d’items dont vous disposez ou la qualité de la discrimination de vos items, s’il n’y a pas suffisamment de sujets présentant différents niveaux de capacités, la fiabilité du test peut être gravement sous-estimée.

Validité et sa mesure

Pour que le test ait une utilité pratique, il doit non seulement être fiable, mais également valide. Une définition traditionnelle de la validité d'un appareil de mesure est la mesure dans laquelle lequel il mesure ce qu'il a été conçu mesurer.

Autrement dit, si un test a été conçu pour mesurer l'aptitude musicale, par exemple, un test valide ne mesure que cela, et non une ou plusieurs autres variables superflues.

Lorsque vous montez sur la balance, vous voulez connaître votre poids, pas votre QI ou toute autre qualité inconnue.

Dans l'usage scientifique, une mesure d'un phénomène donné (tel que désigné par un concept donné) est considérée comme une mesure valide si elle mesure avec succès le phénomène.

Il semble clair que la définition de la validité comporte deux parties ;

  1. que l'appareil de mesure mesure le concept en question et non certains autres concepts ;
  2. que le concept est mesuré avec précision.

On peut avoir le premier sans le second mais pas l'inverse (le concept ne peut pas être mesuré avec précision si un autre concept est mesuré).

Pour clarifier le concept plus clairement, supposons que nous souhaitions mesurer le QI et qu'Afra ait certainement un certain niveau réel de QI (disons 110).

Nous pouvons construire un test qui mesure son QI, mais avec un certain degré d’erreur.

Autrement dit, il mesure son intelligence à 100 alors qu’elle est à 110.

Il ne fait aucun doute qu’un tel test mesure le bon concept (QI) et a le potentiel d’être une mesure valide si nous pouvons l’affiner pour éliminer l’erreur de mesure.

D’un autre côté, si nous souhaitons mesurer l’intelligence d’Afra, nous pouvons concevoir un test qui ne mesure pas du tout l’intelligence.

Un tel test ne peut jamais être une mesure valide de l'intelligence, car il mesure un autre concept (comme ses compétences, ou peut-être ne mesure rien du tout), plutôt que de mesurer l'intelligence comme nous l'avions prévu.

La difficulté est que ce test peut encore donner un score numérique, et pourrait même donner un score de 110 pour Afra.

Cependant, elle n’est toujours pas valable car elle ne mesure pas le phénomène recherché.

Il devient donc très important de pouvoir évaluer la validité des tests, car tous donneront une sorte de score, mais cela ne signifie pas nécessairement que la mesure est valide.

Par définition, si une mesure est valide, elle sera exacte à chaque fois, et donc également fiable, mais l’inverse n’est pas vrai. Il s’agit d’une mesure fiable qui n’est peut-être pas valide.

Une autre manière de formuler la même affirmation est que la fiabilité est une condition nécessaire mais non suffisante de validité.

La validité de la mesure peut être considérée globalement de deux manières : la validité interne et la validité externe.

Validité interne cherche à déterminer s’il existe une différence dans une comparaison donnée. Il demande si une différence apparente peut être attribuée au même artefact de mesure.

Si l’on ne rencontre pas de contradictions dans les données d’une expérience donnée, alors l’étude est dite avoir une validité interne. Des résultats contradictoires signalent l’absence de validité interne.

Validité externe C'est le problème de l'interprétation de la différence, le problème de la généralisation de la recherche expérimentale.

Même si une validité interne est présente, les résultats ne sont pas considérés comme ayant une validité externe à moins qu'ils ne soient considérés comme valables pour des situations (externes) supplémentaires en plus de l'étude originale qui a généré les résultats.

De nombreuses formes de validité sont mentionnées dans la littérature scientifique, et leur nombre augmente à mesure que l’on s’intéresse davantage à des mesures plus scientifiques.

Une classification acceptée se compose de quatre formes principales ;

  1. validité apparente.
  2. validité du contenu,
  3. validité liée aux critères, et
  4. la validité de construction.

Nous en discutons brièvement.

Validité apparente

La méthode de test de validité la plus élémentaire consiste à examiner attentivement la mesure d'un concept à la lumière de sa signification et à se demander sérieusement si l'appareil de mesure semble mesurer le concept sous-jacent. Cette forme d’examen et d’examen minutieux est appelée validité apparente.

La validité apparente est basée sur l'apparence générale du test ; en tant que tel, un test aura plus de validité apparente si son apparence et sa convivialité sont cohérentes avec le concept étudié.

Du point de vue des tests, il est vraiment important d'avoir un test qui semble en surface pouvoir exploiter la caractéristique étudiée.

Cette apparence superficielle du test peut motiver les candidats, en particulier lorsque le test produit une hypothèse de pertinence.

Par exemple, un test permettant de mesurer l'aptitude d'une personne à bancaire pourrait être plus réaliste et motivant s'il posait des questions sur les bilans et les paiements d'intérêts, plutôt que, par exemple, sur la moyenne au bâton d'un certain joueur de cricket.

Ce qui est important dans le contexte de l'invalidité, c'est qu'un test a une validité apparente si les éléments sont raisonnablement liés à l'objectif perçu du test.

La validité apparente reflète le contenu en question.

On l'évalue simplement en demandant à d'autres personnes si la mesure semble s'attaquer au concept qui est au centre de l'attention.

En d’autres termes, il pourrait être demandé à des personnes, éventuellement expérimentées ou expertes dans un domaine donné, de jouer le rôle de juges pour déterminer si, à première vue, la mesure semble refléter le concept concerné.

La validité apparente est donc essentiellement un processus intuitif qui juge si l'instrument de mesure parvient au concept de manière adéquate.

Validité du contenu

Validité du contenu cherche à déterminer si les indicateurs empiriques (tests, échelles, questions, etc.) représentent pleinement le domaine du concept sous-jacent étudié.

En ce sens, la validité du contenu concerne la mesure dans laquelle le contenu d’un ensemble d’éléments représente de manière adéquate l’univers ou le domaine de tous les éléments pertinents étudiés.

Dans la mesure où les éléments reflètent le domaine complet du contenu, ils peuvent être considérés comme étant valides au niveau du contenu.

La détermination de la validité du contenu relève du jugement et peut être abordée de plusieurs manières. Deux des approches sont :

  • Le concepteur peut le déterminer en définissant soigneusement le sujet de préoccupation, les éléments à mettre à l'échelle et les échelles à utiliser. Ce processus logique est souvent intuitif et propre à chaque concepteur de recherche.
  • On peut faire appel à un panel de personnes pour juger dans quelle mesure l'instrument répond aux normes.

Les problèmes majeurs de validité du contenu surviennent lorsque

  • Il n’existe pas de consensus sur la définition des concepts à mesurer.
  • Le concept est multidimensionnel composé de plusieurs sous-concepts
  • La mesure est longue et complexe.

La validité critère, appelée diversement validité pragmatique, validité concurrente ou validité prédictive, implique plusieurs mesures du même concept.

Le terme validité concurrente a été utilisé pour décrire une mesure valable pour mesurer un phénomène particulier en même temps que la mesure est administrée. En revanche, validité prédictive concerne les performances futures sur le critère. Ces deux mesures ne diffèrent donc que dans une perspective temporelle.

La validité prédictive concerne la capacité d'une échelle ou d'un instrument à prévoir un critère futur et la validité concurrente, la capacité à décrire un critère présent.

Regardez les cas suivants :

  • Un questionnaire d'opinion est conçu pour prévoir les résultats d'une élection syndicale des employés de banque. Notre préoccupation est d'évaluer dans quelle mesure le questionnaire prévoit correctement les résultats de l'élection. Plus le questionnaire prévoit les résultats avec précision, plus il possède de validité prédictive.
  • Une étude observationnelle est menée pour classer les familles selon qu'elles ont un revenu faible, moyen et élevé. Le degré auquel l’étude peut classer correctement ces familles représente la validité concurrente.
  • Un questionnaire est conçu pour identifier les personnes souffrant de troubles psychiatriques. La validité du questionnaire pourrait être déterminée en comparant ses diagnostics avec ceux posés par un psychiatre sur la base d'une investigation clinique. Les deux approches conduisent respectivement à une validité prédictive et une validité concurrente.

L'opinion, le revenu et les conditions psychiatriques dans les exemples ci-dessus sont les critères que nous utilisons pour mesurer la validité des instruments de mesure.

Les évaluations des performances, les unités produites au cours d'une certaine période, le montant des ventes et le nombre d'erreurs commises dans un document de saisie sont quelques autres exemples de critères.

Une fois la spécification du test établie et les scores des critères obtenus, ils peuvent être comparés. L’approche habituelle consiste à les corréler en utilisant la corrélation produit-moment.

Par exemple, nous pourrions corréler les résultats des tests d'un groupe d'étudiants universitaires et la moyenne pondérée cumulative de ces étudiants au cours de leur première année d'université et considérer ce coefficient comme un coefficient de validité.

Les coefficients de validité ont généralement tendance à être bien inférieurs au coefficient de fiabilité (dans la plage de 0,40 à 0,60 avec une valeur médiane de 0,50),

La validité de construction

La validité liée aux critères est basée sur des preuves empiriques (telles que les scores, les revenus et les notes) pour servir de base pour juger que ce qui est mesuré mesure ce qu'il est censé mesurer (capacité prédictive).

Il s’agit d’une forme de validité empirique, dans laquelle certaines preuves observables peuvent être utilisées pour confirmer la validité d’une mesure.

Cependant, lorsqu’il n’existe ni critère ni univers de contenu accepté définissant la qualité mesurée, la validité liée au critère ne peut pas être utilisée pour tester la validité.

La difficulté d'appliquer des tests de validité rigoureux et objectifs à la mesure de l'attitude, par exemple, vient du fait que cette mesure est invariablement indirecte dans le sens où l'attitude est déduite des déclarations ou des réponses verbales.

Une attitude est une abstraction et il est généralement impossible d’évaluer directement sa validité. Une approche pour cette situation est celle de la validité de construction.

Les tests d'attitude, d'aptitude et de personnalité concernent généralement des concepts de cette catégorie.

La validité de construit repose sur la formulation d'hypothèses sur les concepts mesurés, puis sur le test de ces hypothèses et la corrélation des résultats avec la mesure initiale.

Voici un Procédure en 3 étapes pour tester la validité conceptuelle des mesures :

  • Précisez d’abord la relation théorique entre les concepts eux-mêmes.
  • Examiner la relation empirique entre les mesures des concepts.
  • Interprétez les preuves empiriques en fonction de la manière dont elles clarifient la validité conceptuelle d’une mesure particulière.

Supposons que nous développions deux indices pour mesurer la classe sociale et que nous appelions ces indices indice-1 et indice-2.

Supposons que nous ayons une théorie contenant une hypothèse selon laquelle il existe une relation inverse entre la classe sociale et la criminalité : à mesure que la classe sociale augmente, la criminalité diminue.

Supposons que cette hypothèse ait été testée en mesurant la classe sociale par l'indice-1 et qu'elle ait été établie par des tests statistiques.

La validité de construit consiste à remplacer l'index-1 par l'index-2 en théorie et à retester l'ensemble de la théorie. Si nous obtenons les mêmes résultats pour l’ensemble de la théorie (en particulier pour l’hypothèse contenant l’indice-2) que lorsque nous avons utilisé l’indice 1 pour mesurer la classe sociale, alors nous disons que la nouvelle mesure (indice-2) a une validité de construit.

Les types de validations discutés jusqu'à présent peuvent être considérés comme une accumulation, chacun des types de validation suivants comprenant tous les éléments de tous les types précédents, ainsi que quelques nouvelles fonctionnalités.

En d’autres termes, la validation de construction nécessite plus d’informations que la validation de critères, et la validation de critères nécessite plus d’informations que la validation de contenu ou de visage.

Pour cette raison, la validation de construction est souvent considérée comme la procédure de validation la plus solide. En résumant les différents types de tests de validité pour évaluer leur efficacité en recherche sociale, Zeller et Carmines concluent que la validité conceptuelle est la plus utile et la plus applicable aux sciences sociales.

Pour conclure, il faut noter que la fiabilité et la validité des mesures ne sont pas des caractéristiques invariantes. Ils sont toujours spécifiques à une population, une époque et un objectif particuliers.

Dans une situation donnée, le chercheur doit donc décider quel degré de manque de fiabilité et d'invalidité il considère comme acceptable.

Analyse de la variance dans l'estimation de la fiabilité

Les techniques bien connues d’analyse de variance peuvent être appliquées pour évaluer la fiabilité des tests de cohérence interne. Cette technique peut être utilisée pour établir rtt un pour la situation dans laquelle les items sont notés de manière dichotomique (vrai-faux, d'accord-pas d'accord) et un dans lequel les items sont notés sur une échelle d'intervalle. Nous illustrons la méthode uniquement avec les données dichotomiques.

La méthode présentée ici est due à Cyril Hoyt, grand statisticien, et est communément connue sous le nom de Méthode Cyril Hoyt. Nous illustrons cette méthode par exemple.

Les étapes suivantes sont impliquées dans le calcul du coefficient de fiabilité.

Exemple:-

Un spécialiste a créé un test de timidité en quatre éléments et l'a soumis à un échantillon aléatoire de cinq sujets. Le test est noté uniquement selon que l'item indique ou non de la timidité. La note a été de 1 pour la timidité et de 0 pour l'absence de timidité (voir les données ci-dessous). À l’aide de la technique ANOVA, estimez la fiabilité de la cohérence interne du test.

analyse de variance dans l'estimation de la fiabilité

Construire des échelles de mesure

Les échelles sont au cœur du sujet de la mesure dans la recherche sociale. Une échelle fait référence à un élément ou à un ensemble d'éléments (indicateurs) permettant de mesurer une caractéristique ou une propriété, telle qu'une attitude.

La mise à l'échelle est une procédure permettant d'attribuer des nombres à une propriété d'objets afin de conférer certaines des caractéristiques des nombres aux propriétés en question.

Ainsi, vous pouvez concevoir une échelle pour mesurer la durabilité (propriété) de la peinture.

Dans un autre contexte, vous pouvez juger de la capacité de supervision (propriété) d'une personne en demandant à un groupe de pairs d'évaluer cette personne sur diverses questions (indicateurs) que vous créez.

Vous pouvez également mesurer le score de QI (propriété) d'une personne en lui posant des questions prédéfinies (indicateurs).

Une échelle représente généralement un concept ou un concept complexe unique qui combine plusieurs indicateurs en une mesure composite commune.

La raison pour laquelle les échelles sont largement utilisées dans les sciences sociales est que bon nombre des concepts que les chercheurs en sciences sociales souhaitent étudier ne peuvent être mesurés avec un seul indicateur.

Des concepts comme la religiosité sont trop multidimensionnels pour être mesurés avec un seul élément.

Quand de tels concepts sont de intérêt, une échelle ou un indice peut être développé pour tenter d’incorporer les nombreuses facettes de la variable abstraite dans un ensemble d’indicateurs représentant sa définition opérationnelle.

Les échelles sont de deux types : notation ou classement. Échelles de notation ont plusieurs catégories de réponses et sont également appelés échelles de catégories.

Ils sont utilisés lorsque les répondants notent un objet ou une attitude sans le comparer directement à un autre objet ou une autre attitude.

Par exemple, il peut être demandé aux personnes interrogées d'évaluer le style d'une nouvelle chaussure ou la qualité d'un vêtement sur une échelle de cinq points : excellent, bon, moyen, inférieur à la moyenne et médiocre, ou la fréquence des visites d'un agent de santé communautaire : toujours, souvent, occasionnellement, rarement et jamais.

Les échelles de classement font des comparaisons entre deux ou plusieurs attitudes ou objets. Les personnes interrogées selon cette méthode comparent deux objets ou plus et choisissent parmi eux.

Par exemple, les personnes interrogées peuvent exprimer leur attitude en faisant un choix entre deux marques de voiture.

Dans une telle mise à l'échelle, on peut également suivre l'ordre de classement. Dans le cadre de cette approche, les répondants sont invités à classer leurs choix en fonction de l'importance des objets.

Les échelles peuvent à nouveau être unidimensionnelles ou multidimensionnelles. Avec un mise à l'échelle unidimensionnelle, on tente de mesurer un attribut du répondant ou de l'objet.

Une mesure du potentiel des employés est la promotion. Le gestionnaire peut décider d'identifier les performances techniques du salarié en vue d'une promotion. C'est une seule dimension.

Plusieurs éléments peuvent être utilisés pour mesurer cette dimension, et en les combinant en une seule mesure, un gestionnaire peut placer les employés le long d'un continuum linéaire de promotion.

Échelle multidimensionnelle reconnaît qu'un objet peut être mieux décrit dans un attribut de n dimensions plutôt que sur un continuum unidimensionnel.

La variable de promotion des employés pourrait être mieux exprimée par trois dimensions distinctes : la performance managériale, la performance technique et le travail d'équipe.

Vous devez connaître la fiabilité et la validité des mesures.

Quelle est la fonction principale de la mesure dans toute discipline scientifique ?

La fonction première de la mesure est d'attribuer des numéros à des objets ou à des événements selon certaines règles. Il organise les données empiriques dans une relation systématique avec le concept étudié.

Quelles sont les trois principales raisons identifiées par Bryman pour la préoccupation relative à la mesure dans la recherche quantitative ?

Les trois raisons principales sont :

  1. La mesure nous permet de délimiter de fines différences entre les personnes concernant les caractéristiques en question.
  2. La mesure fournit un dispositif ou un critère cohérent pour faire des distinctions.
  3. La mesure offre la base d'estimations plus précises de la relation entre les concepts, par exemple grâce à l'analyse de corrélation.

Qu’est-ce que l’erreur de mesure et comment s’exprime-t-elle par rapport aux scores observés et aux scores réels ?

L'erreur de mesure fait référence aux erreurs introduites dans notre mesure. La formulation centrale de la théorie de la mesure stipule qu'une mesure observée (score) est égale au score réel plus une certaine erreur qui se produit au cours du processus d'observation. Il s'exprime comme suit : X (score observé) = T (score réel) + e (erreur de mesure).

Quels sont les trois types d’erreurs susceptibles d’être générées lors du processus de mesure ?

Les trois types d'erreurs sont :

  1. (1) Erreur aléatoire : apparaît comme une variation inexpliquée et se produit de manière aléatoire.
  2. (2) Erreur systématique : surestime ou sous-estime systématiquement la valeur réelle en raison de facteurs tels que des procédures de recherche défectueuses.
  3. (3) Erreur situationnelle : se produit en raison de caractéristiques personnelles particulières ou de circonstances particulières qui influencent le processus de mesure.

Comment la fiabilité est-elle définie dans le contexte de la mesure ?

La fiabilité est la mesure dans laquelle une procédure de mesure produit des résultats similaires ou cohérents lorsqu'elle est répétée dans des conditions similaires.

Quelles sont les quatre principales formes de tests de validité ?

Les quatre principales formes de tests de validité sont :

  1. Validité apparente,
  2. Validité du contenu,
  3. Validité critériée,
  4. La validité de construction.

Quelle est la différence entre la validité interne et la validité externe ?

La validité interne cherche à déterminer s'il existe une différence dans une comparaison donnée et si la différence observée peut être attribuée à l'artefact de mesure. La validité externe concerne la généralisation des résultats de la recherche, déterminant s'ils sont valables pour des situations supplémentaires au-delà de l'étude originale.