Échelle de Guttman (échelle cumulative) : définition, exemple

Définition de l'échelle de Guttman, exemple

Dans les enquêtes statistiques menées à l'aide d'entretiens ou de questionnaires structurés, un sous-ensemble d'éléments d'enquête ayant des réponses binaires (par exemple, oui ou non) forme une échelle de Guttman (du nom de Louis Guttman) ; s'ils peuvent être classés dans un certain ordre, de sorte que pour un répondant rationnel, le modèle de réponse puisse être capturé par un seul indice sur cette échelle ordonnée.

En d’autres termes, sur une échelle de Guttman, les items sont disposés de telle sorte qu’un individu qui est d’accord avec un item particulier est également d’accord avec les items de rang inférieur.

Par exemple, une série d'éléments pourrait être

  1. Je suis prêt à être près de la glace ;
  2. Je suis prêt à sentir la crème glacée ;
  3. Je suis prêt à manger de la glace ; et
  4. J'adore manger de la glace.

L'accord avec n'importe quel élément implique l'accord avec les éléments d'ordre inférieur.

Cela contraste avec les sujets étudiés à l'aide d'une échelle de Likert ou d'une échelle de Thurstone. La méthode de mise à l'échelle conçue par Guttman est également appelée analyse par scalogramme.

Définition de l'échelle de Guttman, exemple

Un exemple bien connu d’échelle de Guttman est l’échelle de distance sociale de Bogardus, qui se présente comme suit :

  1. Êtes-vous prêt à permettre aux immigrants de vivre dans votre pays ?
  2. Êtes-vous prêt à permettre aux immigrants de vivre dans votre communauté ?
  3. Êtes-vous prêt à permettre aux immigrants de vivre dans votre quartier ?
  4. Êtes-vous prêt à permettre aux immigrants de vivre à côté de chez vous ?
  5. Permettez-vous à votre enfant d’épouser un immigrant ?

L’échelle de Guttman s’applique également à une série d’items dans d’autres types de tests, tels que les tests de réussite à résultats binaires.

Par exemple, un test de réussite en mathématiques peut classer les questions en fonction de leur difficulté et demander au candidat de commencer par le milieu.

L'hypothèse est que si le candidat peut répondre avec succès aux éléments de cette difficulté (par exemple, additionner deux nombres à 3 chiffres), il sera capable de répondre aux questions précédentes (par exemple, additionner deux nombres à 2 chiffres).

Certains tests de réussite sont organisés selon une échelle de Guttman afin de réduire la durée du test.

En concevant des enquêtes et des tests contenant des échelles de Guttman, les chercheurs peuvent simplifier l'analyse des résultats des enquêtes et augmenter la robustesse.

Les échelles de Guttman permettent également de détecter et d'éliminer les modèles de réponses aléatoires, comme peuvent l'être les répondants peu coopératifs.

Une échelle de Guttman hypothétique et parfaite se compose d’un ensemble unidimensionnel d’éléments classés par ordre de difficulté, de la position la moins extrême à la plus extrême.

Par exemple, une personne obtenant un « 7 » sur une échelle de Guttman à dix éléments sera d’accord avec les éléments 1 à 7 et en désaccord avec les éléments 8, 9 et 10.

Une propriété importante du modèle de Guttman est que l'ensemble des réponses d'une personne à tous les éléments peut être prédit à partir de son score cumulé, car le modèle est déterministe.

Un objectif important de la mise à l'échelle de Guttman est de maximiser la reproductibilité des modèles de réponse à partir d'un score unique.

Une bonne échelle de Guttman devrait avoir un coefficient de reproductibilité (le pourcentage de réponses originales qui pourraient être reproduites en connaissant les scores de l'échelle utilisés pour les résumer) supérieur à 0,85.

Une autre mesure couramment utilisée pour évaluer la qualité d'une échelle de Guttman est le coefficient d'évolutivité et le coefficient d'homogénéité de Menzel (Loevinger, 1948 ; Cliff, 1977 ; Krus et Blackman, 1988).

Pour maximiser l'unidimensionnalité, les éléments inappropriés sont réécrits ou supprimés.

Une échelle est dite unidimensionnelle si les réponses s’inscrivent dans un modèle parfait dans lequel l’approbation de l’item reflétant la position extrême entraîne également l’approbation de tous les items moins extrêmes.

Avec la technique de Guttman, le « parfait » implique qu'une personne qui répond favorablement à une question donnée aura un score plus élevé qu'une personne qui y répond défavorablement.

Dans cette situation, le nombre d'éléments approuvés par un répondant, donnant une image complète des éléments avec lesquels il était d'accord et en désaccord, sert de score.

Si une combinaison de scores autre que la combinaison souhaitée forme un score d’échelle particulier, cela est considéré comme une erreur. L’échelle est inadéquate s’il existe de nombreuses erreurs d’échelle ou exceptions au modèle souhaité.

L’atteinte d’un degré plus élevé d’unidimensionnalité est la préoccupation majeure de l’échelle de Guttman.

Cependant, l’échelle de Guttman appartient à la grande catégorie des échelles cumulatives.

Il est cumulatif dans le sens où les réponses combinées requises pour obtenir un score particulier incluent les réponses à toutes les questions requises pour obtenir le score immédiatement inférieur, plus la réponse à une question supplémentaire, de manière progressive.

Selon Guttman, un « univers de contenu » ne peut être considéré comme unidimensionnel que s'il produit une échelle cumulative parfaite ou presque parfaite.

Supposons qu'une enquête soit menée auprès de 100 personnes interrogées sur l'opinion d'une nouvelle marque de chemise étiquetée « Union ».

Un score permet de déterminer quel élément est approuvé par le répondant. Nous avons peut-être développé une échelle de préférence de 4 éléments comme suit :

Échelle de Guttman

Par exemple, une personne avec un score de 3 devrait être en désaccord avec l’item 4 mais d’accord avec tous les autres. Un score de 4 indique que toutes les déclarations sont acceptées et représentent l'attitude la plus favorable.

Selon la théorie du scalogramme, ce modèle confirme que l’univers du contenu (attitude envers un étudiant en difficulté) est évolutif.

Comment un score est-il attribué à un individu ?

Une solution générale couramment utilisée consiste à attribuer à chaque individu un score égal au nombre d’items qu’il approuve.

Les répondants qui ont participé à l'enquête indiquent s'ils sont d'accord ou en désaccord avec leurs opinions.

Si ces items forment une échelle unidimensionnelle, le modèle de réponse formera une échelle cumulative parfaite du type suivant :

modèle de réponse du scalogramme structure d'échelle idéale

Dans le cas d’un modèle imparfait, les répondants agiront différemment.

Un tel motif sera désigné comme motif sans échelle. Le nombre de répondants correspondra au reste de ceux qui ont suivi le modèle d'échelle comme dans le tableau ci-dessus.

S'il y a 100 personnes participant à l'étude et que 65 d'entre elles ont répondu selon le modèle d'échelle, alors les 35 autres ont répondu différemment, ce qui a donné lieu à un modèle sans échelle, que nous catégorisons comme des erreurs.

Les réponses de ce modèle peuvent être les suivantes :

modèle de réponse du scalogramme, structure sans échelle

Dans la technique de Guttman, l’échelle parfaite implique qu’une personne qui répond favorablement à une question donnée aura un score total plus élevé qu’une personne qui y répond défavorablement. Dans le premier tableau, les quatre modèles de réponse forment un modèle scalaire.

Supposons que toutes les réponses fournies par les répondants forment un modèle scalaire (auquel cas il n’y en aura aucune pour former le deuxième tableau).

Dans ce cas, on dit que les éléments forment une échelle parfaite, et l’échelle résultante a été qualifiée par Guttman de « parfaitement reproductible ».

Dans le deuxième tableau, les quatre lignes constituent les modèles sans échelle, et chacun de ces modèles est associé à l'erreur.

L’échelle de Guttman est analytiquement complexe, mis à part le fait qu’il n’y a aucune garantie que les différents éléments évolueront. Même s’ils le font, l’univers du contenu peut être restreint en termes de couverture.

Cette méthode est plus appropriée pour mettre à l’échelle un comportement ordonné que des attitudes moins structurées et plus larges.

La reproductibilité du score de Guttman peut être examinée par ce que l'on appelle le coefficient de reproductibilité (CR.). Plus la valeur du coefficient est élevée, plus la proportion de scores que nous pouvons reproduire avec précision est élevée.

Le coefficient est calculé en soustrayant la proportion de réponses qui sont des erreurs de 100 pour cent (toutes les réponses). La formule à utiliser est :

coefficient de reproductibilité

Une autre façon d'exprimer CR. c'est-à-dire que la proportion de réponses peut être correctement prédite à partir du score total des individus.

Un coefficient de reproductibilité peut également être calculé pour chaque élément individuellement en tant que proportion de réponses à cet élément qui sont correctement prédites ; CR. est la moyenne simple de ces coefficients d’éléments.

Dans l'exemple précédent, E=35, N=100, n=4, de sorte que ;

exemple de coefficient de reproductibilité

Tout coefficient de reproductibilité supérieur à 0,90 est censé indiquer l'évolutivité et la capacité à reproduire les réponses aux différents items à partir de la connaissance du score total.

Cependant, comme le note Edwards (1957 : 191), un CR. de 0,90 n'est pas une condition suffisante pour l'évolutivité d'un ensemble d'instructions.

Échelle cumulative

Sur une échelle cumulative, un répondant se voit poser plusieurs questions pour exprimer son accord ou son désaccord sur une question.

Les items sont disposés de telle sorte qu'un répondant qui répond favorablement à l'item 2 répond également favorablement à l'item 1, et celui qui répond favorablement à l'item 3 répond également favorablement aux items 1 et 2, et ainsi de suite.

En d’autres termes, cela suppose un ensemble cumulatif de scores.

Ainsi, les individus qui répondent favorablement ont un score total plus élevé que ceux qui répondent défavorablement.

Le score d'un individu est calculé en comptant le nombre d'items auxquels il répond favorablement. Ses scores indiquent une position particulière sur l'échelle. Les intervalles entre les positions peuvent ne pas être égaux.

Les éléments peuvent être disposés du favorable au défavorable d'une manière systématique ou peuvent être sélectionnés au hasard.

Le type d'échelle cumulative a été utilisé avec succès par Bogardus en premier, également connu sous le nom d'échelle de distance sociale de Bogardus.

L’objectif principal de cette gale est de mesurer l’attitude envers un groupe ou une ethnie particulière.

Plusieurs relations suggérées peuvent être répertoriées, auxquelles les membres d'un groupe ethnique (par exemple) peuvent être acceptés. Le répondant doit indiquer quel groupe racial il acceptera pour chacune des relations spécifiées.

L'attitude se mesure par la proximité de la relation qu'un répondant est prêt à accepter ou par la distance sociale qu'il aime maintenir.

Le répondant doit encercler chacune des sept catégories dans lesquelles il est prêt à accepter un groupe particulier. Cela permet de connaître les premières réactions du répondant. Une échelle de type Bogardus est illustrée par un exemple ci-dessous :

exemple d'échelle cumulée

Les sept catégories indiquent une distance sociale progressivement croissante. Pour un groupe, si un répondant encercle le 3′, il est très probable qu'il encercle le « 4 » et le « 5 » pour le même groupe. Si le répondant n’entoure pas « 3 »,

il n'encerclera probablement pas « 1 » et « 2 », ce qui indique une relation encore plus étroite pour le même groupe.

Le score du répondant sera le nombre d’éléments qu’il aura encerclés. A partir de ce score, il est possible de déterminer lequel des items le répondant a choisi.

Dans l'échelle de type Bogardus, le répondant doit indiquer son premier sentiment. Il doit réagir à chaque course en tant que groupe et non en tant que membre individuel du groupe.

La distance de l'échelle peut également être calculée mathématiquement. Pour ce faire, des pondérations sont attachées à différentes catégories de relations.

Ainsi, s'il n'y a que 5 catégories, les poids tels que 1, 2, 3, 4 et 5 peuvent être attribués respectivement aux 5 premières catégories.

La procédure suivante est généralement adoptée pour la mesure de la distance sociale :

  • Placez les poids et le pourcentage de réponse pour chaque catégorie en lignes.
  • Multipliez le pourcentage de réponse par son poids
  • Additionnez le produit et ce sera la distance sociale requise.

Un problème soulevé par cette forme d’échelle est qu’il n’existe aucun moyen de déterminer la distance réelle entre les différents points de l’échelle, et certains points semblent être plus éloignés du point voisin que d’autres.

Les scores sont cependant traités comme équidistants. Néanmoins, une telle échelle – et de nombreuses versions – peut être utile si nous étudions les attitudes envers des groupes d’« autres ».

Qu’est-ce que la fiabilité des formulaires parallèles ?

La fiabilité des formes parallèles, également connue sous le nom de fiabilité des formes alternatives, est une mesure de fiabilité utilisée dans les tests psychométriques pour évaluer la cohérence des résultats obtenus à partir de différentes versions de tests destinées à mesurer le même concept.

Comment la fiabilité des formulaires parallèles est-elle établie ?

Pour établir la fiabilité des formulaires parallèles, deux ou plusieurs versions différentes d'un test sont créées, chacune contenant des éléments différents mais conçues pour évaluer le même concept sous-jacent. Le coefficient de fiabilité est calculé en administrant les deux formes du test à un échantillon d'individus et en corrélant leurs scores sur les deux formes.

Quelles sont les méthodes utilisées pour établir la fiabilité des formulaires parallèles ?

Les méthodes courantes incluent le Méthode divisée en deux, où un seul test est divisé en deux moitiés et leurs scores sont corrélés ; la méthode d'équivalence de forme, où deux formes différentes d'un test sont administrées et leurs scores sont corrélés ; et la méthode de contrepoids, où plusieurs formulaires sont administrés à différents sous-groupes de participants dans un ordre contrebalancé.

En quoi la fiabilité des formulaires parallèles diffère-t-elle de la fiabilité divisée en deux ?

Alors que les deux évaluent la cohérence d'un test, la fiabilité des formes parallèles implique d'administrer deux formes différentes d'un test au même groupe de participants, tandis que la fiabilité divisée en deux implique de diviser un seul test en deux moitiés et de corréler les scores des deux moitiés.

Quels sont les avantages de la fiabilité des formulaires parallèles ?

La fiabilité des formes parallèles peut éviter les problèmes inhérents aux tests-retests et garantit que les changements dans les scores reflètent le concept mesuré plutôt que dus aux effets de la pratique ou à la familiarité avec les éléments.

Quels sont les inconvénients potentiels de la fiabilité des formulaires parallèles ?

Certaines limitations incluent les difficultés liées au développement de formulaires véritablement parallèles, le temps et les ressources nécessaires à la création de plusieurs versions de test et le potentiel d'effets d'ordre. De plus, il n’est pas garanti que les deux versions de test soient aussi difficiles.

Dans quelles situations la fiabilité des formulaires parallèles est-elle couramment appliquée ?

Il est utilisé dans le développement de tests, pour contrecarrer les effets de la pratique, pour l'équivalence entre langues ou cultures, dans les manipulations expérimentales, les tests pédagogiques, les tests psychométriques, les évaluations cliniques, la recherche interculturelle, les études expérimentales et la sélection du personnel.