Medidas de Associação: Definição, Método

Medidas de Associação: Definição, Método

A escolha de um teste estatístico para descrever a força das relações entre as variáveis dependerá em grande parte do nível de medição. As medidas estatísticas da força do relacionamento são chamadas de coeficiente de associação ou coeficiente de correlação.

O primeiro termo é geralmente usado quando as variáveis são nominalmente medidas e exibidas em uma tabela de contingência.

Medidas de associação baseadas no qui quadrado

O último termo é geralmente usado para variáveis medidas em pelo menos uma escala intervalar (numérica). Por exemplo, se calcularmos phi (discutido abaixo) para duas variáveis nominalmente medidas (digamos, por exemplo, sexo e cor dos olhos), chamamos phi de medida de associação.

Por outro lado, se calcularmos r (discutido num capítulo anterior) para as variáveis numéricas (por exemplo, idade e IMC), chamamos coeficiente de correlação ra. Nas secções seguintes, discutiremos estas medidas separadamente, começando primeiro pelas medidas de associação.

Coeficiente Phi

O coeficiente Phi (^) é provavelmente o coeficiente de associação mais popular para tabelas de contingência 2×2. Este coeficiente também é chamado de coeficiente de ponto quádruplo. A fórmula para calcular ^ é

O coeficiente Phi (^) varia de 0 a 1,0 e tenta corrigir o qui-quadrado proporcionalmente não, o número total de casos.

O coeficiente não sugere se uma variável causa a outra, nem há indicação da direção da relação. Como você pode ver, o cálculo de <j> é simples quando temos a tabela de contingência.

V de Cramer

O V de Cramer é uma modificação de 0 para tabelas maiores e tem um intervalo de até 1,0 para tabelas de qualquer dimensão. É computado onde k é o menor número de linhas ou colunas. Para uma melhor compreensão da fórmula acima, vamos reescrevê-la como

Coeficiente de Contingência

O coeficiente de contingência foi desenvolvido com tabelas quadradas com mais de duas linhas e colunas, por exemplo, tabelas 3×3 ou 4×4. É calculado como;

Medidas de Associação: Definição, Método

O coeficiente de contingência C é igual a 0 quando as variáveis são independentes. Seu valor máximo é sempre menor que 1 e é determinado pelo número de linhas e colunas da tabela. O valor máximo para uma mesa quadrada (2×2 ou 3×3) é calculado usando a equação;

Medidas de Associação: Definição, Método

onde k é igual ao número de linhas ou colunas, o que for menor. Para uma mesa 2×2, o valor máximo seria alcançado com k=2:

Medidas de Associação: Definição, Método

Para uma tabela 3×3, o valor máximo seria 0,816.

Uma desvantagem do coeficiente de contingência, quando as variáveis não são independentes nem perfeitamente relacionadas, é a dificuldade de compará-lo para tabelas de tamanhos desiguais quando R não é igual a c.

As flutuações do valor máximo de C levaram ao uso do V de Cramer, que pode ser usado com tabelas quadradas e não quadradas de qualquer dimensão. V varia de 0 quando as variáveis são independentes a 1 quando estão perfeitamente relacionadas.

Tal como acontece com C e V, ϕ requer apenas dados de nível nominal e nos fornece uma medida da força, mas não da direção da associação, uma vez que o sinal será sempre positivo.

O V de Cramer é a mais versátil das três medidas da associação, pois seu intervalo é sempre de 0 a 1, podendo ser utilizado para uma tabela de qualquer dimensão.

Exemplo de coeficiente de contingência

A tabela a seguir mostra a relação entre o nível de escolaridade das mães e o grau de desnutrição entre 150 crianças menores de cinco anos numa cidade. Calcule C, V e ϕ para interpretar os resultados

Grau de desnutriçãoBaixoModeradoAltoTotal
Baixo5103550
Moderado1530550
Alto30101050
Total505050150
Nível educacional das mães

O valor X2 foi calculado como 66, o que é altamente significativo (p<0,001). Com base neste valor, calculamos outras medidas:

Medidas de Associação: Definição, Método

O coeficiente de contingência C= 0,55 leva a concluir que existe uma relação moderadamente forte entre o nível de escolaridade e a desnutrição, uma vez que o valor máximo para C numa tabela 3×3 é 0,816.

A análise dos dados da tabela mostra também que os entrevistados que concluíram o ensino superior tendem a ter filhos com baixo grau de desnutrição.

Enquanto V varia entre 0 e 1, V = 0,47 indica um moderado relação entre as variáveis sob investigação. Com dados ordinais, existem vários métodos alternativos para medir a associação.

Entre outros, gama, lambda, Kendal tau, Somer's d Cuentas por pagar e, portanto, passamos para alguns métodos usados com frequência.

O teste do qui-quadrado informa se existe uma relação entre duas variáveis, mas não nos diz qual é a relação. Isto é conseguido através da análise de correlação.

Tal análise mostra-nos como determinar a natureza e a força da relação entre duas variáveis.

O Rho de Spearman (ré) correlação é uma medida ordinal popular e amplamente utilizada correlaciona classificações entre duas variáveis ordenadas.

Quando ambas as variáveis são medido em uma escala numérica (por exemplo, peso, altura), a medida de associação mais comumente usada é o coeficiente de correlação produto-momento da pessoa (r).

Qual é a diferença entre um coeficiente de associação e um coeficiente de correlação?

O termo “coeficiente de associação” é geralmente usado quando as variáveis são medidas nominalmente e exibidas em uma tabela de contingência, enquanto “coeficiente de correlação” é usado para variáveis medidas em pelo menos uma escala intervalar (numérica).

O que é o Coeficiente Phi e quando ele é usado?

Coeficiente Phi é um coeficiente de associação para tabelas de contingência 2×2, também conhecido como coeficiente de ponto quádruplo. Varia de 0 a 1,0.

Como o V de Cramer difere do Coeficiente Phi?

O V de Cramer é uma modificação do Phi para tabelas maiores e pode variar até 1,0 para tabelas de qualquer dimensão. É mais versátil que o Phi e pode ser usado em mesas de qualquer tamanho.

Para que serve o Coeficiente de Contingência?

O Coeficiente de Contingência foi desenvolvido para tabelas quadradas com mais de duas linhas e colunas, como tabelas 3×3 ou 4×4.

O que o teste qui-quadrado indica em relação a duas variáveis?

O teste do qui-quadrado indica se existe uma relação entre duas variáveis, mas não especifica a natureza da relação.

Para que é usada a correlação rho de Spearman?

A correlação rho de Spearman é usada para correlacionar classificações entre duas variáveis ordenadas, especialmente quando ambas as variáveis são medidas em uma escala numérica.