Medidas de asociación: definición, método

Medidas de asociación: definición, método

La elección de una prueba estadística para describir la fuerza de las relaciones entre variables dependerá en gran medida del nivel de medición. Las medidas estadísticas de la fuerza de la relación se denominan coeficiente de asociación o coeficiente de correlación.

El primer término se utiliza generalmente cuando las variables se miden nominalmente y se muestran en una tabla de contingencia.

Medidas de asociación basadas en Chi cuadrado

El último término se utiliza generalmente para variables medidas al menos en una escala de intervalo (numérica). Por ejemplo, si calculamos phi (que se analiza a continuación) para dos variables medidas nominalmente (digamos, por ejemplo, sexo y color de ojos), llamamos phi una medida de asociación.

Por otro lado, si calculamos r (que se analizó en un capítulo anterior) para las variables numéricas (por ejemplo, la edad y el IMC), llamamos ra coeficiente de correlación. En las siguientes secciones, analizaremos estas medidas por separado, empezando por las medidas de asociación.

Coeficiente phi

El coeficiente Phi (^) es probablemente el coeficiente de asociación más popular para tablas de contingencia 2×2. Este coeficiente también se llama coeficiente cuádruple. La fórmula para calcular^ es

El coeficiente Phi (^) varía de 0 a 1,0 e intenta corregir chi-cuadrado proporcionalmente a norte, el número total de casos.

El coeficiente no sugiere si una variable causa la otra, ni hay una indicación de la dirección de la relación. Como se puede ver, el cálculo de <j> Es sencillo una vez que tenemos la tabla de contingencia.

V de Cramer

La V de Cramer es una modificación de 0 para mesas más grandes y tiene un rango de hasta 1,0 para mesas de cualquier dimensión. Se calcula donde k es el menor número de filas o columnas. Para una mejor comprensión de la fórmula anterior, la reescribimos como

Coeficiente de contingencia

El coeficiente de contingencia se desarrolló con tablas cuadradas con más de dos filas y columnas, por ejemplo, tablas de 3×3 o 4×4. Se calcula como;

Medidas de asociación: definición, método

El coeficiente de contingencia C es igual a 0 cuando las variables son independientes. Su valor máximo es siempre menor que 1 y está determinado por el número de filas y columnas de la tabla. El valor máximo para una mesa cuadrada (2×2 o 3×3) se calcula mediante la ecuación;

Medidas de asociación: definición, método

dónde k es igual al número de filas o columnas, lo que sea menor. Para una mesa de 2×2, el valor máximo se alcanzaría con k=2:

Medidas de asociación: definición, método

Para una mesa de 3×3, el valor máximo sería .816.

Una desventaja del coeficiente de contingencia, cuando las variables no son independientes ni están perfectamente relacionadas, es la dificultad de compararlo para tablas de diferente tamaño cuando r no es igual a c.

Las fluctuaciones del valor máximo de C han llevado al uso de la V de Cramer, que se puede utilizar con tablas cuadradas y no cuadradas de cualquier dimensión. V oscila entre 0 cuando las variables son independientes y 1 cuando están perfectamente relacionadas.

Al igual que con C y V, ϕ sólo requiere datos de nivel nominal y nos proporciona una medida de la fuerza pero no de la dirección de la asociación ya que el signo siempre será positivo.

La V de Cramer es la más versátil de las tres medidas de la asociación ya que su rango es siempre de 0 a 1 y puede usarse para una mesa de cualquier dimensión.

Ejemplo de coeficiente de contingencia

El cuadro adjunto muestra la relación entre el nivel educativo de las madres y el grado de desnutrición entre 150 niños menores de cinco años en una ciudad. Calcule C, V y ϕ para interpretar los resultados.

Grado de desnutriciónBajoModeradoAltoTotal
Bajo5103550
Moderado1530550
Alto30101050
Total505050150
Nivel educativo de las madres

El valor de X2 se calculó como 66, lo cual es altamente significativo (p<0,001). Con base en este valor, calculamos otras medidas:

Medidas de asociación: definición, método

El coeficiente de contingencia C= .55 lleva a concluir que existe una relación moderadamente fuerte entre el nivel educativo y la desnutrición ya que el valor máximo de C en una tabla de 3×3 es .816.

Un examen de los datos del cuadro también muestra que los encuestados que han completado la educación superior tienden a tener hijos con un bajo grado de desnutrición.

Mientras que V oscila entre 0 y 1, V=.47 indica un nivel moderado. relación entre las variables bajo investigación. Con datos ordinales, existen varios métodos alternativos para medir la asociación.

Entre otros, gama, lamda, Kendal Tau, de somer d son algunos de ellos, que son métodos menos utilizados para medir la asociación en tablas de contingencia, y por lo tanto pasamos a algunos métodos utilizados con frecuencia.

La prueba de chi cuadrado indica si existe una relación entre dos variables, pero no nos dice la relación. Esto se logra mediante el análisis de correlación.

Este análisis nos muestra cómo determinar tanto la naturaleza como la fuerza de la relación entre dos variables.

El rho de Spearman (rs) correlación es una medida ordinal popular y ampliamente utilizada rho correlaciona rangos entre dos variables ordenadas.

Cuando ambas variables son medido en una escala numérica (p. ej., peso, altura), la medida de asociación más utilizada es el coeficiente de correlación momento-producto de la persona (r).

¿Cuál es la diferencia entre un coeficiente de asociación y un coeficiente de correlación?

El término "coeficiente de asociación" se utiliza generalmente cuando las variables se miden nominalmente y se muestran en una tabla de contingencia, mientras que "coeficiente de correlación" se utiliza para variables medidas al menos en una escala de intervalo (numérica).

¿Qué es el coeficiente Phi y cuándo se utiliza?

El coeficiente Phi es un coeficiente de asociación para tablas de contingencia de 2 × 2, también conocido como coeficiente de cuatro puntos. Va de 0 a 1,0.

¿En qué se diferencia el V de Cramer del coeficiente Phi?

La V de Cramer es una modificación de Phi para tablas más grandes y puede alcanzar hasta 1,0 para tablas de cualquier dimensión. Es más versátil que Phi y se puede utilizar para mesas de cualquier tamaño.

¿Para qué está diseñado el Coeficiente de Contingencia?

El Coeficiente de Contingencia se desarrolló para tablas cuadradas con más de dos filas y columnas, como las tablas de 3×3 o 4×4.

¿Qué indica la prueba de chi-cuadrado en relación con dos variables?

La prueba de chi-cuadrado indica si existe una relación entre dos variables, pero no especifica la naturaleza de la relación.

¿Para qué se utiliza la correlación rho de Spearman?

La correlación rho de Spearman se utiliza para correlacionar rangos entre dos variables ordenadas, especialmente cuando ambas variables se miden en una escala numérica.