Muestreo aleatorio simple

Muestreo aleatorio simple

El muestreo aleatorio simple es un procedimiento que le da a cada unidad de muestreo de la población una probabilidad igual y conocida distinta de cero de ser seleccionada. La selección de una muestra aleatoria simple se puede lograr con la ayuda de un software de computadora, una tabla de números aleatorios o una calculadora científica.

En la mayoría de los casos, se emplean números aleatorios para seleccionar muestras. Este procedimiento de selección garantiza que cada unidad de población tenga la misma probabilidad de ser incluida en la muestra.

Para extraer una muestra aleatoria simple de una población es necesario que a cada unidad de población elegible se le asigne la misma probabilidad de selección en cada sorteo. Esto asegura la aleatoriedad en la selección, haciendo que la muestra sea independiente del juicio humano.

En realidad, una muestra aleatoria simple se extrae unidad por unidad.

Si se dispone de una lista (marco muestral) de las unidades de población, la selección aleatoria de la muestra se puede realizar fácilmente utilizando números aleatorios.

Se puede seguir el siguiente procedimiento de 8 pasos para extraer una muestra aleatoria simple de norte unidades que utilizan números aleatorios de una población de norte unidades.

  1. Asigne números de serie a las unidades de la población del 1 al
  2. Decide la tabla de números aleatorios que se utilizará.
  3. Elija un número aleatorio de N dígitos desde cualquier punto de la tabla de números aleatorios.
  4. Si este número aleatorio es menor o igual a NORTE, Esta es tu primera unidad seleccionada.
  5. Pase al siguiente número aleatorio que no exceda NORTE, vertical, horizontal o en cualquier otra dirección sistemáticamente y elija su segunda unidad.
  6. Si en cualquier etapa de su selección, el número aleatorio elegido excede NORTE, deséchalo y elige el siguiente número aleatorio.
  7. Si además se repite algún número aleatorio, también debe descartarse y reemplazarse por un número aleatorio nuevo que aparezca a continuación.
  8. El proceso se detiene una vez que llega al tamaño de muestra deseado.

Los siguientes ejemplos están diseñados para ilustrar cómo se puede realizar en la práctica la selección de elementos de población.

Ejemplo 1: Extraiga una muestra aleatoria simple de tamaño 5 de una población que comprende 150 unidades empleando un método de muestreo aleatorio simple.

Aquí n=5 y 7V=150. Asigne los números de serie 001, 002,….,150 a las 150 unidades de la población. Dado que 150 es un número de tres dígitos, simplemente leemos los números aleatorios de tres dígitos que se presentan en el Apéndice.

Supongamos que comenzamos desde el dígito más a la izquierda de la primera fila de la tabla de números aleatorios del Apéndice 1 y avanzamos hacia abajo hasta alcanzar una muestra de 5 unidades.

Los números aleatorios fueron los siguientes:

277130802108541603497786666440
414945416502413258061608809195
493063609923779381396840474433
642668724210953407582895154121

Tenga en cuenta que elegimos sólo aquellos números que se encuentran en el rango 001-150. Cualquier número que quede fuera de este rango se omite ya que no corresponde a ninguna unidad de la población. El proceso se detiene una vez que llegamos a cinco números.

Tenga en cuenta que los números seleccionados son 130, 108, 61, 63 y 121. Estos números están subrayados con negrita. Todos estos números son distintos.

Si un número aleatorio aparece dos veces, la segunda aparición se omite y se selecciona otro número como reemplazo.

Ejemplo #2: Supongamos que existen 77=1000 registros de salarios diarios de los empleados de la industria farmacéutica. Extraiga una muestra de 25 registros utilizando los números aleatorios que se muestran en el Apéndice 1 para extraer una muestra de 25 registros.

El primer paso es ordenar los salarios de 1000 empleados, asignando un número del 000 al 999. Es decir, tenemos 1000 números de tres cifras donde 001 representa el primer registro, 999 el 999.th registro y 000 el 1000th.

Podemos usar los primeros tres dígitos de la segunda columna de números aleatorios en el Apéndice 1, que consta de 10 dígitos aleatorios eliminando los últimos 7 dígitos de cada número aleatorio. Vemos que el primer número seleccionado es 853, el segundo es 540, el tercero es 985, y así sucesivamente. Continuando más abajo en la columna, se eligen los siguientes números aleatorios:

853540985903266
373920164998073
495496641417906
906715883744104
467236159118782

Cabe destacar que la renumeración de los seriales ha facilitado mucho la tarea de elegir los casos, y no ha habido rechazo en el proceso.

Si los registros salariales de los empleados están realmente numerados, simplemente elegimos los registros con los números correspondientes, y estos registros representan una muestra aleatoria simple de tamaño w=25 de ¥=1000.

A continuación ilustramos con un ejemplo un método relativamente eficiente para extraer una muestra aleatoria simple que tiene menos tasa de rechazo.

Ejemplo #3: Consulte el ejemplo n.° 1. La población de la que se debe elegir una muestra de 5 contiene 150 unidades. Para seleccionar una unidad del 001 al 150, siga los pasos a continuación:

  1. Elija un número aleatorio de la tabla de números aleatorios que se le proporcionó (consulte los números aleatorios que se muestran en el Ejemplo 5.3). Este número es 277, que supera los 150.
  2. Divide 277 entre 150. El resto es 127. La unidad etiquetada 127 en la población es la primera unidad seleccionada.
  3. Para seleccionar la segunda unidad, elija el siguiente número aleatorio. Este número es 130, que es menor que 150. Elegimos directamente este número como nuestra segunda unidad en la muestra.
  4. El siguiente número aleatorio es 802, lo que da como resultado un resto de 52 cuando se divide por 150. La unidad correspondiente a este número es nuestra tercera unidad seleccionada.
  5. Continuando con este proceso, llegamos a los siguientes dos números. Estos son 108 y 91.
  6. Los números aleatorios así elegidos son 52, 91, 108, 127 y 130.

El procedimiento anterior se conoce como método del resto. Este procedimiento tiene la ventaja de tener una menor tasa de rechazo en el proceso de selección.

Determinación del tamaño de la muestra en una muestra aleatoria simple

Uno de los problemas más importantes al planificar una encuesta por muestreo es determinar qué tan grande se necesita una muestra para que las estimaciones sean lo suficientemente confiables para cumplir los objetivos de la encuesta.

La decisión es importante por varias razones. Una muestra demasiado grande implica enormes costos, mano de obra, materiales y tiempo, mientras que una muestra demasiado pequeña invalida los resultados. Entonces la pregunta es: ¿cuál es el tamaño óptimo de la muestra?

Aunque es difícil establecer reglas generales para el tamaño de la muestra sin conocer la población específica, alrededor de 30 casos parecen ser el mínimo indispensable para estudios en los que se van a realizar análisis de datos estadísticos (Champion 1970: 89).

Sin embargo, muchos investigadores consideran que 50 casos, y algunos defienden que 100 casos es el mínimo (Fisher et al. 1991).

Una razón es que a menudo hay varias subpoblaciones que los investigadores desean estudiar por separado o varias variables que deben controlarse.

Si no hay suficientes casos en cada subgrupo de la población, a veces resulta difícil cumplir los supuestos de las pruebas estadísticas estándar, como la chi-cuadrado en particular. Además, los porcentajes calculados sobre la base de menos de 30 casos tienden a ser poco fiables.

Fisher y cols. (1991) sugieren un enfoque simple en los casos en que se pretende analizar datos de una manera mesa de contingencia. Este enfoque garantiza un número mínimo de casos como frecuencias de celda en una tabla cruzada de variables.

Siguiendo el planteamiento, consideremos el problema de analizar la asociación entre el conocimiento nutricional de las madres y su nivel educativo. Para analizar dicha tabla, se deben tener en cuenta dos puntos al determinar el tamaño de la muestra:

  • Cada categoría de la variable independiente debe contener al menos un número específico de casos;
  • El número esperado de casos de cada celda debe ser al menos 5 (para permitir pruebas estadísticas, como chi-cuadrado).

En el presente ejemplo, la educación es la variable independiente, mientras que el conocimiento nutricional es la variable dependiente. Deje que la variable 'educación' tenga 4 niveles como se muestra a continuación:

Nivel de Educación% de madres
Ninguno60
Primario20
Secundario15
Por encima de secundaria5
Total100

Nuestra suposición es que las cuatro categorías anteriores constituyen respectivamente el 60%, 20%, 15% y 5% de todos los encuestados de la población (ver columna 2 en la tabla anterior).

Por lo tanto, para tener una muestra lo suficientemente grande como para asegurar al menos 30 casos (digamos) en la categoría más pequeña de la variable (en este caso, 5% de casos) del número total de casos, el tamaño de muestra requerido es

determinación del tamaño de la muestra en muestreo aleatorio simple

Ahora supongamos que el conocimiento nutricional de las madres tiene 3 categorías: 'sin conocimiento', 'conocimiento moderado' y 'alto conocimiento' que representan respectivamente el 30%, 20% y 50% de todas las madres.

nivel de conocimiento% de madres
Sin conocimiento30
conocimiento moderado20
Alto conocimiento50
Total100

Para encontrar el tamaño de muestra mínimo necesario para asegurar una frecuencia de celda esperada de al menos 5, dividimos 5 por el producto de la proporción que cae en las categorías más pequeñas de las dos variables (a saber: 5% para educación superior y 20% para educación moderada). conocimiento):

determinación del tamaño de la muestra en muestreo aleatorio simple 2

Dado que el tamaño de muestra requerido debe cumplir ambos criterios (30 casos en cada categoría de variable y 5 casos en cada celda), se debe adoptar como tamaño de muestra final la mayor de las dos estimaciones (600 frente a 500).

Este criterio lleva a elegir n=600 como nuestro tamaño de muestra final. Podemos verificar que el procedimiento anterior asegura que ninguna de las celdas contenga menos de 5 casos y, al mismo tiempo, la categoría de la variable independiente contenga al menos 30 casos:

Tabla: Cuadro cruzado de Educación y Nivel Nutricional
Nivel de Educación
Nivel de nutriciónNingunoPrimarioSecundarioPor encima de secundariaTotal (%)
Sin conocimiento10836279180
(30%)
conocimiento moderado7224186120
(20%)
Alto conocimiento180604515300
(50%)
Total3601209030600
(%)(60%)(20%)(15%)(5%)(100%)

Los valores de celda en la tabla anterior se calculan como el producto de los porcentajes de filas y columnas y el tamaño de muestra estimado (n=600). Por ejemplo, el primer valor de 108 se calcula de la siguiente manera:

108=0.30×0.60×600

De manera similar, el segundo valor 60 en la tercera fila se calcula como

60=0,50 x 0,20 x 600

A continuación presentamos un enfoque estadísticamente más sólido para determinar el tamaño de la muestra. Para ello consideramos dos casos:

  1. Determinación del tamaño de la muestra. (norte) en la estimación de la proporción de población;
  2. Determinación del tamaño de la muestra. (norte) al estimar la media poblacional.

Tamaño de la muestra al estimar una proporción poblacional

En las encuestas por muestreo nos topamos frecuentemente con el problema de estimar proporciones o porcentajes de población, tales como la proporción de personas que fuman, la proporción de niños que sufren desnutrición, la proporción de votantes que favorecen a un candidato en particular, el porcentaje de clientes que llegan a un hipermercado con un tarjeta de crédito y similares.

Así si pag es una proporción que tiene un atributo determinado, entonces, para una población suficientemente grande, la fórmula para estimar el tamaño de la muestra es donde:

  • norte0 = tamaño de muestra deseado
  • z = desviación normal estándar generalmente establecida en 1,96, que corresponde al nivel de confianza del 95%.
  • p=proporción supuesta en la población objetivo que se estima tiene una característica particular.
  • d = error marginal permisible al estimar una proporción de población.

Ejemplo: Se realizará una encuesta nutricional en un campo de refugiados. Supongamos que el 40% de los niños sufren desnutrición. ¿Qué tamaño de muestra se necesita para tener un 95% de certeza de que la prevalencia estimada no difiere de la prevalencia real en más de 0,05?

Suponiendo que la población es grande, empleamos la fórmula (c) anterior. Aquí z=1,96,6/=0,05 y /y=0,40. Ahora queremos estimar la verdadera proporción de la población dentro de los 5 puntos porcentuales de pag. eso esta dentro pag= 0,40 ± 0,05. De este modo

Tamaño de la muestra al estimar una proporción poblacional 1

Si p no se conoce o es difícil de suponer, el procedimiento más seguro será tomarlo como 0,50, lo que maximiza la varianza esperada y, por lo tanto, indica un tamaño de muestra que seguramente será lo suficientemente grande. Si se espera la proporción entre dos valores, se selecciona el valor más cercano al 50%. Por ejemplo, si se cree que p está entre 15% y 30%, entonces se debe elegir 30% (el mayor de los dos) como valor de p para calcular n.

Una elección común de d es 0,05. Este valor no parece ser realista para escenarios donde el verdadero valor de p está fuera del rango 0,2. <p<0.8 when a small value for or consideration of a relative margin of error r is recommended. The quantity r is computed as portion of the assumed true proportion p. Consideration of this relative rate of allowable error margin would convert the equation to:

Tamaño de muestra al estimar un ejemplo de proporción poblacional - 1

Comprobamos a continuación que la fórmula (c) arroja un valor de 139 para n cuando cZ=0,5 yp=0,90:

Muestreo aleatorio simple

Con los mismos valores r (0,05) yp (0,90), (c*) se obtiene:

Tamaño de muestra al estimar un ejemplo de proporción poblacional - 3

Si N es pequeño, la fórmula a utilizar asume la siguiente forma:

Tamaño de muestra al estimar un ejemplo de proporción poblacional - 4

La fórmula (d) anterior también se puede expresar de la siguiente manera:

Tamaño de muestra al estimar un ejemplo de proporción poblacional - 5

En la práctica, primero calculamos n0. aleta0/N es insignificante, entonces n0o es una aproximación satisfactoria a n.

Suponiendo que p es difícil de fijar de antemano, lo tomamos como 0,50. En ese evento

Tamaño de muestra al estimar un ejemplo de proporción poblacional: 6

Supongamos jV=2000 y consideramos que esto es una población pequeña. Luego revisaríamos nuestra estimación de norte como sigue:

Tamaño de muestra al estimar un ejemplo de proporción poblacional - 7

Yamane (1967) proporciona una fórmula más simplificada para calcular norte. Esto es

Tamaño de muestra al estimar un ejemplo de proporción poblacional: 8

Cuando se aplica (e*) al caso anterior;

Tamaño de muestra al estimar un ejemplo de proporción poblacional: 9

Como se puede observar, el tamaño de la muestra que utiliza la fórmula (e) da como resultado un muestreo de menos niños que la fórmula (c).

Además, es fácil verificar que la fórmula (c), para un determinado z y d valores, dará el mismo tamaño de muestra independientemente del tamaño de la población. La siguiente tabla compara numéricamente las dos fórmulas:

Tabla: Comparación de dos fórmulas de tamaño de muestra para p=0,5, <£=0,05 y z=1,96
Tamaño de la poblacionTamaño de muestra estimado cuando norte es largoTamaño de muestra estimado cuando norte es pequeño
5038545
10038580
500385218
1,000385279
5,000385357
10,000385371
50,000385382

En los estudios comparativos, normalmente se quiere demostrar que existe una diferencia significativa entre los dos grupos. Si asumimos un número igual de casos (norte&nortebsp;1 = norte&nortebsp;2 = norte) en las dos subpoblaciones, la fórmula para norte es muy similar al anterior:

Tamaño de muestra al estimar un ejemplo de proporción poblacional: 10

El tamaño de la muestra para estimar la media poblacional.

Muy a menudo queremos hacer inferencias sobre la media y el valor total de variables como ingresos, gastos, edad o IMC.

El tamaño de muestra necesario para hacer tal inferencia es algo diferente del analizado para la proporción. Para la media, la fórmula es donde <r2 is the population variance.

Tamaño de muestra para estimar la media poblacional

Ejemplo: Para una población de 10.000 mujeres, la distribución del índice de masa corporal (IMC) mostró una varianza de 15. ¿Qué tamaño de muestra debemos extraer si queremos tener un 95% de confianza en que nuestra estimación del IMC promedio en la población está equivocada? en ± 0,3?

tamaño de muestra para estimar la media poblacional ejemplo

Aquí 7V = 10.000, a2 =15, <£=0,3. Por lo tanto, para estimar la media, el tamaño de la muestra se obtiene de (g) como se muestra a continuación: 

Por tanto, se necesitará una muestra de 602 mujeres para lograr el grado deseado de confianza en la estimación. Si norte eran grandes, norte habría sido en virtud de (h);

tamaño de muestra para estimar la media poblacional ejemplo 2