Distribución en el muestreo
Cuando el tamaño de la muestra (n) es más pequeño que el tamaño de la población (N), dos o más muestras pueden ser extraídas de la misma población. Un cierto estadístico puede ser calculado para cada una de las muestras posibles extraídas de la población. Una distribución del estadístico obtenida de las muestras es llamada la distribución en el muestreo del estadístico.
Por ejemplo, si la muestra es de tamaño 2 y la población de tamaño 3 (elementos A, B, C), es posible extraer 3 muestras ( AB, BC Y AC) de la población. Podemos calcular la media para cada muestra. Por lo tanto, tenemos 3 medias muéstrales para las 3 muestras. Las 3 medias muéstrales forman una distribución. La distribución de las medias es llamada la distribución de las medias muéstrales, o la distribución en el muestreo de la media. De la misma manera, la distribución de las proporciones (o porcentajes) obtenida de todas las muestras posibles del mismo tamaño, extraídas de una población, es llamada la distribución en el muestreo de la proporción.
Distribución muestral de medias.
Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribución que llamaremos distribución muestral de medias.
- Si tenemos una población normal N(m,s) y extraemos de ella muestras de tamaño n, la distribución muestral de medias sigue también una distribución normal.
- Si la población no sigue una distribución normal pero n>30, aplicando el llamado Teorema central del límite la distribución muestral de medias se aproxima también a la normal anterior.
Error estándar de la media: es la desviación estándar de la distribución de muestreo de la media, por lo que mide el grado en que se espera que varíen las medias de las diferentes muestras de la media de la población, debido al error aleatorio en el proceso de muestreo. Al disminuir el error estándar, el valor de cualquier media de muestra probablemente se acercará al valor de la media de la población. (efecto del tamaño de la muestra sobre el error típico, es decir, a medida que aumenta el tamaño de la muestra, se incrementa la precisión con la que se puede usar la media de muestra para estimar la media de la población, sin embargo, rara vez vale la pena tomar muestras excesivamente grandes ya que el error estándar de la media varía inversamente con n , por lo que hay una utilidad decreciente en el muestreo). En cuanto a su uso este, indica el tamaño del error de azar que se ha cometido, y además señala la probable precisión que obtendremos si utilizamos una estadística de muestra para estimar un parámetro de población.
Teorema del límite central: es un teorema a través del cual se asegura que la distribución de muestreo de la media se aproxima a la normal, al incrementarse el tamaño de la muestra. Este teorema permite usar estadística de muestra para hacer inferencias con respecto a los parámetros de la población, sin saber nada sobre la forma de la distribución de frecuencias de esa población más que lo que podamos obtener de la muestra.
Nota: si la distribución de la población es bastante simétrica, la distribución muestral de la media se aproxima a la normal si se seleccionan muestras pequeñas.
Aplicaciones:
Una aplicación muy corriente y útil de la distribución muestral es determinar la probabilidad de que la media de una muestra caiga dentro de un intervalo determinado. Puesto que la distribución muestral seguirá una distribución normal (ya sea porque la muestra se toma de una distribución normal, o porque n teorema del límite central garantice la normalidad en el proceso de muestreo), se podrá utilizar la variable tipificada para obtener la información necesaria en la toma de decisiones
Distribución muestral de proporciones
En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una distribución binomial y cuando la extensión de la población es grande la distribución binomial B(n,p) se aproxima a la normal .
- Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una distribución normal y p es la proporción de uno de los valores que presenta la variable estadística en la población y q=1-p.
Error estándar de la proporción: es la desviación estándar de la distribución de muestreo de la proporción, por lo que mide el grado en que se espera que varíen las proporciones de las diferentes muestras de la proporción de la población, debido al error aleatorio en el proceso de muestreo.
Teorema del límite central: es un teorema a través del cual se asegura que la distribución muestral de la proporción se aproxima a la distribución normal, al incrementarse el tamaño de la muestra. Este teorema permite usar estadística de muestra para hacer inferencias con respecto a los parámetros de la población, sin saber nada sobre la forma de la distribución de frecuencias de esa población más que lo que podamos obtener de la muestra.
Aplicaciones: Una aplicación muy corriente y útil de distribución muestral es determinar la probabilidad de que la proporción de una muestra caiga dentro de un intervalo determinado. Puesto que la distribución muestral seguirá unadistribución normal (ya sea porque la muestra se toma de una distribución normal, o porque n pn como)1( pn − deben ser mayores a 5, (el teorema del límite central garantiza la normalidad en el proceso de muestreo), se podrá utilizar la variable tipificada para obtener la información necesaria en la toma de decisiones.
Observación:
En la terminología estadística, la distribución de muestreo que se obtendría al tomar todas las muestras de un tamaño dado constituye una distribución teórica de muestreo. En la práctica, el tamaño y el carácter de la mayor parte de las poblaciones impiden que los responsables de las decisiones tomen todas las muestras posibles de una distribución de población, sin embargo, se han desarrollado fórmulas para estimar las características de estas distribuciones teóricas de muestreo, haciendo innecesario que se recolecten grande números de muestras. En casi todos los casos, los responsables de las decisiones sólo toman una muestra de la población, calculan estadísticas para esa muestra y de esas estadísticas infieren algo sobre los parámetros de toda la población.
No hay comentarios:
Publicar un comentario