viernes, 22 de mayo de 2009

Estimacion

Estimacion:
Se llama estimación al conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la media de una determinada característica de una población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño n.
La estimación se divide en tres grandes bloques, cada uno de los cuales tiene distintos métodos que se usan en función de las características y propósitos del estudio:

  1. Estimación puntual:
    Método de los momentos;
    Método de la máxima verosimilitud;
    Método de los mínimos cuadrados;
  2. Estimación por intervalos.
  3. Estimación bayesiana.

Estimador.- Un estimador de un parámetro poblacional es una función de los datos muestrales. En pocas palabras, es una fórmula que depende de los valores obtenidos de una muestra, para realizar estimaciones. Formalmente, si θ es un parámetro poblacional, se dice que es un estimador puntual de θ si , donde x1,x2,...,xn son las variables aleatorias que integran una muestra aleatoria de tamaño n de la población en cuestión.
Por ejemplo, un estimador de la media poblacional, μ, puede ser la media muestral.
El estimador es una variable aleatoria que asigna a cada posible valor de la muestra un valor numérico. Como tal, tiene sentido calcular su esperanza, su varianza y otras características propias de las variables aleatorias.

Estimador insesgado: Por supuesto, cualquier función de la muestra, con la definición anterior, podría ser un estimador, pero es deseable que las estimaciones que surjan a partir de un estimador "se parezcan", en cierto modo, al parámetro que se desea estimar.
Con este propósito, se dice que un estimador de un parámetro θ es insesgado si su esperanza es el propio θ.

Estimación puntual: Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido de una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimación puntual la talla media de los individuos. Lo más importante de un estimador, es que sea un estimador eficiente. Es decir, que sea insesgado(ausencia de sesgos) y estable en el muestreo (varianza mínima)

Estimación por intervalos: Consiste en la obtención de un intervalo dentro del cual estará el valor del parámetro estimado con una cierta probabilidad. En la estimación por intervalos se usan los siguientes conceptos:

Intervalo de confianza: El intervalo de confianza es una expresión del tipo [θ1, θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el parámetro a estimar. Este intervalo contiene al parámetro estimado con una determinada certeza o nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un axioma o un equivalente circustancial

Variabilidad del Parámetro: Si no se conoce, puede obtenerse una aproximación en los datos aportados por la literatura científica o en un estudio piloto. También hay métodos para calcular el tamaño de la muestra que prescinden de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviación típica poblacional y se denota σ.

Error de la estimación: Es una medida de su precisión que se corresponde con la amplitud del intervalo de confianza. Cuanta más precisión se desee en la estimación de un parámetro, más estrecho deberá ser el intervalo de confianza y, si se quiere mantener o disminuir el error, más ocurrencias deberán incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, más error se comete al aumentar la precisión. Se suele llamar E, según la fórmula E = θ2 - θ1.

Limite de Confianza: Es la probabilidad de que el verdadero valor del parámetro estimado en la población se sitúe en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-α), aunque habitualmente suele expresarse con un porcentaje ((1-α)·100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con valores α de 0,05 y 0,01 respectivamente.

Valor α: También llamado nivel de significación. Es la probabilidad (en tanto por uno) de fallar en nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-α). Por ejemplo, en una estimación con un nivel de confianza del 95%, el valor α es (100-95)/100 = 0,05.

Valor crítico: Se representa por Zα/2. Es el valor de la abscisa en una determinada distribución que deja a su derecha un área igual a α/2, siendo 1-α el nivel de confianza. Normalmente los valores críticos están tabulados o pueden calcularse en función de la distribución de la población. Por ejemplo, para una distribución normal, de media 0 y desviación típica 1, el valor crítico para α = 0,05 se calcularía del siguiente modo: se busca en la tabla de la distribución ese valor (o el más aproximado), bajo la columna "Área"; se observa que se corresponde con -1,64. Entonces Zα/2 = 1,64. Si la media o desviación típica de la distribución normal no coinciden con las de la tabla, se puede realizar el cambio de variable t =(X-μ)/σ para su cálculo.
Con estas definiciones, si tras la extracción de una muestra se dice que "3 es una estimación de la media con un margen de error de 0,6 y un nivel de confianza del 99%", podemos interpretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando, respectivamente, la mitad del error, para obtener el intervalo de confianza según las definiciones dadas.
Para un tamaño fijo de la muestra, los conceptos de error y nivel de confianza van relacionados. Si admitimos un error mayor, esto es, aumentamos el tamaño del intervalo de confianza, tenemos también una mayor probabilidad de éxito en nuestra estimación, es decir, un mayor nivel de confianza.

Distribucion Muestral


Distribución en el muestreo
Cuando el tamaño de la muestra (n) es más pequeño que el tamaño de la población (N), dos o más muestras pueden ser extraídas de la misma población. Un cierto estadístico puede ser calculado para cada una de las muestras posibles extraídas de la población. Una distribución del estadístico obtenida de las muestras es llamada la distribución en el muestreo del estadístico.
Por ejemplo, si la muestra es de tamaño 2 y la población de tamaño 3 (elementos A, B, C), es posible extraer 3 muestras ( AB, BC Y AC) de la población. Podemos calcular la media para cada muestra. Por lo tanto, tenemos 3 medias muéstrales para las 3 muestras. Las 3 medias muéstrales forman una distribución. La distribución de las medias es llamada la distribución de las medias muéstrales, o la distribución en el muestreo de la media. De la misma manera, la distribución de las proporciones (o porcentajes) obtenida de todas las muestras posibles del mismo tamaño, extraídas de una población, es llamada la distribución en el muestreo de la proporción.

Distribución muestral de medias.
Cada muestra de tamaño n que podemos extraer de una población proporciona una media. Si consideramos cada una de estas medias como valores de una variable aleatoria podemos estudiar su distribución que llamaremos distribución muestral de medias.
  • Si tenemos una población normal N(m,s) y extraemos de ella muestras de tamaño n, la distribución muestral de medias sigue también una distribución normal.
  • Si la población no sigue una distribución normal pero n>30, aplicando el llamado Teorema central del límite la distribución muestral de medias se aproxima también a la normal anterior.

Error estándar de la media: es la desviación estándar de la distribución de muestreo de la media, por lo que mide el grado en que se espera que varíen las medias de las diferentes muestras de la media de la población, debido al error aleatorio en el proceso de muestreo. Al disminuir el error estándar, el valor de cualquier media de muestra probablemente se acercará al valor de la media de la población. (efecto del tamaño de la muestra sobre el error típico, es decir, a medida que aumenta el tamaño de la muestra, se incrementa la precisión con la que se puede usar la media de muestra para estimar la media de la población, sin embargo, rara vez vale la pena tomar muestras excesivamente grandes ya que el error estándar de la media varía inversamente con n , por lo que hay una utilidad decreciente en el muestreo). En cuanto a su uso este, indica el tamaño del error de azar que se ha cometido, y además señala la probable precisión que obtendremos si utilizamos una estadística de muestra para estimar un parámetro de población.

Teorema del límite central: es un teorema a través del cual se asegura que la distribución de muestreo de la media se aproxima a la normal, al incrementarse el tamaño de la muestra. Este teorema permite usar estadística de muestra para hacer inferencias con respecto a los parámetros de la población, sin saber nada sobre la forma de la distribución de frecuencias de esa población más que lo que podamos obtener de la muestra.
Nota: si la distribución de la población es bastante simétrica, la distribución muestral de la media se aproxima a la normal si se seleccionan muestras pequeñas.

Aplicaciones:
Una aplicación muy corriente y útil de la distribución muestral es determinar la probabilidad de que la media de una muestra caiga dentro de un intervalo determinado. Puesto que la distribución muestral seguirá una distribución normal (ya sea porque la muestra se toma de una distribución normal, o porque n teorema del límite central garantice la normalidad en el proceso de muestreo), se podrá utilizar la variable tipificada para obtener la información necesaria en la toma de decisiones

Distribución muestral de proporciones
En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una distribución binomial y cuando la extensión de la población es grande la distribución binomial B(n,p) se aproxima a la normal .

  • Para muestras de tamaño n>30, la distribución muestral de proporciones sigue una distribución normal y p es la proporción de uno de los valores que presenta la variable estadística en la población y q=1-p.

Error estándar de la proporción: es la desviación estándar de la distribución de muestreo de la proporción, por lo que mide el grado en que se espera que varíen las proporciones de las diferentes muestras de la proporción de la población, debido al error aleatorio en el proceso de muestreo.

Teorema del límite central: es un teorema a través del cual se asegura que la distribución muestral de la proporción se aproxima a la distribución normal, al incrementarse el tamaño de la muestra. Este teorema permite usar estadística de muestra para hacer inferencias con respecto a los parámetros de la población, sin saber nada sobre la forma de la distribución de frecuencias de esa población más que lo que podamos obtener de la muestra.

Aplicaciones: Una aplicación muy corriente y útil de distribución muestral es determinar la probabilidad de que la proporción de una muestra caiga dentro de un intervalo determinado. Puesto que la distribución muestral seguirá unadistribución normal (ya sea porque la muestra se toma de una distribución normal, o porque n pn como)1( pn − deben ser mayores a 5, (el teorema del límite central garantiza la normalidad en el proceso de muestreo), se podrá utilizar la variable tipificada para obtener la información necesaria en la toma de decisiones.

Observación:
En la terminología estadística, la distribución de muestreo que se obtendría al tomar todas las muestras de un tamaño dado constituye una distribución teórica de muestreo. En la práctica, el tamaño y el carácter de la mayor parte de las poblaciones impiden que los responsables de las decisiones tomen todas las muestras posibles de una distribución de población, sin embargo, se han desarrollado fórmulas para estimar las características de estas distribuciones teóricas de muestreo, haciendo innecesario que se recolecten grande números de muestras. En casi todos los casos, los responsables de las decisiones sólo toman una muestra de la población, calculan estadísticas para esa muestra y de esas estadísticas infieren algo sobre los parámetros de toda la población.

Terminologia del Muestreo

Estadístico
Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.
Muestra estadística
(También llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población estadística.
Espacio Muestral
Es el conjunto de todas las posibles muestras que se pueden extraer de una población mediante una determinada técnica de muestreo. Se suele representar por Ω.
Tamaño de la muestra
Es el número de sujetos que componen la muestra extraída de una población, necesarios para que los datos obtenidos sean representativos de la población
Error muestral o error de muestreo
La diferencia entre el resultado obtenido de una muestra (un estadístico) y el resultado el cual deberíamos haber obtenido de la población (el parámetro correspondiente) se llama el error muestral o error de muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a cabo la encuesta completa de la población, sino que se toma una muestra para estimar las características de la población. El error muestral es medido por el error estadístico, en términos de probabilidad, bajo la curva normal. El resultado de la media indica la precisión de la estimación de la población basada en el estudio de la muestra. Mientras más pequeño el error muestras, mayor es la precisión de la estimación. Deberá hacerse notar que los errores cometidos en una encuesta por muestreo, tales como respuestas inconsistentes, incompletas o no determinadas, no son considerados como errores muéstrales. Los errores no muéstrales pueden también ocurrir en una encuesta completa de la población.
Error Estándar
La desviación estándar de una distribución, en el muestreo de un estadístico, es frecuentemente llamada el error estándar del estadístico. Por ejemplo, la desviación estándar de las medias de todas la muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la media. De la misma manera, la desviación estándar de las proporciones de todas las muestras posibles del mismo tamaño, extraídas de una población, es llamada el error estándar de la proporción. La diferencia entre los términos "desviación estándar" y "error de estándar" es que la primera se refiere a los valores originales, mientras que la última está relacionada con valores calculados. Un estadístico es un valor calculado, obtenido con los elementos incluidos en una muestra.
Parámetro
Valor como la media, varianza o una proporción, que describe a una población y puede ser estimado a partir de una muestra. Valor de la poblacion
Estimación
Técnica para conocer el valor aproximado de un parámetro de la población.
Nivel de confianza
Medida de la bondad de una estimación. El proceso total del diseño de una muestra para una población"

Símbolos para estadísticos y parámetros correspondientes

Medida Símbolo para el estadístico Símbolo para el parámetro
(muestra) (Población)

Media X µ
Desviación estándar s
Número de elementos n N
Proporción p P
Distribución muestral
Es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la población. Mediante la distribución muestral se puede estimar el error para un tamaño de muestra dado.La fórmula para la distribución muestral dependerá de la distribución de la población, del estadístico y del tamaño de la muestra

Metodos de Muestreo

Existen distintos métodos para obtener muestras:

Probabilísticos.-

Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcularse la probabilidad de extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunque en ocasiones no es posible optar por él. En este caso se habla de muestras probabilísticas, pues no es razonable hablar de muestras representativas dado que no conocemos las características de la población.
La gran ventaja que presentan las muestras probabilísticas es que permiten la inferencia estadística. Es decir, permiten trasladar los datos de la muestra al conjunto de la población mientras que las no probabilísticas no.
Para que un muestreo sea probabilístico han de seguirse determinadas normas en el proceso de elección de los individuos (o unidades muestrales). Esas normas dan origen a los 4 métodos básicos de muestreo probabilístico. De los 4 métodos, los 3 primeros son monoetápicos, las unidades muestrales se eligen en una sola etapa.
El muestreo por conglomerados suele ser polietápico, y esas unidades muestrales no son individuales, sino conglomerados de elementos.


Muestreo aleatorio simple.- Los elementos de la muestra se eligen al azar, directamente y en una sola etapa. En la práctica, equivale en sacar al azar del censo de la población objeto del estudio, los elementos que van a formar parte de la muestra. Para esa selección al azar, se usan las tablas de números aleatorios. El muestreo aleatorio simple se aplica fundamentalmente en poblaciones pequeñas y plenamente identificables. El muestreo aleatorio simple puede ser de tres tipos:

  • Sin reposición de los elementos: cada elemento extraído se descarta para la subsiguiente extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla seleccionada.
  • Con reposición de los elementos: las observaciones se realizan con reemplazamiento de los individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición aunque, realmente, no lo sea.
  • Con reposicion multiple:En poblaciones muy grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse sin reposición.cada elemento extraído se descarta para la subsiguiente extracción.
    Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción de números aleatorios (es un resultado de una variable al azar especificada por una función de distribución.) mediante ordenadores, calculadoras o tablas construidas al efecto.
    tambien muestro es donde se recopilan datos por medio de un metodo cientifico, como por ejemplo el numero de datos de un salon

Muestreo aleatorio sistemático.- Se puede decir que es una variante del anterior. Sistematiza la elección de los componentes de la muestra, se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente de elevación K= N/n; donde N es el tamaño del universo y n el tamaño de la muestra. Determinar en qué fecha se producirá la primera extracción, para ello hay que elegir al azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenómeno.
Esto quiere decir que si tenemos un determinado número de personas que es la población y queremos escoger de esa población un númeno más pequeño el cual es la muestra, dividimos el número de la población por el número de la muestra que queremos tomar y el resultado de esta operación será el intervalo, entonces escogemos un número al azar desde uno hasta el número del intervalo, y a partir de este número escogemos los demás siguiendo el orden del intervalo.Se calcula el coeficiente de elevación (número de veces que el tamaño de población tiene al de muestra). Es decir, se elige al azar un número igual o menor a ese coeficiente. El individuo al que corresponde ese número forma parte de la muestra, os restantes se obtienen sumando sucesivamente el coeficiente de elevación al número obtenido;
Ejemplo
N = 5.000
n = 100 Coeficiente de elevación=5.000/100=50
El peligro de esta elección es que si en el listado hay algún tipo de ordenación, se corre el riesgo que la elección no sea tan neutra.

Ejemplo práctico: Para controlar la calidad de los exámenes complementarios realizados en un laboratorio clínico, el jefe de laboratorio decide repetir personalmente la prueba a 10 de las 250 extracciones de sangre realizadas ese día.
N = 250 n =10 k =250/10 =25
Se escoge como punto de arranque cualquier número entero entre 1 y 25 para inicial la selección. Supongamos que se escoge el 8, la muestra quedará entonces integrada por las extracciones número: 8 ; 33 ; 58 ; 83 ; 108 ; 133 ; 158 ; 183 ; 208 y 233.

Muestreo estratificado.- el muestreo aleatorio sistematico, consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos respecto a característica a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra. Dentro de cada estrato se suele usar la técnica de muestreo sistemático, ya que con aquella suelen ser las técnicas más usadas en la practica, si el universo no es homogéneo, sino que está formado por estratos diferentes que constituyen categorías importantes para la investigación, la elección de la muestra no debe hacerse globalmente para todos los estratos a la vez, ya que nos expondríamos a que unos estratos estuvieran más representados que lo que proporcionalmente les corresponde.
En estos casos se debe elegir una muestra para cada estrato por alguno de los procedimientos anteriores. No es aconsejable elevar la división en estratos demasiado lejos, ya que los estratos muy pequeños complican el diseño al aparecer estratos vacíos. Para determinados estratos se suele recurrir a variables espaciales (comunidades, provincias, municipios, por ejemplo), o subdivisiones inherentes al universo en estudio (enseñanza pública/privada, etcétera, por ejemplo).
El muestreo estratificado es el más utilizado en la práctica. Una vez definidos los estratos, dentro de cada uno de ellos se lleva a cabo un muestreo aleatorio simple o sistemático para elegir la submuestra correspondiente al mismo: la determinación del número de elementos que ha de tener cada una de estas submuestras se le denomina afijación de la muestra.
Para hallar la afijación proporcional se extrae de cada estrato el número necesario de individuos para que la distribución de la población y de la muestra coincidan.
Respecto a la afijación de la muestra, se dice que la afijación es simple si en cada estrato elegimos el mismo número de individuos. Según la cantidad de elementos de la muestra que se han de elegir de cada uno de los estratos, existen algunas técnicas de muestreo estratificado que se explicaran a continuación a manera de ejemplo:

Por ejemplo, si se quiere elegir una muestra de 500 individuos y tengo 4 estratos, cada estrato tendrá 125 individuos (500/4). Así:

  • Afijación simple: Presenta una dificultad, en la muestra no está representada la población en realidad. n = 500
    E1!mujeres de menos de 30 años
    E2!mujeres de más de 30 años
    E3!hombres de menos de 30 años
    E4!hombres de más de 30 años
  • Afijacion proporcional: Pretende que cada estrato tenga la misma proporción en la muestra que en la población. Por ejemplo, si en la muestra, en el E1 la proporción de mujeres es de un 40%, en la población también tiene que ser la misma proporción.
    n = 100 Coeficiente de elevación = 5.000/100=50 (se elige
    N = 5.000 1 de cada 50 miembros de la población para la muestra)
    5000
    3000 (60%) 2000(40%)
    2000 1000 1500 500
    M<30>Observamos que hay una proporción entre la muestra y la población. La ventaja es que la muestra representa mejor a la población. En la población hay más mujeres, por lo que la muestra también ofrece una mayor proporción de mujeres. El inconveniente es que no siempre se conoce la distribución para hallar la proporción.
  • La afijación óptima: Consiste en elegir pocos individuos de los estratos que sean muy homogéneos y, por el contrario, elegir muchos individuos de aquellos estratos que sean heterogéneos. El problema, al ser óptima, es que no se sabe si es homogéneo o heterogéneo en la práctica, la muestra recogerá más individuos de aquellos estratos que tengan más variabilidad. Para ello es necesario un conocimiento previo de la población. Un ejemplo aparte de este seria: para un estudio de opinión, puede resultar interesante estudiar por separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos, puede haber cierta homogeneidad. Así, si la población está compuesta de un 55% de mujeres y un 45% de hombres, se tomaría una muestra que contenga también esa misma proporción.
    Para una descripción general del muestreo estratificado y los métodos de inferencia asociados con este procedimiento, suponemos que la población está dividida en h subpoblaciones o estratos de tamaños conocidos N1, N2,...,Nh tal que las unidades en cada estrato sean homogéneas respecto a la característica en cuestión. La media y la varianza desconocidas para el i-ésimo estrato son denotadas por mi y s12, respectivamente.

Muestreo aleatorio conglomerado.- Técnica similar al muestreo por estadios múltiples, se utiliza cuando la población se encuentra dividida, de manera natural, en grupos que se supone que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio.
Dentro de los grupos seleccionados se ubicarán las unidades elementales, por ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición a todas las unidades, es decir, los miembros del grupo, o sólo se le podría aplicar a algunos de ellos, seleccionados al azar. Este método tiene la ventaja de simplificar la recogida de información muestral.
Cuando, dentro de cada conglomerado, se extraen los individuos que formarán parte de la muestra por m.a.s., el muestreo se llama bietápico.
Las ideas de estratificación y conglomerados son opuestas. El primer método funciona mejor cuanto más homogénea es la población respecto del estrato, aunque más diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos entre sí.

En este muestreo, las unidades muestrales no son simples, sino que son colectivos. Por ejemplo, las escuelas, los hospitales, etcétera. Cada uno de estos colectivos reciben el nombre de conglomeraciones.
Pongamos como ejemplo una urna electoral, la elección de los conglomerados puede hacerse por cualquiera de los procedimientos anteriores, aunque es más utilizado el estratificado.
Una vez elegidos los conglomerados:

  • Si son pequeños, el estudio de realiza con todas las unidades que lo componen.
  • Si son grandes, es imposible realizar el estudio con todos los elementos. Hay que recurrir a la elección de una muestra de ese conglomerado.

Se pretende que los conglomerados sean homogéneos entre sí; sin embargo, que las unidades que las componen sean heterogéneas. Por ejemplo, la Facultad de Ciencias Políticas y la Facultad de Derecho, como conglomerados son homogéneos, en cambio, dentro de ellos, dentro del conglomerado hay heterogeneidad porque hay alumnos, profesores, secretarios, etcétera. La diversidad se encuentra dentro del conglomerado.


Homogeneidad de las poblaciones o sus subgrupos.- Homogéneo siginifica, en el contexto de la estratificación, que no hay mucha variabilidad. Los estratos funcionan mejor cuanto más homogéneos son cada uno de ellos respecto a la característica a medir. Por ejemplo, si se estudia la estatura de una población, es bueno distinguir entre los estratos mujeres y hombres porque se espera que, dentro de ellos, haya menos variabilidad, es decir, sean menos heterogéneos. Dicho de otro modo, no hay tantas diferencias entre unas estaturas y otras dentro del estrato que en la población total.
Por el contrario, la heterogeneidad hace inútil la división en estratos. Si se dan las mismas diferencias dentro del estrato que en toda la población, no hay por qué usar este método de muestreo. En los casos en los que existan grupos que contengan toda la variabilidad de la población, lo que se construyen son conglomerados, que ahorran algo del trabajo que supondría analizar toda la población. En resumen, los estratos y los conglomerados funcionan bajo principios opuestos: los primeros son mejores cuanto más homogéneo es el grupo respecto a la característica a estudiar y los conglomerados, si representan fielmente a la población, esto es, contienen toda su viariabilidad, o sea, son heterogéneos


No probabilisticos o de juicio.-

Es Aquél para el que no puede calcularse la probabilidad de extracción de una determinada muestra. Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se considera que la información aportada por esas personas es vital para la toma de decisiones.

Estos pueden ser de tres tipos:

Muestreo accidental.- Es un muestreo no probabilístico donde el investigador elige a aquellos individuos que están a mano. Por ejemplo, un periodista que va por la calle preguntando a las personas que salen a su paso, sin atender ningún criterio especial de elección. No es probabilístico porque aquellas personas que no pasan por ese sitio no tiene la posibilidad de entrar en la muestra.

Muestreo por cuotas.- Se aplica en la última fase del muestreo, y consiste en facilitar al entrevistador el perfil de las personas que tiene que entrevistar dejando su criterio, la elección de las mismas, siempre y cuando cumplan con el perfil.

Muestreo intencionado.- Se basa en una buena estrategia y el buen juicio del investigador. Se puede elegir las unidades del muestreo. Un caso frecuente es tomar elementos que se juzgan típicos o representativos de la población, y suponer que los errores en la selección se compensarán unos con otros. El problema que plantea es que sin una comprobación de otro tipo, no es posible saber si los casos típicos lo son en realidad, y tampoco se conoce como afecta a esos casos típicos los posibles cambios que se producen.

EL MUESTREO

En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población.
Al elegir una muestra se espera que sus propiedades sean extrapolables a la población. Este proceso permite ahorrar recursos, obteniendo resultados parecidos que si se realizase un estudio de toda la población.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un estudio fiable (que represente a la población), debe cumplir ciertos requisitos, lo que lo convertiría en una muestra representativa.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral.
Muestra.- es una parte representativa de la población. Los elementos principales de una muestra son:
  • El marco o base de la muestra. Conjunto de unidades que constituyen la población. Por ejemplo, españoles de ambos sexos que viven en la península y son mayores de edad. Lo ideal sería tener un registro de la población en el que aparecieran todas sus unidades, pero hay ocasiones en que ese registro no existe, pues hay poblaciones que no están censadas. En la práctica suelen utilizarse bases ya formadas como los censos de población o los padrones municipales, etcétera.
  • Unidades muestrales. Cada uno de los elementos que constituyen la base o marco de la muestra. Esas unidades pueden ser individuales o colectivas. Si la unidad es colectiva, al número de individuos que la componen se le llama talla de la muestra
  • Fraccion del muestreo.- Es el porcentaje que representa la muestra sobre el total de la población (n/N100).
    Ejemplo.-
    N = 580.000 (población)
    n = 2.000 (muestra) (2.000/580.000)100= 0'35
  • Coeficiente de elevación.- Es el número de veces que el tamaño de la población contiene al tamaño de la muestra (N/n).
    Ejemplo.-
    N = 200.000 (población)
    n = 1.000 (muestra) 200.000/1.000=200
Población.- Tambien conocido como universo conceptual al conjunto de unidades sobre las que pretendamos obtener cierta información. Esas unidades pueden ser individuales (como, por ejemplo, mujeres de Andalucía, personas de la Tercera Edad, etcétera), compuestas (como, por ejemplo, escuela, ayuntamientos, etcétera), o una serie de objetos (como, por ejemplo, editoriales de un periódico, artículos, etcétera).
Muestra representativa.- es aquella que posee calidad y tamaño apropiado para hacer mínimos los errores de muestreo. Si la inferencia estadística realiza generalizaciones sobre el comportamiento de una población estudiando solo una parte limitada de ella (muestra) entonces si la muestra (o las muestras) no es representativa la inferencia carecerá de valor científico.
La inferencia estadística.- realiza un estudio sobre una o varias muestras extraidas de una población o universo y las conclusiones a las que se arriban son aplicables a todos los elementos de dicha población.
Los estadígrafos muestrales.- son los valores de la característica estudiada en la muestra y que se pueden considerar coinciden con los de la población con una determinada probabilidad de error

Seguidores