jueves, 26 de mayo de 2016

TEMA 9: ESTADÍSTICA INDIFERENCIAL: MUESTREO Y ESTIMACIÓN

INDIFERENCIA ESTADÍSTICA

Cuando planteamos un estudio en el ámbito sanitario para establecer relaciones entre variables, nuestro interés no suele estar exclusivamente en los pacientes concretos a los que hemos tenido acceso, sino más bien en todos los pacientes similares a estos.

Tenemos que conocer una serie de conceptos:
  • Población de estudio: Es el conjunto de pacientes sobre los que queremos estudiar la cuestión.
  • Muestra: Es el conjunto de individuos concretos que participan en el estudio.
  • Tamaño muestral: Es el número de individuos de la muestra.
  • Inferencia estadística: Es el conjunto de procedimientos estadísticos que permiten pasar de os particular, la muestra, a lo general, la población.
  • Técnicas de muestreo: Es el conjunto de procedimientos que permiten elegir muestras de tal forma que éstas reflejen las características de la población, sirve para evitar los sesgos.
Es importante considerar, que siempre que trabajemos con muestras, aunque sean representativas, hay que asumir un cierto error.
Si la muestra se elige por un procedimiento de azar, se puede evaluar ese error. La técnica de muestreo en ese caso se denomina muestreo probabilistico o aleatorio, mientras que el error asociado a esa muestra elegida al azar se llama error aleatorio.
Sin embargo, en los estudios probabilísticos, no podemos evaluar el error aleatorio, sin embargo podemos evaluarlo gracias a las leyes de la probabilidad.
Cuanto mayor sea el tamaño de la muestra, favorezco la reducción del error aleatorio por probabilidad. 

PROCESO DE LA INFERENCIA ESTADÍSTICA 

Tenemos una población de estudio, y la medida que queremos obtener se llama parámetro. Es decir el parámetro es un número que resume la gran cantidad de datos que pueden derivarse del estudio de una variable estadística.


Realizamos una selección aleatoria, y obtenemos una muestra, y la medida de la variable de estudio obtenida en la muestra, se denomina estimador.


El proceso por el que a partir del estimador, me aproximo al parámetro se denomina INFERENCIA.


ERROR ESTÁNDAR

El error estándar es la medida que trata de captar la variabilidad de los valores del estimador. El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestra de un determinado tamaño que pudiésemos tomar de una población.

Es importante saber que cuanto más pequeño es el error estándar de un estimador, más fiabilidad tendrá el valor de una muestra determinada.

¿Cómo calculamos el error estándar?

Va a depender de cada estimador: 

  • Error estándar para una media

  • Error estándar para una proporción:

De ambas fórmulas se deduce que,mientras mayor sea el tamaño de una muestra, menor será el error estándar.

TEOREMA CENTRAL DEL LÍMITE

Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con medida de la población y desviación típica igual al error estándar del estimador de que se trate.

Si sigue una distribución normal,sigue los principios básicos de ésta:

INTERVALO DE CONFIANZA

Se trata  de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio).

Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menos que ambos números.

Se calcula considerando que el estimador muestral sigue una distribución normal como establece la teoría central del límite.


A continuación vamos a realizar un problema, explicativo:

Problema: Estamos interesados en conocer el consumo diario medio de cigarrillos entre los alumnos de un centro de Bachillerato de nuestra localidad. Seleccionada una muestra aleatoria de 100 alumnos se observó que fumaban una media de 8 cigarrillos diarios. Si admitimos que la varianza de dicho consumo es de 16 cigarrillos en el colectivo total, estime dicho medio con un nivel de confianza del 95%.


DATOS:
  • n= 100 alumnos.
  • ⴟ= 8 cigarrillos.
  • S2= 16 cigarrillos.
  • Z= 1'96, ya que el nivel de confianza es del 95% (ya que el problema sigue una distribución normal).
Tendremos que aplicar la fórmula adecuada, para determinar el error estándar de una media.






Por lo tanto el resultado sería: 
  • IC = 99% [6'9-9'9]
  • IC=95% [7'22-8'78]
A continuación pondremos otro ejemplo, en este caso un tipo de error estándar para una proporción.

Problema: Tomada al azar una muestra de 120 estudiantes de una universidad se encontró que 54 de ellos hablaba inglés. Halle con un nivel de confianza del 95% con un intervalo de confianza para estimar la proporción de estudiantes que hablan el idioma inglés entre los estudiantes de esa Universidad.





MUESTREO PROBABILÍSTICO

Todos y cada uno de los elementos tienen la misma probabilidad de ser elegidos.
Es el método que consiste en extraer una parte (o muestra) de una población o universo, de tal forma que todas las muestras posibles de tamaño fijo, tengan la misma posibilidad de ser seleccionados.
  • Aleatorio Simple: Se caracteriza porque cada unidad tiene la probabilidad equitativa de ser incluida en la muestra:
De sorteo o rifa: Asignamos un nº a cada miembro de la población, calculamos el tamaño muestral y seleccionamos aleatoriamente ese nº. este tipo de método no es fácil cuando la población es muy grande, pasando a usar el sistema que continua. 
Tabla de números aleatorios: más económico y requiere menor tiempo. Se hace cuando disponemos de una lista informatizada en una base de datos de la población de estudio. 

  • Aleatorio Sistemático.
Similar al aleatorio simple, en donde cada unidad del universo tiene la misma probabilidad de ser seleccionada.
Ejemplo: si N:500 (población) y n:100 (personas que queremos en la muestra N/n=5     
5 será el intervalo para la selección de cada unidad muestral.  Si tengo las personas por número seria así: saco un número aleatorio de la población y a partir de ahí cada 5 elijo al sujeto de estudio. Si saco el 320 a partir de 325, 330, 335... Hasta llegar a 100. Si termino la lista y no he llegado al 100, vuelvo a empezar de nuevo, pero siempre con el intervalo que me ha salido.


  • Estratificado: 
Se caracteriza por la subdivisión de la población de estudio en subgrupos o estratos, debido a que las variables principales que deben someterse a estudio presentan cierta variabilidad o distribución conocida que puede afectar a los resultados. Si quiero hacer un estudio sobre cifras de presión arterial, si la población de estudio el 25% son menores de 15 años, el 50% entre 15-65 años y el 25% mayores de 65. Si la muestra que necesito es de 200 personas. Seleccionare aleatoriamente siguiendo el procedimiento anterior 100 personas de entre 15-65 años, 50 menores de 15 años, y 50 mayores de 65.  Se usa principalmente por motivos de edad y sexo.

  •  Conglomerado.
Se usa cuando no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman el universo y resulta muy complejo elaborarla. En la selección de la muestra en lugar de escogerse cada unidad se toman los subgrupos o conjuntos de unidades conglomerados. Por ejemplo, quiero hacer un estudio de Andalucía (poblaciones amplias sobre las que se usa este método), calculo el tamaño muestral, pero si hago un muestreo aleatorio me puede salir cada sujeto en un pueblo distinto de la población andaluza, para evitarlo se seleccionan un grupo de municipios y dentro de ese municipio se hacen muestreo aleatorio simple.
 En este tipo de muestreo el investigador no conoce la distribución de la variable. 
Las inferencias que se hacen en una muestra conglomerada no son tan confiable como las que se obtienen en un estudio hecho por muestreo aleatorio, excluyendo directamente grandes municipios. El municipio se elige por estratificación a su vez. 

MUESTREO NO PROBABILÍSTICO 

  • No se sigue el proceso aleatorio.
  • No puede considerarse que la muestra sea representativa de una población.
  • Se caracteriza porque el investigador selecciona la muestra siguiendo algunos criterios identificados para los fines del estudio que realiza.
  • Por conveniencia o intencional: en el que el investigador decide, según sus objetivos, los elementos que integraran la muestra, considerando las unidades “típicas” de la población que desea conocer.


-Tipos:
Por cuotas: en el que el investigador selecciona la muestra considerando algunos fenómenos o variables a estudiar, como: Sexo, raza, religión, etc. 
Accidental: consiste en utilizar para el estudio las personas disponibles en un momento dado, según lo que interesa estudiar. De las tres es la más deficiente. 
Por conveniencia o intencional. En el que el investigado, decide según sus objetivos, loe elementos que integraran la muestra, considerando las unidades “típicas” de la población que se desea conocer. 

TAMAÑO DE LA MUESTRA.


Por últimos explicaremos a través de un vídeo tutorial, como calcular el tamaño muestral:





Hasta pronto!!



No hay comentarios:

Publicar un comentario