Los años arrugan la piel, el miedo arruga el alma. Y tú, ¿tienes miedo?.

viernes, 22 de mayo de 2015

Tema 9. Estadistica interferencial: muestreo y estimación

Para introducirse en este tema primero se ha de conocer una serie de conceptos:
  • Población de estudio. Conjunto de pacientes sobre los que participan en el estudio.
  • Tamaño muestra. Número de individuos de la muestra para que sea referente.
  • Inferencia estadística. Conjunto de procedimientos estadísticos que permiten pasar de lo particular, la muestra, a lo general, la población.
  • Técnicas de muestreo. Conjunto de procedimientos que permiten elegir muestras de tal forma que éstas reflejen las características de la población.
  • Si la muestra se elige l azar se puede evaluar el error, esa técnica se denomina muestreo probabilístico o aleatorio y el error asociado error aleatorio.
  • En los muestreos no probabilísticos no es posible evaluar el error.
En el proceso de inferencia estadística constamos de un parámetro (medida que queremos obtener de la población estudio) y un estimador (medida de la variable de estudio obtenida en la muestra). La incidencia es por lo tanto el proceso a partir del cual es estimador se aproxima al parámetro.

El error estándar es la medida que trata de captar la variabilidad de los valores del estimador. Mide el grado de variabilidad del estimador en las distinta muestras de una población. Cuanto más pequeño sea, más fiabilidad tendrá el valor de una muestra concreta. Cuanto mayor sea el tamaño de la muestra menor será el error estándar. Se puede calcular tanto por media como por proporción.
 
Forma de calcular el error estándar para una media. Ver el vídeo a partir del minuto 10:51. FÓRMULA => e = s/√n


También se puede llevar a cabo el error estándar para una media. FÓRMULA => e = √ (p (1-p)/n)

 S= desviación típica
 n= tamaño muestras
 p = proporción del  estimador



Para estimadores que se expresen como suma de los valores de una distribución normal sacados de la media de la población y con desviación típica igual al error estándar del estimador de que se trate.

Esta misma imagen empleada en el tema antes se va a utilizar para poner en relación los porcentajes de las observaciones y las desviaciones típicas:

           +- 1S ---------> 68 %
           +- 2S ---------> 95 %
            +- 3S --------> 99 %

Estos datos son una aproximación pero no son los realmente correctos.


Los intervalos de confianza son un medio para conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio). Son números que con un nivel de confianza determinados aseguran que el valor del parámetro es mayor o menor que ambos números. Se calcula suponiendo que el estimador muestral sigue una distribución norma de Gauss. A mayor confianza dada al intervalo, más amplio será el intervalo y por lo tanto menos preciso.

Este me ha parecido un buen ejercicio para explicar este apartado, la única diferencia que guarda con la forma de hacerlo explicada, es la forma de averiguar Z, pues nosotros lo que levamos a cabo es ver el intervalo de confianza y relacionarlo con las Z que hemos guardado relación en la imagen de ante, si no es ninguna de las anteriores, hemos de tener a mano la tabla que relaciona ambos datos.

                FÓRMMUA => X +- Z . (s/√n)
 
 
Hay otra forma de realizar el intervalo de confianza, mediante la proporción, esto es similar a lo anterior la última parte, lo único que varía es la fórmula. Se debe de introducir los datos obtenidos, previamente calculando z si no nos lo han dado y mediante la fórmula:

                     p+- z . ( p.q)/n      p = enfermos ; q = 1- p ; s = desviación típica) ; n = muestra
 
En cuanto al procedimiento muestral, se define como el método que permite que a partir de escoger un grupo de la población pueda tener un grado de probabilidad de que ese pequeño grupo posee las características de la población que estamos estudiando. La muestra de la cual se quiere obtener conclusiones se elige al azar. Hay dos tipos de muestreos: probabilístico y no probabilístico.
  • Muestreo probabilístico. Toda la población tiene una probabilidad distinta a cero en la selección de la muestra.
         - Aleatorio simple (MAS). Se seleccionan de uno en uno (= probabilidad).
         - Aleatorio sistemático. Selecciona un número (n) y escoge de n a n.
         - Estratificado. La población se divide en estratos y se le da un número a cada estrato luego elegir por MAS.
          - Conglomerado. Se toma los conjuntos de unidades conglomerados.
  • Muestreo no probabilístico. Hay personas en la población que no tengan probabilidad o que no se conozca, que han sido seleccionados en la muestra
                     - Accidental. Selección en función e algunas variables a estudiar o fenómenos.
                     - Por cuotas. Personas disponibles en un momentos que tengas características que se desean estudiar.

Como ya somos conscientes, el tamaño de la muestra es un factor importante para llevar una buena investigación o estudio. Esta depende de factores como error estándar, de la diferencia entre los grupos de comparación de los valores a estudiar, de la varianza de la población y del tamaño de la población de estudio. El tamaño de una muestra se puede estudiar de dos formas, mediante la media o mediante la proporción.

 
Adjunto vídeo que el tutor nos ha adjuntado como material de refuerzo de esta parte del tema.

En este vídeo se explica de forma dinámica los tipos de muestreos. También muestra la forma de calcular el número de muestra mediante la proporción, pero yo lo he añadido para  la primera parte pues para la siguiente parte he utilizado otro vídeo, por lo tanto el material que me interesa que sea visualizado va del minuto 0 al 4:04.

 
Cálculo del tamaño muestral mediante la proporción: FÓRMULA => n = (z² . p . q )/ e ²
                    n = muestra
                    z = desviación
                    p = enfermos
                    q = 1- p
                    e = error asumido
 
 
Cálculo del tamaño muestral mediante la media: FÓRMULA => n= z² . s²/ e2  

                    n = muestra
                    z = relacionar nivel confianza con ella (Gauss)
                    s = desviación típica
                    e = error asumido
 
 
CONCLUSION. A la hora de realizar una investigación es primordial tomar un número de muestra adecuado para que haga una representación de la población para ello se calcula el tamaño muestral y se puede realizar bien por media o por proporción. Una vez sabido el tamaño muestras debes de elegir la forma en la que tomaremos la muestra pudiendo ser probabilístico, en la que toda la población tenga una probabilidad o no probabilístico en la que no toda la población tenga probabilidad. Dentro de ellos hay subgrupo en los que se tomaran de formas diferentes las muestras.

No hay comentarios:

Publicar un comentario