Los años arrugan la piel, el miedo arruga el alma. Y tú, ¿tienes miedo?.

viernes, 15 de mayo de 2015

Tema 8. Medidas de tendencia central, posición y dispersión.

No sólo se cuenta con tablas y gráficas, también hay unas medidas que nos pueden aportar información sobre un estudio basándonos en estadística. Son tres las medidas que se pueden realizar: medidas de tendencia central, las cuales nos informan del comportamiento de la mayoría de sujetos ( media aritmética, mediana, moda); medidas de posición, las cuales nos informa de la posiión en una serie numérica ( mediana, percentiles, cuartiles, deciles) o medidas de dispersión, las cuales nos informa de la heterogeneidad de los sujetos (rango o recorrido, desviación típica, desviación típica, varianza, recorrido, coeficiente de variación).
 
Adjunto web que dispone para hacer ejercicios, aunque es muy elemental para aquellas personas que no tengan conceptos estadísticos puede venir muy bien para coger una base.

*Tomaremos la X como \overline{X}en este tema

MEDIDAS DE TENDENCIA CENTRAL. Nos dan el valor de la variable hacia el cual tienden a agruparse los datos.
 









1) Media (X). Es la suma de todo los valores de una variable dividida por el número total de datos.
Se emplea para variables CUANTITATIVAS.
 
- Datos sin intervalos: = Σ (MC . fi) / n
- Datos con intervalos: X =  Σ( xi . fi) / n
 
2) Moda (Mo). Es el valor que más se repite, es decir, que tiene mayor frecuencia. Se emplea tanto para variables CUANTITATIVAS como CUALITATIVA. Puede ser tanto bimodal (dos modas) o multimodal (más de dos modas).
 
- Datos sin intervalos: El resultado es la x que tenga mayor frecuencia.
- Datos con intervalos: El resultado es la MC dela inervalo que tenga mayor frecuencia.
 
3) Mediana (Md). Dato que ocupa la posición central. También pertenece al grupo de valores de medida de posición. Se emplea para variables CUANTITATIVAS.
 

- Datos sin intervalos, se pueden dar dos casos: 
                 - Número sea impar, cogiéndose pue el valor central.
                 - Número sea par, se hace la media de los dos valores intermedios.
- Datos con intervalos: no se ha dado la fórmula.
 Adjunto vídeo recomendado por el tutor como apoyo.  Aquí se muestra la forma de llevara cabo la moda, la media y la mediana mediante un ejemplo.
 
 
 
MEDIDAS DE POSICIÓN. Son aquellas medidas que nos informan sobre el lugar donde se encuentra un valor entre todos los demás.


1) Mediana (Md). Ya se ha habado de ella en el apartado anterior.

2) Cuartil (Q). Divide los datos en 4 partes. 
 
Q 1 = 25 % = 1/4  ----------------------> Indica el valor que deja 25% observaciones menores
Q 2 = 50 % = 2/4  ------mediana-----> Indica el valor que deja 50% observaciones menores
Q 3 = 75 % = 3/4  ----------------------> Indica el valor que deja 75% observaciones menores
Q 4 = 100 % = 4/4  --------------------> Indica el valor mayor alcanzable

3) Deciles (D). Divide la muestra en 10 partes.

D 1 = 1/10 = 10/100 --------------------> Indica el valor que deja 10% observaciones menores
D 2 = 2/10 = 20/100 --------------------> Indica el valor que deja 20% observaciones menores
D 3 = 3/10 = 30/100 --------------------> Indica el valor que deja 30% observaciones menores
D 4 = 4/10 = 40/100 --------------------> Indica el valor que deja 40% observaciones menores
D 5 = 5/10 = 50/100 ------mediana---> Indica el valor que deja 50% observaciones menores
D 6 = 6/10 = 60/100 --------------------> Indica el valor que deja 60% observaciones menores
D 7 = 7/10 = 70/100 --------------------> Indica el valor que deja 70% observaciones menores
D 8 = 8/10 = 80/100 --------------------> Indica el valor que deja 80% observaciones menores
D 9 = 9/10 = 90/100 --------------------> Indica el valor que deja 90% observaciones menores
D 10 = 10/10 = 100/100 ----------------> Indica el valor mayor alcanzable

4) Percentiles (P). Divide la muestra en 100 partes.

P 1 = 1/100 = 1%
P 2 = 2/100 = 2%
P...
P 50 = 50/100 = 50% = MEDIANA = D5 = Q2
P...
P 100 = 100/ 100 = 100%

Adjunto vídeo de ejercicios de medidas de posición. No se ha dado en clase pero es muy sencillo.



MEDIDAS DE DISPERSIÓN

1) Rango o recorrido (R). Diferencia entre el mayor y el menor valor.
 Fórmula= I xn -x1I    (valor absoluto = siempre positivo)
 
Ejemplo:
       - Serie 1: 10, 20, 30, 60, 50, 60, 65, 70, 57  => Rango = 57 - 10 = 47
       - Serie 2: 5, 20, 35, 40, 60, 60, 67, 80, 87, 97  => Rango = 97 - 5 = 92

2) Desviación media (DX). Media aritmética de las distancias de cada observación con respeto la medida de la muestra.
                   - Datos sin intervalos:  DX= Σ I xi - X I / n
                   - Datos con intervalos: DX= Σ fi I mc - X I/ n

3) Desviación típica (S). Cuantificar el error que se cometo si se representa una muestra únicamente por su media.
                   - Datos sin intervalos:  S = √ [ Σ (xi - X)²/ n-1]
                   - Datos con intervalos: S = √ [ Σ fi (mc - X)²/ n-1]

4) Varianza (S²). Expresa la misma información que la desviación típica al cuadrado.
                   - Datos sin intervalos:  S² = [Σ (xi - X)²/ n-1]
                   - Datos con intervalos: S² = [ Σ fi (mc - X)²/ n-1]

5) Recorrido intercuartílicos. Es la diferencia entre el tercer y el primer cuartil = I Q3 - Q1 I

6) Coeficiente de variación (cv). Medida de dispersión relativa. Compara la heterogeneidad de dos series numéricas con independencia de las unidades de medidas.

                                                                     cv = S.100/ X

Adjunto vídeo recomendado por el tutor como apoyo. Se muestra las fórmulas de las medidas de dispersión y nos explica con un ejemplo qué significa este tipo de medidas. Posterior mente con dos ejemplo lleva a cabo ejercicios de este tipo.
 

DISTRIBUCIÓN NORMAL/ CAMPANA DE GAUSS. Es la distribución de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales. La gráfica de su función tiene una forma acampanada y es simétrica respecto de los valores posición central (media, moda, mediana) que coinciden en las distribuciones.
 
 
ASIMETRÍA. Es el lado contrario al que vemos l pico, es decir, si vemos el pico hacia la derecha la asimetría es a la izquierda, justo en el lado que queda la media de la mediana.

Para ver el grado de asimetría de la distribución de sus datos en torno a su media se utiliza el coeficiente de asimetría de una variable (g).

g1 = 0 => distribución simétrica
g1 > 0 => asimétria positiva   => asimetría a la derecha
g1 < 0 => asimétria negativa  => asimetría a la izquierda

CURTOSIS O APUNTAMIENTO. Sirve para medir el grado de concentración de los valores que toma en torno a su media. Se elige como referencia una variable con distribución normal, de modo que para ella el coeficiente de curtosis es 0.

g2 = 0 => mesocúrtica => grado de concentración  medio alrededor variables centrales
g2 > 0 => leptocúrtica => elevado grado de concentración  alrededor variables centrales
g2 < 0 => platicúrtica => reducido grado de concentración  alrededor variables centrales 


CONCLUSIÓN. También se disponen a parte de gráficas y tablas para leer los resultados de medidas, tanto de centralización (media, moda, mediana) que nos aportan información sobre los valores que quedan en medio; las medidas de posición (mediana, cuartil, percentil, decil) que nos informa sobre la posición y de dispersión (desviación media, desviación típica, varianza, rango, intercuartil, coeficiente de variación) que nos muestran la dispersión entre unos valores y otro. Cuando nos encontramos con una distribución simétrica, coinciden las medidas de centralización, si no ocurrierra la distribución sería asimétrica. En cuanto a la curtosis informa sobre  el grado de concentrado de los datos: leptocúrtica elevado, mesocúrtica medio y platicúrtia bajo.

No hay comentarios:

Publicar un comentario