martes, 2 de junio de 2015

MEDIDAS DE DISPERSIÓN



Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos. Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (desviación media) y otra es tomando las desviaciones al cuadrado (varianza).
Desviación absoluta promedio o, sencillamente desviación media o promedio de un conjunto de datos es la media de las desviaciones absolutas y es un resumen de la dispersión estadística. Se expresa, de acuerdo a esta fórmula:
D_m = \frac{1}{N} \sum_{i=1}^N
 \left| x_i - \overline{x} \right|
La desviación absoluta respecto a la media, D_m, la desviación absoluta respecto a la mediana, D_M, y la desviación típica,  \sigma , de un mismo conjunto de valores cumplen la desigualdad:
D_M \leq D_m \leq \sigma
Siempre ocurre
0 \leq D_m \leq \frac{1}{2} Rango
donde el Rango es igual a:
Rango = \text{valor máximo} - \text{valor mínimo}
El valor:
\, D_m = 0
ocurre cuando los datos son exactamente iguales e iguales a la media aritmética. Por otro lado:
D_m = \frac{1}{2} Rango
cuando solo hay dos valores en el conjunto de datos.
Ejemplo:



En teoría de probabilidad, la varianza (que suele representarse como \sigma^2) de una variable aleatoria es una medida de dispersión definida como la esperanza del cuadrado de la desviación de dicha variable respecto a su media. Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso de otras medidas de dispersión más robustas.

Ejemplo:


No hay comentarios.:

Publicar un comentario