Fundamentos de la estadística descriptiva
Analítica educativa
Introducción
La estadística descriptiva es un conjunto de técnicas numéricas y gráficas para describir y analizar un grupo de datos, sin extraer conclusiones (inferencias) sobre la población a la que pertenecen. En este tema se introducirán Algunos de los estadísticos mas importantes que se utiliza la estadística para poder realizar la descripción de datos.
1. Medidas de posición
Las medidas de posición o localización nos indican el valor o valores alrededor de los cuales se sitúan los datos observados. Distinguiremos medidas de localización de tendencia central (media, mediana y moda) y de tendencia no central (cuartiles, deciles y percentiles).
1. Medidas de posición de tendencia central
Como medidas de posición de tendencia central se introducirán la media aritmética o media muestral, la mediana y la moda. Estas medidas nos proporcionan valores alrededor de los cuales se distribuyen los datos observados en la muestra. Media: Se promedio de un conjunto de datos numéricos, calculada como la suma del conjunto de valores dividida entre el número total de valores.
1. Medidas de posición de tendencia central
Mediana: suponemos que los datos de la muestra están ordenados de menor a mayor, la mediana es el valor hasta el cual se encuentran el 50 % de los casos. Por tanto, la mediana dejará la mitad de las observaciones por debajo de su valor y la otra mitad por encima. Así, si la muestra consta de un número impar de datos (n impar), la mediana será el dato central. Si el tamaño de la muestra n es par, entonces se tomará como mediana la media de los dos datos centrales
2. Medidas de posición de tendencia no central
Moda: La moda es el valor o valores que más se repiten. Esto implica que la moda no tiene porqué ser única. Para variables cuantitativas continuas, el intervalo modal es aquel con mayor frecuencia.
1. Medidas de posición de tendencia central
Como medidas de posición de tendencia no central, introduciremos los cuartiles, deciles y percentiles. Cuartiles: Los cuartiles Q1, Q2 y Q3 dividen la muestra en cuatro partes iguales, de manera que por debajo de Q1 tenemos el 25 % de los datos, entre Q1 y Q2 se encuentra otro 25 % y por encima de Q3 otro 25 %. La idea de dividir la muestra en partes iguales se puede generalizar a la construcción de los deciles (d1, . . . , d9, dividen la muestra el 10 partes iguales) y los percentiles (p1, . . . , p99, dividen la muestra el 100 partes iguales). En general, se define el cuantil de orden p (0 < p < 1) como el valor que deja por debajo (a lo sumo) np observaciones (por tanto, n(p − 1) observaciones por encima). El cuantil p se denotará por qp.
3. Medidas de Dispersión absolutas
Las medidas de posición o localización indican en torno a qué valores se sitúan los datos, pero para obtener una descripción más precisa de los mismos, es necesario conocer cuál es la dispersión que presentan. Las medidas de dispersión absolutas dependen de las unidades en las que se miden las observaciones, siendo las más conocidas la varianza muestral y la desviación típica muestral, que no es más que la raíz cuadrada de la varianza muestral.
3. Medidas de Dispersión absolutas
Varianza: La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente se calcula como la suma de las residuos al cuadrado divididos entre el total de observaciones. Desviación típica: La desviación típica o desviación estándar es una medida que ofrece información sobre la dispersión media de una variable. La desviación típica es siempre mayor o igual que cero.
3. Medidas de Dispersión absolutas
Diferencia existe entre la varianza y la desviación típica Tanto la varianza y la desviación típica miden lo mismo. La varianza es la desviación típica elevada al cuadrado. O al revés, la desviación típica es la raíz cuadrada de la varianza. La desviación típica se hace para poder trabajar en las unidades de medida iniciales. Claro que, como es normal, uno puede preguntarse, ¿de qué sirve tener como concepto la varianza? Bien, aunque la interpretación del valor que arroja no nos da demasiada información, su cálculo es necesario para obtener el valor de otros parámetros.
Referencias
Pedro Beatriz Pateiro. (2012). Estadística y metodología de la investigación. España: en Departamento de Estadística, Análisis Matemático y Optimización. http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-DPTO/MATERIALES/Mat_G2021103104_EstadisticaTema1.pdf
8 Analítica educativa - M3 - Fundamentos de la estadística descriptiva
CEV PUCE
Created on February 3, 2020
Start designing with a free template
Discover more than 1500 professional designs like these:
Explore all templates
Transcript
Fundamentos de la estadística descriptiva
Analítica educativa
Introducción
La estadística descriptiva es un conjunto de técnicas numéricas y gráficas para describir y analizar un grupo de datos, sin extraer conclusiones (inferencias) sobre la población a la que pertenecen. En este tema se introducirán Algunos de los estadísticos mas importantes que se utiliza la estadística para poder realizar la descripción de datos.
1. Medidas de posición
Las medidas de posición o localización nos indican el valor o valores alrededor de los cuales se sitúan los datos observados. Distinguiremos medidas de localización de tendencia central (media, mediana y moda) y de tendencia no central (cuartiles, deciles y percentiles).
1. Medidas de posición de tendencia central
Como medidas de posición de tendencia central se introducirán la media aritmética o media muestral, la mediana y la moda. Estas medidas nos proporcionan valores alrededor de los cuales se distribuyen los datos observados en la muestra. Media: Se promedio de un conjunto de datos numéricos, calculada como la suma del conjunto de valores dividida entre el número total de valores.
1. Medidas de posición de tendencia central
Mediana: suponemos que los datos de la muestra están ordenados de menor a mayor, la mediana es el valor hasta el cual se encuentran el 50 % de los casos. Por tanto, la mediana dejará la mitad de las observaciones por debajo de su valor y la otra mitad por encima. Así, si la muestra consta de un número impar de datos (n impar), la mediana será el dato central. Si el tamaño de la muestra n es par, entonces se tomará como mediana la media de los dos datos centrales
2. Medidas de posición de tendencia no central
Moda: La moda es el valor o valores que más se repiten. Esto implica que la moda no tiene porqué ser única. Para variables cuantitativas continuas, el intervalo modal es aquel con mayor frecuencia.
1. Medidas de posición de tendencia central
Como medidas de posición de tendencia no central, introduciremos los cuartiles, deciles y percentiles. Cuartiles: Los cuartiles Q1, Q2 y Q3 dividen la muestra en cuatro partes iguales, de manera que por debajo de Q1 tenemos el 25 % de los datos, entre Q1 y Q2 se encuentra otro 25 % y por encima de Q3 otro 25 %. La idea de dividir la muestra en partes iguales se puede generalizar a la construcción de los deciles (d1, . . . , d9, dividen la muestra el 10 partes iguales) y los percentiles (p1, . . . , p99, dividen la muestra el 100 partes iguales). En general, se define el cuantil de orden p (0 < p < 1) como el valor que deja por debajo (a lo sumo) np observaciones (por tanto, n(p − 1) observaciones por encima). El cuantil p se denotará por qp.
3. Medidas de Dispersión absolutas
Las medidas de posición o localización indican en torno a qué valores se sitúan los datos, pero para obtener una descripción más precisa de los mismos, es necesario conocer cuál es la dispersión que presentan. Las medidas de dispersión absolutas dependen de las unidades en las que se miden las observaciones, siendo las más conocidas la varianza muestral y la desviación típica muestral, que no es más que la raíz cuadrada de la varianza muestral.
3. Medidas de Dispersión absolutas
Varianza: La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente se calcula como la suma de las residuos al cuadrado divididos entre el total de observaciones. Desviación típica: La desviación típica o desviación estándar es una medida que ofrece información sobre la dispersión media de una variable. La desviación típica es siempre mayor o igual que cero.
3. Medidas de Dispersión absolutas
Diferencia existe entre la varianza y la desviación típica Tanto la varianza y la desviación típica miden lo mismo. La varianza es la desviación típica elevada al cuadrado. O al revés, la desviación típica es la raíz cuadrada de la varianza. La desviación típica se hace para poder trabajar en las unidades de medida iniciales. Claro que, como es normal, uno puede preguntarse, ¿de qué sirve tener como concepto la varianza? Bien, aunque la interpretación del valor que arroja no nos da demasiada información, su cálculo es necesario para obtener el valor de otros parámetros.
Referencias
Pedro Beatriz Pateiro. (2012). Estadística y metodología de la investigación. España: en Departamento de Estadística, Análisis Matemático y Optimización. http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-DPTO/MATERIALES/Mat_G2021103104_EstadisticaTema1.pdf