Estadística descriptiva. Medidas de tendencia central, de dispersión y de posición. Desviación estándar y varianza.
Autor: Jorge Albán Villacís
Estadística descriptiva - Introducción
Introducción
La estadística descriptiva se ocupa de obtener datos nuevos, los cuales procede a resumir y organizar para facilitar su análisis e interpretación; para ello, utiliza medidas de tendencia central, de dispersión y de posición.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Palabras/Reto
Palabras Claves
- Media
- Mediana
- Moda
- Desviación estándar
- Varianza
Reto
¿Cuáles son las principales diferencias de las medidas de tendencia central y las medidas de dispersión?
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Medidas de tendencia central
Medidas de tendencia central
Las medidas de tendencia central son puntos en una distribución −los valores medios o centrales de esta−, y nos ayudan a ubicarla dentro de la escala de medición. Las principales medidas de tendencia central son tres: media, mediana y moda. El nivel de medición de la variable determina cuál es la tendencia central apropiada.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Medidas de tendencia central
El examen estadístico de estas medidas permite obtener un atributo de toda la información recabada; es decir, las medidas de tendencia central advierten y resumen el comportamiento de un conjunto de datos.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Medidas de tendencia central
El nivel de medición de la variable determina cuál es la medida de tendencia central apropiada para interpretar.
A pesar de su importancia, su análisis no debe hacerse separadamente de las medidas de dispersión, ya que estas están asociadas con el grado de concentración de la información.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Media aritmética o promedio
Media aritmética o promedio
La media puede definirse como el promedio aritmético de una distribución. Se simboliza como,
y es la suma de todos los valores dividida entre el número de casos.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Media aritmética o promedio
Es la medida de tendencia central más conocida y utilizada. Se calcula sumando todos los valores observados y dividiendo por el número de observaciones de la muestra. Su principal ventaja es su fácil manejo matemático y estadístico. Sin embargo, tiene la desventaja de ser muy sensible a los valores extremos en una muestra que no tenga una distribución normal.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Media aritmética o promedio
Es una medida solamente aplicable a las mediciones de intervalos o de razón. Carece de sentido para variables medidas en un nivel ordinal o nominal. Su fórmula es la siguiente:
Ejemplo
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Propiedades de la media aritmética
Propiedades de la media aritmética
- Todo conjunto de datos de nivel de intervalo y de nivel de razón tiene un valor medio.
- Al evaluar la media, se incluyen todos los valores.
- Un conjunto de valores solo tiene una media.
- La cantidad de datos que se evalúan rara vez afecta la media.
- Es la única medida de ubicación donde la suma de las desviaciones de cada valor con respecto a la media siempre es 0.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva -Media ponderada
Media ponderada
La media ponderada de un conjunto de números (X1, X2, Xn…) con las ponderaciones correspondientes (w1, w2, wn…). Se calcula con la siguiente fórmula:
Ejemplo
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Mediana
Mediana
La mediana es el valor que divide la distribución por la mitad. Es la puntuación central de una serie de datos ordenados; es la puntuación que deja por debajo el 50% de los datos y también por arriba.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Mediana
Es el dato que queda en el centro de la distribución cuando los datos están ordenados de menor a mayor.
La mediana refleja la posición intermedia de la distribución. Solo se puede utilizar a partir de escalas ordinales.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Mediana
La mediana es el punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor; es decir, la misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Propiedades de la mediana
Propiedades de la mediana
- Es única para cada conjunto de datos.
- No se ve afectada por valores muy grandes o muy pequeños, y, por lo tanto, es una medida valiosa de tendencia central.
- Puede obtenerse para datos de nivel de razón, de intervalo y ordinal.
- Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la mediana no se encuentra en una de estas clases.
Ejemplos
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Moda
Moda
Es la categoría o puntuación que ocurre con mayor frecuencia, es decir, la “más popular”. Es el valor que se observa con más frecuencia, el más repetido. Para determinar la moda, es necesario que los datos se ordenen y se tabulen antes, para conocer la frecuencia de cada valor o intervalo.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Moda
Si no se repite ningún valor, la muestra no tiene moda, es amodal. Si se repiten varios valores diferentes, puede ser bimodal, trimodal o multimodal.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Moda
En el caso de que la variable medida se agrupe en intervalos, hay que referirse al "intervalo modal", que es el intervalo que tiene mayor frecuencia. La moda será la marca de clase de dicho intervalo.
Ejemplos
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Medidas de dispersión o variabilidad
Medidas de dispersión o variabilidad
Indican la dispersión de los datos en la escala de medición. Las medidas de tendencia central son valores en una distribución, y las medidas de variabilidad son intervalos que designan distancias o un número de unidades en la escala de medición, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos. Las medidas de dispersión más utilizadas son: rango, desviación estándar y varianza.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Rango
Rango
También llamado recorrido, es la diferencia entre la puntuación mayor y la puntuación menor, e indica el número de unidades en la escala de medición que se necesitan para incluir los valores máximo y mínimo.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Rango
Su principal ventaja es que se calcula con gran facilidad; pero, dado que no tiene en cuenta los valores intermedios, su utilidad es muy limitada. Es útil como media de dispersión en las variables cualitativas ordinales, o para indicar si nuestros datos tienen algunos valores extraordinarios.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Rango
Cuanto más grande sea el rango, mayor será la dispersión de los datos de una distribución. Se representa por R y su fórmula de cálculo es la siguiente: R = Xmax - Xmin Donde:
- R es el rango.
- Máx es el valor máximo de la muestra o población.
- Mín es el valor mínimo de la muestra o población estadística.
- x es la variable sobre la que se pretende calcular esta medida.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Propiedades del rango
Propiedades del rango
- Es la diferencia entre el valor más alto y el más bajo en un conjunto de datos, mostrando cuánto varían los valores.
- Puede cambiar con nuevos datos, reflejando variaciones o tendencias emergentes.
- Es especialmente útil para evaluar la variabilidad o dispersión.
Ejemplos
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Desviación estándar o típica
Desviación estándar o típica
Es el promedio de desviación de las puntuaciones con respecto a la media. Esta medida se expresa en las unidades originales de medición de la distribución. Se interpreta en relación a la media. Cuanto mayor sea la dispersión de los datos alrededor de la media, mayor será la desviación estándar. Se simboliza con (s), y su fórmula es la siguiente:
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Desviación estándar o típica
Esto es, la desviación de cada puntuación respecto a la media se eleva al cuadrado, se suman todas las desviaciones cuadradas, se divide entre el número total de puntuaciones, y a esta división se le saca la raíz cuadrada.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Desviación estándar o típica
Es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución, que mide el grado de dispersión o variabilidad. Por lo tanto, una desviación estándar alta indica una gran dispersión de los valores de los datos, mientras que una desviación estándar baja indica una dispersión angosta de los valores agrupados en torno a la media del conjunto de datos.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Desviación estándar o típica
Ejemplo:
Un profesor enseña a dos grupos de la maestría de Salud pública y selecciona aleatoriamente una muestra de calificaciones de los exámenes realizados por los dos grupos. Halle la desviación típica de cada muestra:
▪ Grupo 1: 50, 60, 70, 80, 90.
▪ Grupo 2: 72, 68, 70, 74, 66.
Desviación estándar grupo 1
Desviación estándar grupo 2
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Varianza
Varianza
La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente, se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones, entendiendo como residuo la diferencia entre el valor de una variable en un momento y el valor medio de toda la variable.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Varianza
Es una medida de cuánto las observaciones de la variable difieren del valor esperado.
Muestra
Población
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Propiedades de la varianza
Propiedades de la varianza
- Es una medida de dispersión que indica cuánto se alejan los datos de su media.
- Elevar al cuadrado los residuos evita sumas negativas, permitiendo que la varianza siempre sea positiva.
- Es fundamental para calcular otros parámetros estadísticos, como la covarianza.
Ejemplo
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Conclusiones
Conclusiones
Medidas de tendencia central
Media aritmética
Mediana
Moda
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Conclusiones
Medidas de dispersión
Rango
Varianza
Desviación estándar
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Conclusiones
Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la forma en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística, diremos que se encuentran “agrupados”, mientras que, si los datos no están en una tabla, hablaremos de datos “no agrupados”.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Bibliografía
Bibliografía
https://www.jmp.com/es_cl/statistics-knowledge-portal/what-is-correlation/correlation-coefficient.html
https://www.jmp.com/es_co/statistics-knowledge-portal/what-is-correlation.html
https://belver.clavijero.edu.mx/cursos/nme/semestre5/probyest_1/s3/contenidos/cuartiles_deciles_y_percentiles.html
https://psicologiaymente.com/miscelanea/variable-dependiente-independiente
https://www3.uji.es/~epifanio/DOCENCIA/aut1etdi.pdf
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Bibliografía
https://www.studocu.com/latam/document/universidad-autonoma-de-santo-domingo/estadistica-general/cuestionario-sobre-graficos/23373944
https://dsp.facmed.unam.mx/wp-content/uploads/2013/12/Quevedo-F.-Medidas-de-tendencia-central-y-dispersion.-Medwave-2011-Ma-113..pdf
https://www.jmp.com/es_cl/statistics-knowledge-portal/what-is-correlation/correlation-coefficient.html
https://www.jmp.com/es_co/statistics-knowledge-portal/what-is-correlation.html
https://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S0465-546X2008000200011
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Bibliografía
Anónimo (13 de septiembre de 2017). Diagrama de barras, gráfico circular y polígono de frecuencias. Obtenido de https://matemovil.com/diagrama-de-barras-grafico-circular-y-poligono-de-frecuencias/
Anónimo (13 de febrero de 2017). Medidas de dispersión: rango, varianza, desviación típica y coeficiente de variación. Obtenido de https://www.aulafacil.com/cursos/estadisticas/gratis/medidas-de-dispersion-rango-varianza-desviacion-tipica-y-coeficiente-de-variacion- l 1 1218 #:~: text=% 2 d% 20 rango% 3 a% 20 mide% 20 la% 20 amplitud% 20 de, l a% 20 serie% 20 y% 20 la% 20 media.& text= por% 20 el% 20 contrario% 2 c% 20 mi
Jauregui, M. (19 de febrero de 2016). La media aritmética. Obtenido de https://aprendiendoadministracion.com/medidas-de-tendencia-central-media-mediana-moda-rango-y-eje-medio/
Matemáticas IV. Estadística y principios de probabilidad (14 de julio de 2019). Estadística descriptiva. Obtenido de https://www.uaa.mx/centros/cem/dmf/wp-content/uploads/2015/apuntes/4.% 20 estadistica% 20 y% 20 principios% 20 de% 20 probabilidad/ apuntes% 20 estadistica. pdf
Tema revisado
Ejemplo:
Durante un periodo de una hora en una tarde calurosa de un sábado, se vendieron cincuenta bebidas. Calcule la media ponderada de los precios de las bebidas. (Precio −primer valor−, cantidad vendida −segundo valor−): (.50, 5), (.75, 15), (.90, 15), (1.10, 15).
La media ponderada es: (.50 x 5 + .75 x 15 + .90 x 15 + 1.10 x 15) / (5 + 15 + 15 + 15) = $43.75/50 = 0.875
La media aritmética o promedio aritmético. Se representa por la letra griega μ cuando se trata del promedio del universo o población, y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante destacar que μ es una cantidad fija, mientras que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc.
La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de frecuencia, la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una muestra puede tener más de una moda.
Ejemplos: Calcule la varianza de los siguientes datos muestrales: 6, 8, 7, 10, 3, 5, 9, 8. De acuerdo a los datos del problema tenemos:
- Σxᵢ = 56
- N = 8
- x̄ = 56/8 = 7
Finalmente, calculamos la varianza muestral:
Puede que en una distribución haya más de una moda, pero que no todas tengan la misma altura. La más alta sería la moda mayor, y la otra u otras serían la moda menor.
Gráficamente, la moda equivale al valor que alcanza la frecuencia máxima o pico en el polígono de frecuencias.
Desviación estándar grupo 1:
Datos = 50, 60, 70, 80, 90.
- Σxᵢ = 350
- N = 5
- x̄ = 350/5 = 70
Finalmente, calculamos la desviación estándar muestral:
Ejemplo: La familia Pérez posee cuatro vehículos. Los datos de los kilómetros recorridos por cada vehículo son: 56 000, 23 000, 42 000 y 73 000. ¿Cuál es el promedio de kilómetros recorridos por los cuatro vehículos? Esto es (56 000 + 23 000 + 42 000 + 73 000) / 4 = 48 500 x = 48500 kilómetros
La varianza representa la variabilidad de una serie de datos respecto a su media. Se representa con el símbolo σ² (sigma cuadrado) para el universo o población, y con el símbolo s2 (s cuadrado) cuando se trata de la muestra, y se expresa en unidades de variable al cuadrado.
Desviación estándar grupo 2: Datos = 72, 68, 70, 74, 66.
- Σxᵢ = 350
- N = 5
- x̄ = 350/5 = 70
Finalmente, calculamos la desviación estándar muestral:
La media aritmética de la muestra se representa con x, mientras que la media aritmética de la población se representa con la µ.
La desviación estándar, que es la raíz cuadrada de la varianza, se representa por σ (sigma) cuando pertenece al universo o población, y por “s” cuando pertenece a la muestra; σ² y σ son parámetros, constantes para una población particular; s2 y s son estadígrafos, valores que cambian de muestra en muestra dentro de una misma población. La desviación estándar se expresa en unidades de variable.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir un conjunto de valores en un solo valor. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda.
Ejemplos: Calcule la mediana para los siguientes datos, siendo la edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22. Al ordenar los datos de manera ascendente, quedan: 19, 20, 21, 22, 25. La mediana es 21.
La altura, en centímetros, de cuatro jugadores de básquetbol es 176, 173, 180 y 175. Al ordenar los datos de manera ascendente, quedan: 173, 175, 176, 180. La mediana es 175.5 cm.
Ejemplos: Si tenemos los siguientes valores: 17, 18, 20, 20, 24, 28, 28, 30, 33. El rango será: 33 - 17 = 16
La desviación estándar se interpreta como cuánto se desvía, en promedio, de la media un conjunto de puntuaciones. Representa todas las diferencias de las observaciones respecto a la media, y es la raíz cuadrada de la varianza.
Las medidas de dispersión, en cambio, miden el grado de dispersión de los valores de la variable. Dicho en otros términos, las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos entregando información acerca de su posición y su dispersión.
La varianza y la desviación miden la dispersión promedio alrededor de la media; es decir, cómo las observaciones mayores fluctúan por encima de esta y cómo las observaciones menores se distribuyen por debajo de esta, como medidas de variabilidad más importantes.
El rango se define como la diferencia entre el mayor valor de la variable y el menor valor de la variable.
La mediana es el valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana. Si el número de observaciones es par, la mediana corresponde al promedio de los dos valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11) / 2=10.
Ejemplos: Ejemplo:
25, 30, 20, 25, 25, 25, 10, 5, 15, 5. Moda= 25
Nota: para un conjunto con un número par de números, la mediana es el promedio aritmético de los dos números medios.
T-SPU_25_001031_01
Prisma Education
Created on March 20, 2025
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Modern Presentation
View
Terrazzo Presentation
View
Colorful Presentation
View
Modular Structure Presentation
View
Chromatic Presentation
View
City Presentation
View
News Presentation
Explore all templates
Transcript
Estadística descriptiva. Medidas de tendencia central, de dispersión y de posición. Desviación estándar y varianza.
Autor: Jorge Albán Villacís
Estadística descriptiva - Introducción
Introducción
La estadística descriptiva se ocupa de obtener datos nuevos, los cuales procede a resumir y organizar para facilitar su análisis e interpretación; para ello, utiliza medidas de tendencia central, de dispersión y de posición.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Palabras/Reto
Palabras Claves
Reto
¿Cuáles son las principales diferencias de las medidas de tendencia central y las medidas de dispersión?
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Medidas de tendencia central
Medidas de tendencia central
Las medidas de tendencia central son puntos en una distribución −los valores medios o centrales de esta−, y nos ayudan a ubicarla dentro de la escala de medición. Las principales medidas de tendencia central son tres: media, mediana y moda. El nivel de medición de la variable determina cuál es la tendencia central apropiada.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Medidas de tendencia central
El examen estadístico de estas medidas permite obtener un atributo de toda la información recabada; es decir, las medidas de tendencia central advierten y resumen el comportamiento de un conjunto de datos.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Medidas de tendencia central
El nivel de medición de la variable determina cuál es la medida de tendencia central apropiada para interpretar. A pesar de su importancia, su análisis no debe hacerse separadamente de las medidas de dispersión, ya que estas están asociadas con el grado de concentración de la información.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Media aritmética o promedio
Media aritmética o promedio
La media puede definirse como el promedio aritmético de una distribución. Se simboliza como,
y es la suma de todos los valores dividida entre el número de casos.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Media aritmética o promedio
Es la medida de tendencia central más conocida y utilizada. Se calcula sumando todos los valores observados y dividiendo por el número de observaciones de la muestra. Su principal ventaja es su fácil manejo matemático y estadístico. Sin embargo, tiene la desventaja de ser muy sensible a los valores extremos en una muestra que no tenga una distribución normal.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Media aritmética o promedio
Es una medida solamente aplicable a las mediciones de intervalos o de razón. Carece de sentido para variables medidas en un nivel ordinal o nominal. Su fórmula es la siguiente:
Ejemplo
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Propiedades de la media aritmética
Propiedades de la media aritmética
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva -Media ponderada
Media ponderada
La media ponderada de un conjunto de números (X1, X2, Xn…) con las ponderaciones correspondientes (w1, w2, wn…). Se calcula con la siguiente fórmula:
Ejemplo
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Mediana
Mediana
La mediana es el valor que divide la distribución por la mitad. Es la puntuación central de una serie de datos ordenados; es la puntuación que deja por debajo el 50% de los datos y también por arriba.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Mediana
Es el dato que queda en el centro de la distribución cuando los datos están ordenados de menor a mayor. La mediana refleja la posición intermedia de la distribución. Solo se puede utilizar a partir de escalas ordinales.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Mediana
La mediana es el punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor; es decir, la misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Propiedades de la mediana
Propiedades de la mediana
Ejemplos
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Moda
Moda
Es la categoría o puntuación que ocurre con mayor frecuencia, es decir, la “más popular”. Es el valor que se observa con más frecuencia, el más repetido. Para determinar la moda, es necesario que los datos se ordenen y se tabulen antes, para conocer la frecuencia de cada valor o intervalo.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Moda
Si no se repite ningún valor, la muestra no tiene moda, es amodal. Si se repiten varios valores diferentes, puede ser bimodal, trimodal o multimodal.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Moda
En el caso de que la variable medida se agrupe en intervalos, hay que referirse al "intervalo modal", que es el intervalo que tiene mayor frecuencia. La moda será la marca de clase de dicho intervalo.
Ejemplos
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Medidas de dispersión o variabilidad
Medidas de dispersión o variabilidad
Indican la dispersión de los datos en la escala de medición. Las medidas de tendencia central son valores en una distribución, y las medidas de variabilidad son intervalos que designan distancias o un número de unidades en la escala de medición, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos. Las medidas de dispersión más utilizadas son: rango, desviación estándar y varianza.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Rango
Rango
También llamado recorrido, es la diferencia entre la puntuación mayor y la puntuación menor, e indica el número de unidades en la escala de medición que se necesitan para incluir los valores máximo y mínimo.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Rango
Su principal ventaja es que se calcula con gran facilidad; pero, dado que no tiene en cuenta los valores intermedios, su utilidad es muy limitada. Es útil como media de dispersión en las variables cualitativas ordinales, o para indicar si nuestros datos tienen algunos valores extraordinarios.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Rango
Cuanto más grande sea el rango, mayor será la dispersión de los datos de una distribución. Se representa por R y su fórmula de cálculo es la siguiente: R = Xmax - Xmin Donde:
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Propiedades del rango
Propiedades del rango
Ejemplos
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Desviación estándar o típica
Desviación estándar o típica
Es el promedio de desviación de las puntuaciones con respecto a la media. Esta medida se expresa en las unidades originales de medición de la distribución. Se interpreta en relación a la media. Cuanto mayor sea la dispersión de los datos alrededor de la media, mayor será la desviación estándar. Se simboliza con (s), y su fórmula es la siguiente:
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Desviación estándar o típica
Esto es, la desviación de cada puntuación respecto a la media se eleva al cuadrado, se suman todas las desviaciones cuadradas, se divide entre el número total de puntuaciones, y a esta división se le saca la raíz cuadrada.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Desviación estándar o típica
Es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución, que mide el grado de dispersión o variabilidad. Por lo tanto, una desviación estándar alta indica una gran dispersión de los valores de los datos, mientras que una desviación estándar baja indica una dispersión angosta de los valores agrupados en torno a la media del conjunto de datos.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Desviación estándar o típica
Ejemplo: Un profesor enseña a dos grupos de la maestría de Salud pública y selecciona aleatoriamente una muestra de calificaciones de los exámenes realizados por los dos grupos. Halle la desviación típica de cada muestra: ▪ Grupo 1: 50, 60, 70, 80, 90. ▪ Grupo 2: 72, 68, 70, 74, 66.
Desviación estándar grupo 1
Desviación estándar grupo 2
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Varianza
Varianza
La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente, se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones, entendiendo como residuo la diferencia entre el valor de una variable en un momento y el valor medio de toda la variable.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Varianza
Es una medida de cuánto las observaciones de la variable difieren del valor esperado.
Muestra
Población
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Propiedades de la varianza
Propiedades de la varianza
Ejemplo
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Conclusiones
Conclusiones
Medidas de tendencia central
Media aritmética
Mediana
Moda
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Conclusiones
Medidas de dispersión
Rango
Varianza
Desviación estándar
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Conclusiones
Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la forma en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística, diremos que se encuentran “agrupados”, mientras que, si los datos no están en una tabla, hablaremos de datos “no agrupados”.
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Bibliografía
Bibliografía
https://www.jmp.com/es_cl/statistics-knowledge-portal/what-is-correlation/correlation-coefficient.html
https://www.jmp.com/es_co/statistics-knowledge-portal/what-is-correlation.html
https://belver.clavijero.edu.mx/cursos/nme/semestre5/probyest_1/s3/contenidos/cuartiles_deciles_y_percentiles.html
https://psicologiaymente.com/miscelanea/variable-dependiente-independiente
https://www3.uji.es/~epifanio/DOCENCIA/aut1etdi.pdf
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Bibliografía
https://www.studocu.com/latam/document/universidad-autonoma-de-santo-domingo/estadistica-general/cuestionario-sobre-graficos/23373944
https://dsp.facmed.unam.mx/wp-content/uploads/2013/12/Quevedo-F.-Medidas-de-tendencia-central-y-dispersion.-Medwave-2011-Ma-113..pdf
https://www.jmp.com/es_cl/statistics-knowledge-portal/what-is-correlation/correlation-coefficient.html
https://www.jmp.com/es_co/statistics-knowledge-portal/what-is-correlation.html
https://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S0465-546X2008000200011
Sostenibilidad de las organizaciones - Palabras Claves / Reto
Estadística descriptiva - Bibliografía
Anónimo (13 de septiembre de 2017). Diagrama de barras, gráfico circular y polígono de frecuencias. Obtenido de https://matemovil.com/diagrama-de-barras-grafico-circular-y-poligono-de-frecuencias/
Anónimo (13 de febrero de 2017). Medidas de dispersión: rango, varianza, desviación típica y coeficiente de variación. Obtenido de https://www.aulafacil.com/cursos/estadisticas/gratis/medidas-de-dispersion-rango-varianza-desviacion-tipica-y-coeficiente-de-variacion- l 1 1218 #:~: text=% 2 d% 20 rango% 3 a% 20 mide% 20 la% 20 amplitud% 20 de, l a% 20 serie% 20 y% 20 la% 20 media.& text= por% 20 el% 20 contrario% 2 c% 20 mi
Jauregui, M. (19 de febrero de 2016). La media aritmética. Obtenido de https://aprendiendoadministracion.com/medidas-de-tendencia-central-media-mediana-moda-rango-y-eje-medio/
Matemáticas IV. Estadística y principios de probabilidad (14 de julio de 2019). Estadística descriptiva. Obtenido de https://www.uaa.mx/centros/cem/dmf/wp-content/uploads/2015/apuntes/4.% 20 estadistica% 20 y% 20 principios% 20 de% 20 probabilidad/ apuntes% 20 estadistica. pdf
Tema revisado
Ejemplo: Durante un periodo de una hora en una tarde calurosa de un sábado, se vendieron cincuenta bebidas. Calcule la media ponderada de los precios de las bebidas. (Precio −primer valor−, cantidad vendida −segundo valor−): (.50, 5), (.75, 15), (.90, 15), (1.10, 15). La media ponderada es: (.50 x 5 + .75 x 15 + .90 x 15 + 1.10 x 15) / (5 + 15 + 15 + 15) = $43.75/50 = 0.875
La media aritmética o promedio aritmético. Se representa por la letra griega μ cuando se trata del promedio del universo o población, y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante destacar que μ es una cantidad fija, mientras que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc.
La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de frecuencia, la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una muestra puede tener más de una moda.
Ejemplos: Calcule la varianza de los siguientes datos muestrales: 6, 8, 7, 10, 3, 5, 9, 8. De acuerdo a los datos del problema tenemos:
- Σxᵢ = 56
- N = 8
- x̄ = 56/8 = 7
Finalmente, calculamos la varianza muestral:Puede que en una distribución haya más de una moda, pero que no todas tengan la misma altura. La más alta sería la moda mayor, y la otra u otras serían la moda menor. Gráficamente, la moda equivale al valor que alcanza la frecuencia máxima o pico en el polígono de frecuencias.
Desviación estándar grupo 1: Datos = 50, 60, 70, 80, 90.
- Σxᵢ = 350
- N = 5
- x̄ = 350/5 = 70
Finalmente, calculamos la desviación estándar muestral:Ejemplo: La familia Pérez posee cuatro vehículos. Los datos de los kilómetros recorridos por cada vehículo son: 56 000, 23 000, 42 000 y 73 000. ¿Cuál es el promedio de kilómetros recorridos por los cuatro vehículos? Esto es (56 000 + 23 000 + 42 000 + 73 000) / 4 = 48 500 x = 48500 kilómetros
La varianza representa la variabilidad de una serie de datos respecto a su media. Se representa con el símbolo σ² (sigma cuadrado) para el universo o población, y con el símbolo s2 (s cuadrado) cuando se trata de la muestra, y se expresa en unidades de variable al cuadrado.
Desviación estándar grupo 2: Datos = 72, 68, 70, 74, 66.
- Σxᵢ = 350
- N = 5
- x̄ = 350/5 = 70
Finalmente, calculamos la desviación estándar muestral:La media aritmética de la muestra se representa con x, mientras que la media aritmética de la población se representa con la µ.
La desviación estándar, que es la raíz cuadrada de la varianza, se representa por σ (sigma) cuando pertenece al universo o población, y por “s” cuando pertenece a la muestra; σ² y σ son parámetros, constantes para una población particular; s2 y s son estadígrafos, valores que cambian de muestra en muestra dentro de una misma población. La desviación estándar se expresa en unidades de variable.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir un conjunto de valores en un solo valor. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda.
Ejemplos: Calcule la mediana para los siguientes datos, siendo la edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22. Al ordenar los datos de manera ascendente, quedan: 19, 20, 21, 22, 25. La mediana es 21. La altura, en centímetros, de cuatro jugadores de básquetbol es 176, 173, 180 y 175. Al ordenar los datos de manera ascendente, quedan: 173, 175, 176, 180. La mediana es 175.5 cm.
Ejemplos: Si tenemos los siguientes valores: 17, 18, 20, 20, 24, 28, 28, 30, 33. El rango será: 33 - 17 = 16
La desviación estándar se interpreta como cuánto se desvía, en promedio, de la media un conjunto de puntuaciones. Representa todas las diferencias de las observaciones respecto a la media, y es la raíz cuadrada de la varianza.
Las medidas de dispersión, en cambio, miden el grado de dispersión de los valores de la variable. Dicho en otros términos, las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos entregando información acerca de su posición y su dispersión.
La varianza y la desviación miden la dispersión promedio alrededor de la media; es decir, cómo las observaciones mayores fluctúan por encima de esta y cómo las observaciones menores se distribuyen por debajo de esta, como medidas de variabilidad más importantes.
El rango se define como la diferencia entre el mayor valor de la variable y el menor valor de la variable.
La mediana es el valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana. Si el número de observaciones es par, la mediana corresponde al promedio de los dos valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11) / 2=10.
Ejemplos: Ejemplo: 25, 30, 20, 25, 25, 25, 10, 5, 15, 5. Moda= 25
Nota: para un conjunto con un número par de números, la mediana es el promedio aritmético de los dos números medios.