Want to create interactive content? It’s easy in Genially!

Get started free

T-SPU_25_001031_01

Prisma Education

Created on March 20, 2025

Start designing with a free template

Discover more than 1500 professional designs like these:

Modern Presentation

Terrazzo Presentation

Colorful Presentation

Modular Structure Presentation

Chromatic Presentation

City Presentation

News Presentation

Transcript

Estadística descriptiva. Medidas de tendencia central, de dispersión y de posición. Desviación estándar y varianza.

Autor: Jorge Albán Villacís

Estadística descriptiva - Introducción

Introducción

La estadística descriptiva se ocupa de obtener datos nuevos, los cuales procede a resumir y organizar para facilitar su análisis e interpretación; para ello, utiliza medidas de tendencia central, de dispersión y de posición.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Palabras/Reto

Palabras Claves

  • Media
  • Mediana
  • Moda
  • Desviación estándar
  • Varianza

Reto

¿Cuáles son las principales diferencias de las medidas de tendencia central y las medidas de dispersión?

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Medidas de tendencia central

Medidas de tendencia central

Las medidas de tendencia central son puntos en una distribución −los valores medios o centrales de esta−, y nos ayudan a ubicarla dentro de la escala de medición. Las principales medidas de tendencia central son tres: media, mediana y moda. El nivel de medición de la variable determina cuál es la tendencia central apropiada.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Medidas de tendencia central

El examen estadístico de estas medidas permite obtener un atributo de toda la información recabada; es decir, las medidas de tendencia central advierten y resumen el comportamiento de un conjunto de datos.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Medidas de tendencia central

El nivel de medición de la variable determina cuál es la medida de tendencia central apropiada para interpretar. A pesar de su importancia, su análisis no debe hacerse separadamente de las medidas de dispersión, ya que estas están asociadas con el grado de concentración de la información.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Media aritmética o promedio

Media aritmética o promedio

La media puede definirse como el promedio aritmético de una distribución. Se simboliza como,

y es la suma de todos los valores dividida entre el número de casos.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Media aritmética o promedio

Es la medida de tendencia central más conocida y utilizada. Se calcula sumando todos los valores observados y dividiendo por el número de observaciones de la muestra. Su principal ventaja es su fácil manejo matemático y estadístico. Sin embargo, tiene la desventaja de ser muy sensible a los valores extremos en una muestra que no tenga una distribución normal.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Media aritmética o promedio

Es una medida solamente aplicable a las mediciones de intervalos o de razón. Carece de sentido para variables medidas en un nivel ordinal o nominal. Su fórmula es la siguiente:

Ejemplo

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Propiedades de la media aritmética

Propiedades de la media aritmética

  • Todo conjunto de datos de nivel de intervalo y de nivel de razón tiene un valor medio.
  • Al evaluar la media, se incluyen todos los valores.
  • Un conjunto de valores solo tiene una media.
  • La cantidad de datos que se evalúan rara vez afecta la media.
  • Es la única medida de ubicación donde la suma de las desviaciones de cada valor con respecto a la media siempre es 0.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva -Media ponderada

Media ponderada

La media ponderada de un conjunto de números (X1, X2, Xn…) con las ponderaciones correspondientes (w1, w2, wn…). Se calcula con la siguiente fórmula:

Ejemplo

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Mediana

Mediana

La mediana es el valor que divide la distribución por la mitad. Es la puntuación central de una serie de datos ordenados; es la puntuación que deja por debajo el 50% de los datos y también por arriba.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Mediana

Es el dato que queda en el centro de la distribución cuando los datos están ordenados de menor a mayor. La mediana refleja la posición intermedia de la distribución. Solo se puede utilizar a partir de escalas ordinales.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Mediana

La mediana es el punto medio de los valores después de ordenarlos de menor a mayor, o de mayor a menor; es decir, la misma cantidad de valores se encuentra por arriba de la mediana que por debajo de ella.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Propiedades de la mediana

Propiedades de la mediana

  • Es única para cada conjunto de datos.
  • No se ve afectada por valores muy grandes o muy pequeños, y, por lo tanto, es una medida valiosa de tendencia central.
  • Puede obtenerse para datos de nivel de razón, de intervalo y ordinal.
  • Puede calcularse para una distribución de frecuencias con una clase de extremo abierto, si la mediana no se encuentra en una de estas clases.

Ejemplos

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Moda

Moda

Es la categoría o puntuación que ocurre con mayor frecuencia, es decir, la “más popular”. Es el valor que se observa con más frecuencia, el más repetido. Para determinar la moda, es necesario que los datos se ordenen y se tabulen antes, para conocer la frecuencia de cada valor o intervalo.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Moda

Si no se repite ningún valor, la muestra no tiene moda, es amodal. Si se repiten varios valores diferentes, puede ser bimodal, trimodal o multimodal.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Moda

En el caso de que la variable medida se agrupe en intervalos, hay que referirse al "intervalo modal", que es el intervalo que tiene mayor frecuencia. La moda será la marca de clase de dicho intervalo.

Ejemplos

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Medidas de dispersión o variabilidad

Medidas de dispersión o variabilidad

Indican la dispersión de los datos en la escala de medición. Las medidas de tendencia central son valores en una distribución, y las medidas de variabilidad son intervalos que designan distancias o un número de unidades en la escala de medición, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos. Las medidas de dispersión más utilizadas son: rango, desviación estándar y varianza.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Rango

Rango

También llamado recorrido, es la diferencia entre la puntuación mayor y la puntuación menor, e indica el número de unidades en la escala de medición que se necesitan para incluir los valores máximo y mínimo.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Rango

Su principal ventaja es que se calcula con gran facilidad; pero, dado que no tiene en cuenta los valores intermedios, su utilidad es muy limitada. Es útil como media de dispersión en las variables cualitativas ordinales, o para indicar si nuestros datos tienen algunos valores extraordinarios.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Rango

Cuanto más grande sea el rango, mayor será la dispersión de los datos de una distribución. Se representa por R y su fórmula de cálculo es la siguiente: R = Xmax - Xmin Donde:

  • R es el rango.
  • Máx es el valor máximo de la muestra o población.
  • Mín es el valor mínimo de la muestra o población estadística.
  • x es la variable sobre la que se pretende calcular esta medida.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Propiedades del rango

Propiedades del rango

  • Es la diferencia entre el valor más alto y el más bajo en un conjunto de datos, mostrando cuánto varían los valores.
  • Puede cambiar con nuevos datos, reflejando variaciones o tendencias emergentes.
  • Es especialmente útil para evaluar la variabilidad o dispersión.

Ejemplos

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Desviación estándar o típica

Desviación estándar o típica

Es el promedio de desviación de las puntuaciones con respecto a la media. Esta medida se expresa en las unidades originales de medición de la distribución. Se interpreta en relación a la media. Cuanto mayor sea la dispersión de los datos alrededor de la media, mayor será la desviación estándar. Se simboliza con (s), y su fórmula es la siguiente:

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Desviación estándar o típica

Esto es, la desviación de cada puntuación respecto a la media se eleva al cuadrado, se suman todas las desviaciones cuadradas, se divide entre el número total de puntuaciones, y a esta división se le saca la raíz cuadrada.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Desviación estándar o típica

Es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución, que mide el grado de dispersión o variabilidad. Por lo tanto, una desviación estándar alta indica una gran dispersión de los valores de los datos, mientras que una desviación estándar baja indica una dispersión angosta de los valores agrupados en torno a la media del conjunto de datos.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Desviación estándar o típica

Ejemplo: Un profesor enseña a dos grupos de la maestría de Salud pública y selecciona aleatoriamente una muestra de calificaciones de los exámenes realizados por los dos grupos. Halle la desviación típica de cada muestra: ▪ Grupo 1: 50, 60, 70, 80, 90. ▪ Grupo 2: 72, 68, 70, 74, 66.

Desviación estándar grupo 1

Desviación estándar grupo 2

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Varianza

Varianza

La varianza es una medida de dispersión que representa la variabilidad de una serie de datos respecto a su media. Formalmente, se calcula como la suma de los residuos al cuadrado divididos entre el total de observaciones, entendiendo como residuo la diferencia entre el valor de una variable en un momento y el valor medio de toda la variable.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Varianza

Es una medida de cuánto las observaciones de la variable difieren del valor esperado.

Muestra

Población

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Propiedades de la varianza

Propiedades de la varianza

  • Es una medida de dispersión que indica cuánto se alejan los datos de su media.
  • Elevar al cuadrado los residuos evita sumas negativas, permitiendo que la varianza siempre sea positiva.
  • Es fundamental para calcular otros parámetros estadísticos, como la covarianza.

Ejemplo

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Conclusiones

Conclusiones

Medidas de tendencia central

Media aritmética

Mediana

Moda

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Conclusiones

Medidas de dispersión

Rango

Varianza

Desviación estándar

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Conclusiones

Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la forma en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística, diremos que se encuentran “agrupados”, mientras que, si los datos no están en una tabla, hablaremos de datos “no agrupados”.

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Bibliografía

Bibliografía

https://www.jmp.com/es_cl/statistics-knowledge-portal/what-is-correlation/correlation-coefficient.html

https://www.jmp.com/es_co/statistics-knowledge-portal/what-is-correlation.html

https://belver.clavijero.edu.mx/cursos/nme/semestre5/probyest_1/s3/contenidos/cuartiles_deciles_y_percentiles.html

https://psicologiaymente.com/miscelanea/variable-dependiente-independiente

https://www3.uji.es/~epifanio/DOCENCIA/aut1etdi.pdf

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Bibliografía

https://www.studocu.com/latam/document/universidad-autonoma-de-santo-domingo/estadistica-general/cuestionario-sobre-graficos/23373944

https://dsp.facmed.unam.mx/wp-content/uploads/2013/12/Quevedo-F.-Medidas-de-tendencia-central-y-dispersion.-Medwave-2011-Ma-113..pdf

https://www.jmp.com/es_cl/statistics-knowledge-portal/what-is-correlation/correlation-coefficient.html

https://www.jmp.com/es_co/statistics-knowledge-portal/what-is-correlation.html

https://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S0465-546X2008000200011

Sostenibilidad de las organizaciones - Palabras Claves / Reto

Estadística descriptiva - Bibliografía

Anónimo (13 de septiembre de 2017). Diagrama de barras, gráfico circular y polígono de frecuencias. Obtenido de https://matemovil.com/diagrama-de-barras-grafico-circular-y-poligono-de-frecuencias/

Anónimo (13 de febrero de 2017). Medidas de dispersión: rango, varianza, desviación típica y coeficiente de variación. Obtenido de https://www.aulafacil.com/cursos/estadisticas/gratis/medidas-de-dispersion-rango-varianza-desviacion-tipica-y-coeficiente-de-variacion- l 1 1218 #:~: text=% 2 d% 20 rango% 3 a% 20 mide% 20 la% 20 amplitud% 20 de, l a% 20 serie% 20 y% 20 la% 20 media.& text= por% 20 el% 20 contrario% 2 c% 20 mi

Jauregui, M. (19 de febrero de 2016). La media aritmética. Obtenido de https://aprendiendoadministracion.com/medidas-de-tendencia-central-media-mediana-moda-rango-y-eje-medio/

Matemáticas IV. Estadística y principios de probabilidad (14 de julio de 2019). Estadística descriptiva. Obtenido de https://www.uaa.mx/centros/cem/dmf/wp-content/uploads/2015/apuntes/4.% 20 estadistica% 20 y% 20 principios% 20 de% 20 probabilidad/ apuntes% 20 estadistica. pdf

Tema revisado

Ejemplo: Durante un periodo de una hora en una tarde calurosa de un sábado, se vendieron cincuenta bebidas. Calcule la media ponderada de los precios de las bebidas. (Precio −primer valor−, cantidad vendida −segundo valor−): (.50, 5), (.75, 15), (.90, 15), (1.10, 15). La media ponderada es: (.50 x 5 + .75 x 15 + .90 x 15 + 1.10 x 15) / (5 + 15 + 15 + 15) = $43.75/50 = 0.875

La media aritmética o promedio aritmético. Se representa por la letra griega μ cuando se trata del promedio del universo o población, y por Ȳ (léase Y barra) cuando se trata del promedio de la muestra. Es importante destacar que μ es una cantidad fija, mientras que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media se expresa en la misma unidad que los datos originales: centímetros, horas, gramos, etc.

La moda de una distribución se define como el valor de la variable que más se repite. En un polígono de frecuencia, la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una muestra puede tener más de una moda.

Ejemplos: Calcule la varianza de los siguientes datos muestrales: 6, 8, 7, 10, 3, 5, 9, 8. De acuerdo a los datos del problema tenemos:

  • Σxᵢ = 56
  • N = 8
  • x̄ = 56/8 = 7
Finalmente, calculamos la varianza muestral:

Puede que en una distribución haya más de una moda, pero que no todas tengan la misma altura. La más alta sería la moda mayor, y la otra u otras serían la moda menor. Gráficamente, la moda equivale al valor que alcanza la frecuencia máxima o pico en el polígono de frecuencias.

Desviación estándar grupo 1: Datos = 50, 60, 70, 80, 90.

  • Σxᵢ = 350
  • N = 5
  • x̄ = 350/5 = 70
Finalmente, calculamos la desviación estándar muestral:

Ejemplo: La familia Pérez posee cuatro vehículos. Los datos de los kilómetros recorridos por cada vehículo son: 56 000, 23 000, 42 000 y 73 000. ¿Cuál es el promedio de kilómetros recorridos por los cuatro vehículos? Esto es (56 000 + 23 000 + 42 000 + 73 000) / 4 = 48 500 x = 48500 kilómetros

La varianza representa la variabilidad de una serie de datos respecto a su media. Se representa con el símbolo σ² (sigma cuadrado) para el universo o población, y con el símbolo s2 (s cuadrado) cuando se trata de la muestra, y se expresa en unidades de variable al cuadrado.

Desviación estándar grupo 2: Datos = 72, 68, 70, 74, 66.

  • Σxᵢ = 350
  • N = 5
  • x̄ = 350/5 = 70
Finalmente, calculamos la desviación estándar muestral:

La media aritmética de la muestra se representa con x, mientras que la media aritmética de la población se representa con la µ.

La desviación estándar, que es la raíz cuadrada de la varianza, se representa por σ (sigma) cuando pertenece al universo o población, y por “s” cuando pertenece a la muestra; σ² y σ son parámetros, constantes para una población particular; s2 y s son estadígrafos, valores que cambian de muestra en muestra dentro de una misma población. La desviación estándar se expresa en unidades de variable.

Las medidas de tendencia central son medidas estadísticas que pretenden resumir un conjunto de valores en un solo valor. Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más utilizadas son: media, mediana y moda.

Ejemplos: Calcule la mediana para los siguientes datos, siendo la edad de una muestra de cinco estudiantes es: 21, 25, 19, 20 y 22. Al ordenar los datos de manera ascendente, quedan: 19, 20, 21, 22, 25. La mediana es 21. La altura, en centímetros, de cuatro jugadores de básquetbol es 176, 173, 180 y 175. Al ordenar los datos de manera ascendente, quedan: 173, 175, 176, 180. La mediana es 175.5 cm.

Ejemplos: Si tenemos los siguientes valores: 17, 18, 20, 20, 24, 28, 28, 30, 33. El rango será: 33 - 17 = 16

La desviación estándar se interpreta como cuánto se desvía, en promedio, de la media un conjunto de puntuaciones. Representa todas las diferencias de las observaciones respecto a la media, y es la raíz cuadrada de la varianza.

Las medidas de dispersión, en cambio, miden el grado de dispersión de los valores de la variable. Dicho en otros términos, las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos entregando información acerca de su posición y su dispersión.

La varianza y la desviación miden la dispersión promedio alrededor de la media; es decir, cómo las observaciones mayores fluctúan por encima de esta y cómo las observaciones menores se distribuyen por debajo de esta, como medidas de variabilidad más importantes.

El rango se define como la diferencia entre el mayor valor de la variable y el menor valor de la variable.

La mediana es el valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana. Si el número de observaciones es par, la mediana corresponde al promedio de los dos valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11) / 2=10.

Ejemplos: Ejemplo: 25, 30, 20, 25, 25, 25, 10, 5, 15, 5. Moda= 25

Nota: para un conjunto con un número par de números, la mediana es el promedio aritmético de los dos números medios.