Want to create interactive content? It’s easy in Genially!

Get started free

MEDIDAS DE DISPERSIÓN

SELENE

Created on September 11, 2023

Start designing with a free template

Discover more than 1500 professional designs like these:

Audio tutorial

Pechakucha Presentation

Desktop Workspace

Decades Presentation

Psychology Presentation

Medical Dna Presentation

Geometric Project Presentation

Transcript

MEDIDAS DE DISPERSIÓN

Una medida de dispersión sirve para evaluar la confiabilidad de dos o más medidas de ubicación.

El rango se sustenta en los valores máximo y mínimo del conjunto de datos, es decir, sólo se consideran dos valores. La desviación media, la varianza y la desviación estándar se basan en desviaciones de la media aritmética.

Rango

La medida más simple de dispersión es el rango. Representa la diferencia entre los valores máximo y mínimo de un conjunto de datos. En forma de ecuación:

El rango se emplea mucho en aplicaciones de control de procesos estadísticos (CPE), debido a que resulta fácil de calcular y entender.

Consulte la gráfica Det.ermine el rango del número de monitores de computadora que se producen por hora en las plantas de Baton Rouge y Tucson. Interprete los dos rangos.

Desviación media

Un problema que presenta el rango estriba en que parte de dos valores, el más alto y el más bajo, es decir, no los toma en cuenta a todos. La desviación media sí lo hace; mide la cantidad media respecto de la cual los valores de una población o muestra varían. Expresado en forma de definición:

DESVIACIÓN MEDIA Media aritmética de los valores absolutos de las desviaciones con respecto a la media aritmética.

En el caso de una muestra, la desviación media, designada DM, se calcula mediante la fórmula:

¿Por qué ignorar los signos de las desviaciones de la media? De no hacerlo, las desviaciones positivas y negativas se compensarían con exactitud unas a otras y la desviación media siempre sería cero. Dicha medida (cero) resultaría un estadístico sin utilidad.

EJEMPLO:

La siguiente tabla muestra el número de capuchinos que se vendieron en el local de Starbucks de los aeropuertos de Orange County y de Ontario, California, entre las 4 y las 5 de la tarde, de una muestra de 5 días el mes pasado.

Determine la media, la mediana, el rango y la desviación media de cada local. Compare las similitudes y diferencias.

Observe que las tres medidas son exactamente iguales. ¿Indica esto que no hay diferencias entre ambos grupos de datos? Calculando las desviaciones medias, se obtiene un panorama más claro. Primero, Orange County:

La media, la mediana y el rango de cada aeropuerto se reportan a continuación como parte de una hoja de cálculo de Excel.

La desviación media es de 16 capuchinos al día: el número de capuchinos vendidos se desvía, en promedio, 16 unidades de la media de 50 capuchinos al día. La siguiente tabla muestra los detalles para determinar la desviación media para el número de capuchinos vendidos en el Aeropuerto de Ontario.

Las tablas indican que la media, la mediana y el rango de los capuchinos que se vendieron en ambos aeropuertos son los mismos, pero las desviaciones medias son distintas. La desviación media de Orange County es 16, pero en Ontario es 12.4.

La desviación media posee dos ventajas. Primero, incluye todos los valores de los cálculos. Recuerde que el rango sólo incluye los valores máximo y mínimo. Segundo, es fácil de definir: es la cantidad promedio que los valores se desvían de la media. Sin embargo, su inconveniente es el empleo de valores absolutos. Por lo general, es difícil trabajar con valores absolutos, así que la desviación media no se emplea con tanta frecuencia como otras medidas de dispersión, como la desviación estándar.

Los pesos de los contenedores enviados a Irlanda son (en miles de libras): 95, 103, 105, 110, 104 105, 112, 90 a) ¿Cuál es el rango de los pesos? b) Calcule el peso medio aritmético. c) Estime la desviación media de los pesos.

El Departamento de Estadística de la Western State University ofrece ocho secciones de estadística básica. En seguida aparecen los números de estudiantes matriculados en estas secciones: 34, 46, 52, 29, 41, 38, 36 y 28. calcule: a) el rango; b) la media aritmética; c) la desviación media; d) interprete los valores que obtenga.

Varianza y desviación estándar

La varianza y la desviación estándar también se fundamentan en las desviaciones de la media. Sin embargo, en lugar de trabajar con el valor absoluto de las desviaciones, la varianza y la desviación estándar lo hacen con el cuadrado de las desviaciones.

VARIANZA Media aritmética de las desviaciones de la media elevadas al cuadrado.

La varianza es no negativa y es cero sólo si todas las observaciones son las mismas.

Varianza de la población Las fórmulas de la varianza poblacional y la varianza de la muestra son ligeramente diferentes. La varianza de la población se estudia primero. (Recuerde que una población es la totalidad de las observaciones estudiadas.) La varianza de la población se determina de la siguiente manera:

Observe el proceso de cálculo de la varianza: 1. Comience por determinar la media. 2. Calcule la diferencia entre cada observación y la media, y eleve al cuadrado dicha diferencia. 3. Sume todas las diferencias elevadas al cuadrado. 4. Divida la suma de las diferencias elevadas al cuadrado entre el número de elementos de la población.

Así, usted podría pensar que la varianza de la población es la media de las diferencias elevadas al cuadrado entre cada valor y la media. En las poblaciones cuyos valores son cercanos a la media, la varianza de la población puede ser pequeña. En las poblaciones cuyos valores se apartan de la media, la varianza de la población puede ser grande. La varianza compensa el inconveniente que presenta el rango al utilizar todos los valores de la población, mientras que el rango incluye sólo los valores máximo y mínimo. El problema de que , se corrige elevando al cuadrado las diferencias, en lugar de emplear valores absolutos. Elevar al cuadrado las diferencias siempre dará como resultado valores no negativos.

El número de multas de tránsito que se aplicaron el año pasado, por mes, en Beaufort County, Carolina del Sur, es de 38, 26, 13, 41 y 22. ¿Cuál es la varianza de la población?

Determine la varianza de la población.

Dado que se trata de estudiar todas las multas que se aplicaron en un año, los datos integran una población. Para determinar la varianza de la población, se utiliza la fórmula. La siguiente tabla detalla los cálculos.

Para comenzar, es necesario determinar la media aritmética de la población. El número total de multas aplicadas en el año es de 348, así que la media aritmética por mes es 29.

2. En seguida se calcula la diferencia entre la media y cada observación. Ésta se muestra en la tercera columna de la tabla. Recuerde que previamente, se indicó que la suma de las diferencias entre cada valor y la media es 0. En la hoja de cálculo, la suma de las diferencias entre la media y el número de multas de cada mes es 0.

3. El siguiente paso es elevar al cuadrado la diferencia entre cada valor mensual, operación que se muestra en la cuarta columna de la tabla. Al elevar las diferencias al cuadrado, convertimos tanto los valores positivos como negativos a un signo de más. Por lo tanto, cada diferencia será positiva.

4. Se suman las diferencias elevadas al cuadrado. El total de la cuarta columna es 1 488. A esto se refiere la ecuación

5. Finalmente, dividimos las diferencias elevadas al cuadrado por N, el número de observaciones que se realizaron.

Así, la variación de la población con respecto al número de multas es de 124.

Como en el caso del rango y la desviación media, la varianza se emplea para comparar la dispersión entre dos o más conjuntos de observaciones. Por ejemplo, se calculó que la varianza del número de multas levantadas en Beaufort County fue de 124. Si la varianza del número de multas aplicadas en Marlboro County, Carolina del Sur, es de 342.9, se concluye que: 1) hay menos dispersión en la distribución del número de multas levantadas en Beaufort (ya que 124 es menor que 342.9); 2) el número de infracciones en Beaufort County se encuentra más apiñado en torno a la media de 29 que el número de multas levantadas en Marlboro County.

Desviación estándar de la población Tanto el rango como la desviación media resultan fáciles de interpretar. El rango es la diferencia entre los valores alto y bajo de un conjunto de datos, y la desviación media es la media de las desviaciones de la media. Sin embargo, la varianza resulta difícil de interpretar en el caso de un solo conjunto de observaciones. La varianza de 124 del número de multas levantadas no se expresa en términos de multas, sino de multas elevadas al cuadrado.

Existe una forma de salir del problema. Si extrae la raíz cuadrada de la varianza de la población, puede convertirla a las mismas unidades de medición que emplean los datos originales. La raíz cuadrada de 124 multas elevadas al cuadrado es de 11.4 multas. Las unidades ahora son sencillamente multas. La raíz cuadrada de la varianza de la población es la desviación estándar de la población.

Este año la oficina en Filadelfia de Price Waterhouse Coopers LLP contrató a cinco contadores que están haciendo prácticas. Los salarios mensuales iniciales de éstos fueron de $3 536, $3 173, $3 448, $3 121 y $3 622. a) Calcule la media de la población. b) Estime la varianza de la población. c) Aproxime la desviación estándar de la población. d) La oficina de Pittsburgh contrató a cinco empleados que están haciendo prácticas. El salario mensual promedio fue de $3 550 y la desviación estándar de $250. Compare los dos grupos.

Los salarios por hora de una muestra de empleados de medio tiempo de Home Depot son: $12, $20, $16, $18 y $19. ¿Cuál es la varianza de la muestra? Solución La varianza muestral se calcula con la fórmula

Desviación estándar de la muestra La desviación estándar de la muestra se utiliza para estimar la desviación estándar de la población. Como se hizo notar, la desviación estándar de la población es la raíz cuadrada de la varianza de la población. Asimismo, la desviación estándar de la muestra es la raíz cuadrada de la varianza de la muestra. La desviación estándar de la muestra se calcula con mayor facilidad de la siguiente manera:

La varianza de la muestra en el ejemplo anterior, que incluye salarios por hora, se calculó en 10. ¿Cuál es la desviación estándar? Solución La desviación estándar de la muestra es $3.16, que se determina con . Observe nuevamente que la varianza de la muestra se expresa en términos de dólares al cuadrado, pero al extraer la raíz cuadrada a 10 se obtiene $3.16, que se encuentra en las mismas unidades (dólares) que los datos originales.

Los años de servicio de una muestra de siete empleados en la oficina de quejas de State Farm Insurance, de Cleveland, Ohio, son: 4, 2, 5, 4, 5, 2 y 6. ¿Cuál es la varianza de la muestra? Calcule la desviación estándar de la muestra.

Media y desviación estándar de datos agrupados

Media aritmética

Para aproximar la media aritmética de datos organizados en una distribución de frecuencia, comience suponiendo que las observaciones en cada clase se representan a través del punto medio de la clase. La media de una muestra de datos organizados en una distribución de frecuencias se calcula de la siguiente manera:

Los cálculos de la media aritmética de datos agrupados en una distribución de frecuencias que aparecen en seguida se basan en los datos de las ganancias de Applewood Auto Group. Recuerde que se construyó una distribución de frecuencias de precios de venta de vehículos. La información se repite abajo. Determine la ganancia media aritmética por vehículo.

La ganancia media de los vehículos se calcula a partir de datos agrupados en una distribución de frecuencias. Para calcular la media, suponga que el punto medio de cada clase es representativo de los valores de datos incluidos en dicha clase. Recuerde que el punto medio de una clase se encuentra a la mitad de los límites de clase superior e inferior. Para determinar el punto medio de una clase en particular, sume los límites de clase superior e inferior y divida entre 2. Por consiguiente, el punto medio de la primera clase es $400, que se calcula con la operación ($200 + $600)/2. Suponga que el valor de $400 es representativo de los ocho valores incluidos en dicha clase. En otras palabras, se asume que la suma de los ocho valores en esta clase es de $3 200, que se calcula por medio del producto 8($400). Continúe con el proceso de multiplicación del punto medio de clase por la frecuencia de clase de cada clase y en seguida sume estos productos

Desviación estándar Para calcular la desviación estándar de datos agrupados en una distribución de frecuencias, necesita ajustar ligeramente la fórmula. Pondere cada una de las diferencias cuadradas por el número de frecuencias en cada clase. La fórmula es:

Consulte la distribución de frecuencias de los datos de la ganancia de Applewood Auto Group que aparecen en la tabla. Calcule la desviación estándar de las ganancias que generó cada vehículo.

De acuerdo con la misma técnica que se empleó para calcular la media de los datos agrupados en una distribución de frecuencias, f es la frecuencia de clase, M es el punto medio de clase y n es el número de observaciones.

Por lo general, la media y la desviación estándar que se calculan a partir de datos agrupados en una distribución de frecuencias se encuentran cerca de los valores calculados a partir de los datos en bruto. Los datos agrupados originan la pérdida de alguna información. En el ejemplo de la ganancia por vehículo, la ganancia media que aparece } es de $1 843.17, y la desviación estándar de $643.63. Los valores respectivos calculados a partir de datos agrupados en una distribución de frecuencias son $1 851.11 y $652.33. La diferencia entre las medias es de $7.94 o aproximadamente 0.4%. Las desviaciones estándares difieren en $8.70 o 1.4%. Sobre la base de la diferencia porcentual, las aproximaciones se acercan mucho a los valores reales.