Medidas numéricas
MÓDULO IV
Imagen tomada con fines académicos de: https://goo.su/ElpWJU
Propósito
Estructura temática
4.1 Medidas de tendencia central
4.1.1 Media aritmética
4.1.2 Mediana
4.1.3 Moda
4.2 Medidas de posición
4.2.1. Cuartiles
4.2.2. Deciles
4.2.3. Percentiles
4.3 Desviación media
4.3.1. Interpretación de la desviación media
4.3.2 Varianza y desviación estándar
4.3.2.1. Interpretación de la varianza
4.3.2.2 Interpretación de la desviación estándar
4.4 Diagrama de dispersión
4.5 Covarianza
4.6 Distribución normal
4.7 Clasificación de la probabilidad
4.7.1 Eventos mutuamente excluyentes o disjuntos
4.7.2 Eventos independientes
4.7.3 Eventos dependientes
4.7.4 Eventos no excluyentes entre sí
4.8 Estadística inferencial
Determinar las medidas de tendencia central, posición y dispersión de un conjunto de datos.
Actividad Detonadora
Introducción al módulo
En nuestra vida diaria, constantemente nos encontramos con datos: calificaciones en la escuela, estadísticas deportivas, la predicción del clima o los posibles ganadores de un concurso de televisión. Las medidas numéricas nos permiten interpretar y comprender estos datos de manera efectiva. Con base en lo descrito, a lo largo de este módulo, exploraremos las medidas de tendencia central, posición y dispersión, y veremos cómo estas herramientas matemáticas nos ayudan a tomar decisiones informadas.
Ahora, imagina que estás organizando una competencia deportiva en tu escuela y necesitas evaluar el rendimiento de los participantes; o quizá estés planeando un presupuesto mensual y necesitas entender tus gastos. Las medidas numéricas te permiten no solo resumir estos datos, sino también hacer comparaciones y tomar decisiones basadas en hechos. En nuestra vida real algunas de las aplicaciones prácticas son:
•Educación: Evaluar el rendimiento promedio de una clase y entender cómo se distribuyen las calificaciones.
•Deportes: Analizar estadísticas de jugadores para identificar fortalezas y áreas de mejora.
•Salud: Interpretar datos de encuestas para mejorar programas de salud comunitaria.
“¿Cuánto tiempo pasan tus amigos más cercanos en redes sociales?”
Alguna vez te has preguntado… ¿Cuánto tiempo pasan tus amigos más cercanos en redes sociales?
Las medidas numéricas son herramientas valiosas para entender y analizar datos de nuestra vida cotidiana. Por ejemplo, conocer el promedio de horas que dedicamos a interactuar con nuestros amigos en plataformas como Instagram, X, TikTok y Snapchat puede ayudarnos a reflexionar sobre nuestras propias decisiones.
Te invito a realizar la siguiente actividad: Pregunta a algunos de tus amigos (mínimo tres) ¿cuántos minutos pasan al día en aplicaciones como Instagram, X, TikTok y/o Snapchat? Luego, suma todos los minutos que te compartan y divídelos entre el número total de amigos que consultaste. Una vez que tengas el promedio, compáralo con el tiempo que tú dedicas diariamente a estas redes.
Finalmente, responde a la siguiente pregunta: ¿pasas más o menos tiempo que ellos en las redes sociales?
4.1 Medidas de tendencia central
Con base en lo anterior, los objetivos del módulo IV son:
• Comprender las medidas de tendencia central (media, mediana, moda) y su utilidad para resumir grandes cantidades de datos en un solo valor representativo.
• Explorar las medidas de posición (cuartiles, deciles, percentiles) para interpretar la distribución de los datos y comparar resultados.
• Analizar las medidas de dispersión (desviación media, varianza, desviación estándar) para evaluar la consistencia de los datos y su variabilidad.
Al finalizar este módulo, podrás aplicar estas herramientas en situaciones cotidianas y académicas, comprendiendo mejor cómo los datos pueden informar nuestras decisiones y mejorar nuestra comprensión del mundo que nos rodea. Este módulo es muy práctico, por lo que procuraremos poner varios ejemplos de aplicación para que los ocupes en tu vida cotidiana y en tu entorno social.
Las medidas de tendencia central se refieren a valores que representan el centro o la ubicación central de un conjunto de datos. Estas medidas incluyen la media aritmética, la mediana y la moda. 4.1.1 Media aritmética La media aritmética es una de las medidas más antiguas y comunes de tendencia central. Se remonta a la época de los antiguos matemáticos griegos, como Euclides, que ya utilizaban conceptos similares de un modo implícito. En la actualidad, empleamos la siguiente definición: la media aritmética, también conocida como promedio, es el valor obtenido al sumar todos los datos de un conjunto y dividir esta suma entre el número total de datos. Es una medida que indica el valor central de un conjunto de datos.
Una aplicación práctica la puedes encontrar en el presupuesto familiar. Por ejemplo, si tu familia gasta diferentes cantidades de dinero cada mes en alimentos, la media aritmética te ayuda a saber cuánto se gasta en promedio cada mes. Esto ayuda a planificar mejor el presupuesto. También te sirve para conocer el promedio de tus calificaciones.
4.1.2 Mediana
Ejemplo: Si las calificaciones de cinco exámenes son 80, 85, 90, 75 y 95, la media aritmética sería:
La mediana fue introducida en el siglo XIX por el matemático francés Adolphe Quetelet. Quetelet utilizó la mediana para analizar datos sobre características físicas de los seres humanos, como la altura y el peso, destacando que esta medida es menos afectada por valores atípicos en comparación con la media aritmética. Actualmente, la definimos como el valor que se encuentra en el centro de un conjunto de datos ordenados de menor a mayor. Si el número de datos es impar, la mediana es el valor central. Si es par, es el promedio de los dos valores centrales.Una aplicación práctica se puede dar en una empresa familiar: la mediana del salario puede mostrar el sueldo típico de un empleado. Esto es útil para evitar que valores extremos (muy altos o muy bajos) afecten la percepción general de los salarios. Un ejemplo de aplicación es el siguiente: encuentra la mediana de las siguientes calificaciones: 85, 90, 78, 88, 92, 76, 95. Procedimiento:- Ordena las calificaciones de menor a mayor. - Encuentra el valor central. - Calificaciones ordenadas: 76, 78, 85, 88, 90, 92, 95. Solución: La mediana es el cuarto valor (el valor central):- La mediana de las calificaciones es 88.
Otro ejemplo para tu vida escolar es el siguiente:
Encuentra la media aritmética de las siguientes calificaciones de un estudiante en siete exámenes: 85, 90, 78, 88, 92, 76, 95.
Procedimiento:
- Suma todas las calificaciones.
- Divide la suma entre el número de calificaciones.
- La media aritmética de las calificaciones es 86.29.
4.1.3 Moda
El concepto de moda, en su formulación matemática, fue desarrollado en el siglo XIX. Francis Galton, un primo de Charles Darwin y pionero en la estadística, promovió el uso de la moda en la estadística descriptiva. La moda se utiliza para identificar el valor que aparece con mayor frecuencia en un conjunto de datos, siendo útil en diversos campos, desde la biología hasta la economía, e incluso la “moda” en la industria del vestido. Nosotros definimos a la moda como el valor que más se repite en un conjunto de datos. Puede haber más de una moda si varios valores se repiten con la misma frecuencia y esta es la más alta.
Ejemplos de aplicación práctica:
Preferencias de productos: Si en una tienda de dulces, el sabor de helado más vendido es el de chocolate, este sabor es la moda. Esto ayuda al dueño a saber qué producto es el más popular y mantener suficiente inventario.
Ejemplo 1: En el conjunto de datos 75, 80, 85, 90, 85, 95, la moda es 85 porque es el valor que aparece más veces.
Ejemplo 2: Encuentra la moda de las siguientes calificaciones: 85, 90, 78, 88, 88, 92, 76, 95.
Procedimiento:
- Encuentra el valor que más se repite.
Solución: La moda es el valor que más veces aparece:
La moda de las calificaciones es 88.
4.2 Medidas de posición
El concepto de medidas de posición incluye estudiar los términos cuartiles, deciles y percentiles, y son utilizadas para dividir un conjunto de datos en partes iguales, proporcionando una idea de cómo se distribuyen los datos.
Ejemplo 2: Encuentra el primer (Q1) y tercer cuartil (Q3) de las siguientes calificaciones: 85, 90, 78, 88, 92, 76, 95.
Procedimiento:
- Ordena las calificaciones de menor a mayor.
- Divide los datos en cuatro partes iguales.
- Encuentra los valores en las posiciones correspondientes a Q1 (25%) y Q3 (75%).
- Calificaciones ordenadas: 76, 78, 85, 88, 90, 92, 95.
Solución:
4.2.1 Cuartiles El uso de cuartiles se popularizó con el desarrollo de la estadística en el siglo XX. Francis Galton fue una figura clave en la introducción de estos conceptos, utilizando cuartiles para describir la dispersión de los datos. Los cuartiles dividen un conjunto de datos ordenados en cuatro partes iguales. El primer cuartil (Q1) es el valor que separa el 25% inferior de los datos, el segundo cuartil (Q2) es la mediana y el tercer cuartil (Q3) separa el 25% superior de los datos. Ejemplos de aplicación práctica: Rendimiento académico: en un examen, los cuartiles pueden dividir las calificaciones de los estudiantes en cuatro grupos. Esto ayuda a identificar a los estudiantes con mejor y peor rendimiento y planificar el apoyo necesario. Ejemplo 1: Para los datos 75, 80, 85, 90, 95, 100, 105, los cuartiles serían aproximadamente: Q1=80. Q2=90 Q3=100
4.2.2 Deciles
Los deciles, al igual que los cuartiles, se comenzaron a utilizar de manera formal en el siglo XX. Se derivan de la necesidad de dividir datos en partes más pequeñas y específicas para un análisis más detallado, siendo especialmente útiles en estudios de economía y educación. Los deciles dividen un conjunto de datos ordenados en diez partes iguales. Cada decil corresponde a un 10% de los datos. Por ejemplo, el primer decil (D1) es el valor que separa el 10% inferior de los datos, y así sucesivamente.
Ejemplos de aplicación práctica:
Distribución de ingresos: en un estudio sobre la distribución de ingresos en una ciudad, los deciles pueden mostrar cómo se distribuyen los ingresos entre los diferentes sectores de la población, ayudando a diseñar políticas de equidad económica.
Ejemplo 1: Para un conjunto de datos grande, el primer decil (D1) se encuentra en la posición correspondiente al 10% de los datos.
Ejemplo 2: Encuentra el segundo (D2) y el octavo decil (D8) de las siguientes calificaciones: 85, 90, 78, 88, 92, 76, 95.
Procedimiento:
- Ordena las calificaciones de menor a mayor.
- Divide los datos en diez partes iguales.
- Encuentra los valores en las posiciones correspondientes a D2 (20%) y D8 (80%).
- Calificaciones ordenadas: 76, 78, 85, 88, 90, 92, 95.
Solución:
4.2.3 Percentiles
Los percentiles fueron desarrollados como una extensión natural de los deciles y cuartiles, permitiendo una división aún más precisa de los datos en 100 partes iguales. Son ampliamente utilizados en pruebas estandarizadas y estudios demográficos para comparar individuos o grupos dentro de una población más amplia. Los percentiles dividen un conjunto de datos ordenados en cien partes iguales. Cada percentil corresponde a un 1% de los datos. Por ejemplo, el percentil 25 (P25) es el valor que separa el 25% inferior de los datos.
Ejemplos de aplicación práctica:
Pruebas estandarizadas: en algunos exámenes, los percentiles indican el rendimiento de un estudiante en comparación con otros. Un percentil se refiere a un porcentaje de valores que se encuentran por encima de un valor especificado. En la práctica, si el puntaje de una prueba está dentro del percentil 70, significa que la persona obtuvo un puntaje superior al 70% de las personas que realizaron la prueba.
Ejemplo 1: En un conjunto de 100 datos, el percentil 25 sería el valor en la posición 25.
Ejemplo 2: Encuentra el percentil 25 (P25) y el percentil 75 (P75) de las siguientes calificaciones: 85, 90, 78, 88, 92, 76, 95.
Procedimiento:
- Ordena las calificaciones de menor a mayor.
- Encuentra los valores en las posiciones correspondientes a P25 (25%) y P75 (75%).
- Calificaciones ordenadas: 76, 78, 85, 88, 90, 92, 95.
Solución:
El percentil 25 (P25) es 78 y el percentil 75 (P75) es 92.
4.3 Desviación medial
La desviación media fue utilizada por los primeros estadísticos para medir la dispersión de los datos, proporcionando una manera de entender la variabilidad de un conjunto de datos. La desviación media es el promedio de las diferencias absolutas entre cada valor del conjunto de datos y la media aritmética. Mide la dispersión de los datos. Vamos a conocer lo que implica en las matemáticas del bachillerato.
4.3.1 Interpretación de la desviación media
La desviación media muestra, en promedio, cuánto se desvían los datos respecto a la media. Un valor bajo indica que los datos están cerca de la media, mientras que un valor alto indica que están más dispersos.
Ejemplos de aplicación práctica:
Calcula la desviación media de las siguientes calificaciones: 2, 4, 6 y 8.
15
No sé qué hacer. Si estuvieras en mi lugar, cómo lo calcularías
Características de la actividad
4.3.2 Varianza y desviación estándar
La varianza y la desviación estándar fueron desarrolladas por el matemático británico Karl Pearson en el siglo XIX. Pearson introdujo estos conceptos para comprender mejor la distribución de los datos. Estos conceptos se han convertido en una herramienta esencial en la estadística y son ampliamente utilizados en diversas aplicaciones, desde las finanzas hasta la investigación científica. En estadística, la varianza y la desviación estándar son dos conceptos muy relacionados. Comencemos con las definiciones:
Varianza: La varianza es el promedio de los cuadrados de las diferencias entre cada valor y la media aritmética.
En términos más simples, la varianza es como una medida de lo "revueltos" que están todos los datos, por ejemplo, de las alturas de todos tus compañeros de clase. Si todos miden casi lo mismo, la varianza será pequeña, porque no hay mucha diferencia entre ellos, pero si algunos son muy altos y otros muy bajos, la varianza será grande porque hay mucha diferencia entre las alturas. La desviación estándar es como si tomáramos la varianza y le sacáramos una especie de "raíz cuadrada".
Desviación estándar: La desviación estándar es la raíz cuadrada de la varianza. Mide la dispersión de los datos en las mismas unidades que los datos originales.
Esto hace que la desviación estándar sea más fácil de entender porque está en las mismas unidades que las alturas (centímetros, por ejemplo). Así, la desviación estándar nos dice, en promedio, qué tan lejos está cada compañero de la altura promedio del grupo. Varianza y desviación estándar son como dos caras de la misma moneda: ambas nos hablan de lo "esparcidos" que están los datos. Sin embargo, dado que la desviación estándar es la "raíz cuadrada" de la varianza, la podemos considerar como una forma de "simplificar" la varianza para que sea más fácil de interpretar. A continuación, vamos a explicar la relación entre ellas mediante un ejemplo:
- Calcula la varianza y la desviación estándar de las siguientes calificaciones de los alumnos: 2, 4, 6 y 8, y proporciona una interpretación de los resultados.
- Dado el conjunto de calificaciones: 2, 4, 6, 8.
4.3.2.1 Interpretación de la varianza
Respecto a las calificaciones 2, 4, 6 y 8, con base en los resultados de una varianza (5) y una desviación estándar (2.24), podemos concluir que las calificaciones de los alumnos muestran una dispersión moderada alrededor de la media aritmética de 5. Algunos alumnos obtuvieron calificaciones más cercanas a la media (4 y 6), mientras que otros obtuvieron calificaciones más alejadas (2 y 8).
La desviación estándar de 2.24 unidades nos indica que la mayoría de las calificaciones se encuentra dentro de un rango de aproximadamente 4.48 unidades alrededor de la media. Esto indica que hay cierta variabilidad en el rendimiento de los alumnos, pero no tan extrema como para sugerir grupos muy separados.
Tal como lo apreciamos en el punto anterior, la varianza de las calificaciones en un examen nos puede indicar qué tan dispersas están las calificaciones de los estudiantes respecto al promedio. Un valor alto de varianza puede sugerir que algunos estudiantes obtuvieron calificaciones muy altas y otros muy bajas, mientras que un valor bajo de varianza puede indicar que la mayoría de los estudiantes obtuvieron calificaciones cercanas al promedio.
Podemos ahondar en dicha interpretación con otro ejemplo:
Supongamos que en un examen de matemáticas hay dos grupos, el grupo A y el grupo B. En el grupo A hay una varianza de 1.5 en las calificaciones. En el grupo B hay una varianza de 9. ¿Qué significan las varianzas de los dos grupos de alumnos en sus calificaciones?Interpretación para el grupo A. La varianza mide cuánto varían las calificaciones respecto a la media. Una varianza de 1.5 indica que las calificaciones están relativamente cerca de la media. La varianza baja sugiere que las calificaciones no están muy dispersas.
4.3.2.2 Interpretación de la desviación estándar
La desviación estándar de las calificaciones en un examen nos dice qué tan lejos, en promedio, están las calificaciones de cada estudiante del promedio. Un valor alto de desviación estándar indica que las calificaciones están muy dispersas, mientras que un valor bajo indica que las calificaciones están agrupadas alrededor del promedio.
Ejemplo. Retomando el ejemplo anterior, en un examen de matemáticas hay dos grupos, el grupo A y el grupo B. En el grupo A hay una desviación estándar de dos en las calificaciones. En el grupo B hay una desviación estándar de 8.8. ¿Qué significan la desviación estándar de los dos grupos de alumnos en sus calificaciones?
Interpretación para el grupo A. La desviación estándar es la raíz cuadrada de la varianza y mide la dispersión, pero en las mismas unidades que las calificaciones originales. Una desviación estándar de dos significa que, en promedio, las calificaciones se desvían de la media en dos puntos. Esto refuerza la idea de que las calificaciones están bastante concentradas alrededor de la media.
Conclusión para el grupo A. Las calificaciones en este grupo son bastante consistentes en la desviación estándar y están agrupadas cerca de la media. Esto podría indicar que los estudiantes tienen un rendimiento similar y no hay grandes diferencias entre las calificaciones.
Conclusión para el grupo A. Las calificaciones en este grupo son bastante consistentes y están agrupadas cerca de la media. Esto podría indicar que los estudiantes tienen un rendimiento similar y no hay grandes diferencias entre las calificaciones.
Interpretación para el grupo B. Una varianza de 9 indica que las calificaciones varían mucho más respecto a la media en comparación con el grupo A. La mayor varianza sugiere que las calificaciones están más dispersas y hay una mayor diferencia entre las notas de los estudiantes.
Conclusión para el grupo B. Las calificaciones en este grupo son mucho más dispersas. Esto podría significar que hay estudiantes con calificaciones muy altas y otros con calificaciones muy bajas, indicando una gran diferencia en el rendimiento académico de los estudiantes.
4.4 Diagrama de dispersión y centro de gravedad
Interpretación para el grupo B. Una varianza de 9 indica que las calificaciones varían mucho más respecto a la media en comparación con el grupo A. La mayor varianza sugiere que las calificaciones están más dispersas y hay una mayor diferencia entre las notas de los estudiantes.
Conclusión para el grupo B. Las calificaciones en este grupo son mucho más dispersas. Esto podría significar que hay estudiantes con calificaciones muy altas y otros con calificaciones muy bajas, indicando una gran diferencia en el rendimiento académico de los estudiantes. Comparación entre los dos grupos. El grupo A tiene calificaciones más consistentes y menos dispersas, mientras que el grupo B tiene calificaciones muy variadas. El grupo A parece tener un rendimiento académico más uniforme, mientras que el grupo B tiene una mayor disparidad en las calificaciones, lo que podría requerir una atención más personalizada para los estudiantes con calificaciones extremas.
El diagrama de dispersión fue popularizado por Francis Galton en el siglo XIX como parte de su trabajo en regresión y correlación. El centro de gravedad, o centroide, es un concepto que tiene sus raíces en la física, pero se ha adaptado para el análisis estadístico para representar el punto medio de un conjunto de datos. Para los efectos de este curso podemos definir un diagrama de dispersión como una representación gráfica que muestra la relación entre dos variables. Cada punto en el gráfico representa un par de valores (x, y), lo que permite observar patrones, tendencias y posibles correlaciones entre las variables. Por su parte, el centro de gravedad de un diagrama de dispersión, también conocido como el punto medio o centroide, es el punto promedio de todas las coordenadas (x, y). Se calcula como el promedio de los valores de x y el promedio de los valores de y.
Un atleta puede usar un diagrama de dispersión para ver la relación entre el número de horas de entrenamiento y su rendimiento en competencias (por ejemplo, tiempos de carrera). Esto puede ayudar a optimizar su entrenamiento y observar cómo diferentes volúmenes de práctica afectan su desempeño.
Vamos a entenderlo con un ejemplo:
Supongamos que un atleta registra las horas de entrenamiento semanales y sus tiempos en una carrera de 5 kilómetros durante cinco semanas, conforme la siguiente tabla:
Realiza el diagrama de dispersión, calcula el centro de gravedad e interpreta el significado de tus resultados.
Graficar un diagrama de dispersión. Primero, se grafican los datos en un diagrama de dispersión, con las horas de entrenamiento en el eje x y los tiempos de carrera en el eje y. Luego se calculan las medias de horas de entrenamiento.
Interpretación. El centro de gravedad de los datos es el punto (5, 25), lo que indica que, en promedio, el atleta entrena 5 horas por semana y logra un tiempo de carrera de 25 minutos.
4.5 Covarianza
La covarianza fue desarrollada en el siglo XIX. La covarianza mide cómo dos variables cambian conjuntamente; es una base fundamental para el análisis de la correlación y la regresión en estadística. De manera más precisa, la covarianza es una medida que indica el grado en que dos variables cambian juntas. Si la covarianza es positiva, significa que cuando una variable aumenta, la otra también tiende a aumentar. Si es negativa, cuando una variable aumenta, la otra tiende a disminuir. Una covarianza cercana a cero indica que no hay una relación lineal clara entre las variables. Al entender que existe una relación positiva entre el tiempo de estudio y las calificaciones, un estudiante puede motivarse a dedicar más horas al estudio para mejorar su rendimiento académico. Fórmula:
Un ejemplo de aplicación es el siguiente:
Relación entre horas de estudio y calificaciones. Un estudiante registra el número de horas que estudia y las calificaciones que obtiene en sus exámenes durante cinco semanas, conforme la siguiente tabla:
La covarianza calculada es de 12.5. Esto indica que hay una relación positiva entre las horas de estudio y las calificaciones del estudiante; esto es, cuando el estudiante dedica más horas al estudio, tiende a obtener mejores calificaciones.
¿Qué relación existe entre el tiempo que dedica a estudiar y sus calificaciones en diferentes materias?
16
Uniformes para un equipo de futbol
Características de la actividad
4.6 Distribución normal
La distribución normal originalmente se describió mediante la forma de la campana y fue popularizada por Carl Friedrich Gauss. Actualmente, se conoce como "curva de Gauss". La distribución normal es una forma de representar datos donde la mayoría de los valores se agrupan alrededor de un punto central (la media) y se dispersan simétricamente hacia los extremos. Esta gráfica tiene forma de campana y se usa para describir muchas variables naturales, como las alturas o las calificaciones. Las calificaciones de un examen estandarizado, por ejemplo, suelen seguir una distribución normal. Esto significa que la mayoría de los estudiantes obtienen calificaciones cercanas a la media, y menos estudiantes obtienen calificaciones extremadamente altas o bajas. Esto ayuda a los profesores a identificar el rendimiento general de la clase y a establecer curvas de calificación.
Lo anterior, lo vamos a estudiar mediante un ejemplo:
Un examen tiene una media de 75 puntos y una desviación estándar de 10 puntos. Suponiendo que las calificaciones se distribuyen normalmente, calcula la probabilidad de que un estudiante obtenga una calificación entre 65 y 85 puntos.
Procedimiento:
Solución. La probabilidad de que un estudiante obtenga una calificación entre 65 y 85 es aproximadamente 68.26%.
4.7 Clasificación de la probabilidad
La probabilidad comenzó a desarrollarse formalmente en el siglo XVII con matemáticos como Blaise Pascal y Pierre de Fermat, quienes estudiaron problemas relacionados con juegos de azar. La probabilidad mide la posibilidad de que ocurra un evento. Suele clasificarse en: exclusión, independencia y dependencia.
4.7.1 Eventos mutuamente excluyentes o disjuntos
Dos eventos son mutuamente excluyentes si no pueden ocurrir al mismo tiempo. La clasificación de eventos en términos de exclusión, independencia y dependencia ha ayudado a entender mejor las situaciones de la vida real. Por ejemplo, al lanzar un dado, la probabilidad de obtener un 3 o un 5 es un ejemplo de eventos mutuamente excluyentes, ya que no se pueden obtener ambos resultados al mismo tiempo
Ejemplo. Al lanzar un dado, ¿cuál es la probabilidad de obtener un 2 o un 5?
Procedimiento:
- Identificar eventos.
Evento A: Obtener un 2.
Evento B: Obtener un 5.
Eventos excluyentes: No se pueden obtener ambos resultados a la vez.
Suma de probabilidades:
Solución. La probabilidad de obtener un 2 o un 5 es 1/3.
4.7.3 Eventos dependientes
4.7.2 Eventos independientes
Entender cómo las acciones anteriores pueden influir en las probabilidades futuras ha permito, en la actualidad, el estudio de eventos dependientes en campos como la genética y la economía: dos eventos son dependientes, si el resultado de uno afecta al resultado del otro. Sacar una carta de una baraja y luego sacar otra sin devolver la primera es un caso de eventos dependientes porque el resultado del primer evento afecta al segundo.
Vamos a realizar un ejemplo:
De una baraja de 52 cartas, ¿cuál es la probabilidad de sacar una carta de corazones y luego otra carta de corazones sin reemplazar la primera?
Procedimiento.
Probabilidad de la primera carta:
Los eventos independientes fueron definidos en el siglo XVIII. Este concepto fue crucial para el desarrollo de la teoría de la probabilidad y la estadística, ya que permitió el cálculo de probabilidades compuestas en situaciones donde los eventos no se afectan entre sí.
Se define de la siguiente manera: dos eventos son independientes, si el resultado de uno no afecta al resultado del otro. El resultado de lanzar una moneda (cara o cruz) y un dado (cualquier número del uno al seis) son eventos independientes. El resultado de uno no afecta al otro.
Ejemplo. ¿Cuál es la probabilidad de lanzar una moneda y obtener cara, y luego seleccionar una carta del mazo de cartas estándar y obtener un as?
Procedimiento:
Evento A. Hay una cara en una moneda de dos caras. La probabilidad es 1/2 o sea 0.5.
Evento B. Hay cuatro ases en un mazo de 52 cartas. La probabilidad es 4/52, o sea 0.0769.
Interpretación. El hecho de que exista más probabilidad en ganar jugando a un lanzamiento de moneda no implica que necesariamente ganarás en el siguiente juego de cartas.
4.7.3 Eventos dependientes
Ejemplo. En una clase, 10 estudiantes juegan baloncesto, 15 juegan fútbol, y 5 juegan ambos deportes. ¿Cuál es la probabilidad de que un estudiante seleccionado al azar juegue baloncesto o fútbol?
Procedimiento. Eventos no excluyentes:
Evento A: Juega baloncesto (10).
Evento B: Juega fútbol (15).
Ambos (intersección): 5.
Uso de la fórmula de probabilidad no excluyente:
La probabilidad de sacar dos corazones consecutivos es 1/17.
Razonamiento. Sacar una carta de corazones (hay 13 corazones en una baraja de 52 cartas) tiene una probabilidad de 1/4 es decir 0.25; luego, volver sacar otra sin devolver la primera (hay 12 corazones en una baraja de 51 cartas, en esta ocasión) tiene una probabilidad de 12/51 es decir 0.23. Por tanto, son eventos dependientes en el entendido de que el resultado del primer evento afecta al segundo.
4.7.4 Eventos no excluyentes entre sí
La idea de eventos no excluyentes ayuda a manejar situaciones donde hay superposición, como en análisis de datos demográficos y encuestas. Esto es útil para calcular probabilidades en situaciones donde hay superposición entre grupos.
Dado que dos eventos son no excluyentes si pueden ocurrir al mismo tiempo, podemos entender que, en un grupo de estudiantes, algunos pueden jugar baloncesto y también futbol. Estos eventos no se excluyen mutuamente porque un estudiante puede participar en ambos deportes.
Solución. La probabilidad de que un estudiante juegue baloncesto o fútbol es 1.0 (o 100%, ya que todos juegan al menos uno de los deportes).
4.8 Estadística inferencial
Ejemplo. Eres el encargado de un departamento de producción en una fábrica y recibes un lote de 2000 piezas necesarias para la fabricación de un artículo. Tienes la responsabilidad de aceptar o rechazar el lote, si estimas que la calidad de este no es suficiente. El fabricante te asegura que en este lote no hay más de 100 piezas defectuosas, pero decides tomar una muestra para estimar su proporción: a) ¿Cuántas piezas decides examinar para que, con un nivel de confianza del 95%, el error que cometas en la estimación de la proporción poblacional de defectuosas no sea mayor que 0.05?
Para determinar cuántas piezas debes examinar para que el error en la estimación de la proporción poblacional de piezas defectuosas no sea mayor que 0.05, con un nivel de confianza del 95%, usaremos la fórmula del tamaño de muestra para una proporción. Esta fórmula es:
La estadística inferencial tiene sus raíces en el siglo XVII, cuando matemáticos como Pierre-Simon Laplace y Thomas Bayes comenzaron a desarrollar métodos para hacer inferencias sobre poblaciones a partir de muestras. Sin embargo, fue en el siglo XX cuando Ronald A. Fisher y Jerzy Neyman establecieron formalmente las bases de la inferencia estadística, incluyendo el desarrollo de pruebas de hipótesis y la teoría de la estimación. Estos métodos se han convertido en herramientas fundamentales para la investigación científica y la toma de decisiones en diversas disciplinas. En la actualidad, la estadística inferencial es una rama de la estadística que utiliza una muestra de datos para hacer estimaciones o inferencias sobre una población más grande. Esto se logra mediante el uso de métodos como intervalos de confianza y pruebas de hipótesis. A partir de la información empírica proporcionada por una muestra, permite conocer cuál es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad.
Donde:
n= tamaño de la muestra
Z= valor crítico de la distribución normal para el nivel de confianza deseado
p= proporción estimada de la población (piezas defectuosas)
E= error máximo permitido en la estimación
Paso 1. Determinación del valor crítico Z para un nivel de confianza del 95%
En la distribución normal estándar, el valor crítico Z se utiliza para establecer los límites de un intervalo de confianza o para realizar pruebas de hipótesis con un nivel de confianza específico. El nivel de confianza representa la probabilidad de que la estimación obtenida se encuentre dentro del intervalo verdadero.
Existen dos métodos principales para determinar el valor crítico Z para un nivel de confianza del 95%:
1. Utilizar una tabla de distribución normal estándar: las tablas de distribución normal estándar proporcionan valores de probabilidad acumulada (P(z)) para diferentes valores de z (desviaciones estándar de la media). Para un nivel de confianza del 95%, se debe buscar el valor de Z que corresponde a un área acumulada de 0.95. Pasos:
-Buscar una tabla de distribución normal estándar: existen diversas tablas disponibles en libros de texto, software estadístico o páginas web especializadas.
-Localizar la fila correspondiente al nivel de confianza del 95% (0.95).
-Identificar el valor de Zzen la columna que representa el área acumulada más cercana a 0.95. Este valor será el valor crítico Z para un nivel de confianza del 95%.
-El nivel de confianza del 95% corresponde a un valor crítico Z de aproximadamente 1.96.
- Estimar la proporción p
El fabricante asegura que no hay más de 100 piezas defectuosas en un lote de 2000, lo que nos da una proporción estimada p:
Redondeamos al número entero más cercano, ya que no se puede examinar una fracción de una pieza.
Solución: 73 piezas.
Este ejemplo demuestra cómo usar la estadística inferencial para hacer estimaciones sobre una población a partir de una muestra, una habilidad esencial en muchas áreas, desde la investigación científica hasta la toma de decisiones en negocios.
-Determinar el error máximo permitido E.
El error máximo permitido en la estimación es 0.05.
-Sustituir los valores en la fórmula.
17
Actividad 17. ¡Hoy es mi día de buena suerte!
Características de la actividad
Conclusiones del módulo
Este capítulo ha sentado las bases para comprender y analizar datos de manera más profunda. Analizamos aspectos que dan validación a la información proveniente de fuentes científicas, aprendimos a distinguir temas relacionados con “la buena suerte” y reflexionamos sobre el papel social que pueden tener estos conocimientos. A medida que avancemos en nuestro estudio de la estadística, en grados superiores, desarrollaremos modelos más sofisticados para la toma de decisiones basadas en datos.
En este capítulo hemos explorado las herramientas fundamentales para describir y analizar conjuntos de datos. Desde las medidas de tendencia central, que nos permiten identificar el valor "típico" de un conjunto de datos, hasta las medidas de dispersión, que cuantifican cuán dispersos están los datos alrededor de ese valor central, hemos visto cómo la media, la mediana y la moda nos ofrecen diferentes perspectivas de los datos, y cómo las medidas de posición como cuartiles, deciles y percentiles nos permiten dividir los datos en grupos de igual tamaño.
Además, hemos profundizado en la varianza y la desviación estándar, que son medidas clave para entender la dispersión de los datos. El diagrama de dispersión y la covarianza nos han permitido explorar la relación entre dos variables, mientras que la distribución normal, una de las distribuciones de probabilidad más importantes, nos ha proporcionado una herramienta poderosa para modelar fenómenos naturales y sociales.
Finalmente, hemos introducido los conceptos básicos de la probabilidad, como eventos mutuamente excluyentes, independientes y dependientes, y hemos hecho una breve incursión en la estadística inferencial.
18
Actividad 18. Evaluación módulo III y IV
Características de la actividad
Referencias
- Estadística para todos. (2018). Tema 2. Variables estadísticas y distribuciones de frecuencias. https://estadisticaparatodos.com/variables-estadisticas-y-distribuciones-de-frecuencias/#graficos-para-variables-agrupadas-histograma
- Ibáñez, P. (2023). Pensamiento Matemático I. CENGAGE.
- Oxcal, R. (3 de abril 2018). Cálculo de la varianza y la desviación estándar en una serie de datos simples [Vídeo]. https://www.youtube.com/watch?v=VT374cKG_4I
- Santaolalla, J. (3 de abril 2024). ¿Existe la suerte? [Vídeo]. https://www.youtube.com/watch?v=49epHjrRkVg
- SEDUCA. (2024). Pensamiento matemático I [e-book]. Universidad Autónoma del Estado de México.
- Tabla Z. (2024). Tabla Z. SlideShare. Recuperado el 16 de octubre de 2024, https://es.slideshare.net/slideshow/tabla-z-13752994/13752994
- UNAM - Universidad Nacional Autónoma de México (s. f.). Portal académico del CCH: Un espacio de consulta, difusión e intercambio académicos para la Educación Media Superior. https://portalacademico.cch.unam.mx/
BACHILLERATO UNIVERSITARIO (CBU) NMS PeriOdo 2024B
U4 - Pensamiento matemático BUAD
UAEMex
Created on November 5, 2024
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Vaporwave presentation
View
Animated Sketch Presentation
View
Memories Presentation
View
Pechakucha Presentation
View
Decades Presentation
View
Color and Shapes Presentation
View
Historical Presentation
Explore all templates
Transcript
Medidas numéricas
MÓDULO IV
Imagen tomada con fines académicos de: https://goo.su/ElpWJU
Propósito
Estructura temática
4.1 Medidas de tendencia central 4.1.1 Media aritmética 4.1.2 Mediana 4.1.3 Moda 4.2 Medidas de posición 4.2.1. Cuartiles 4.2.2. Deciles 4.2.3. Percentiles 4.3 Desviación media 4.3.1. Interpretación de la desviación media 4.3.2 Varianza y desviación estándar 4.3.2.1. Interpretación de la varianza 4.3.2.2 Interpretación de la desviación estándar 4.4 Diagrama de dispersión 4.5 Covarianza 4.6 Distribución normal 4.7 Clasificación de la probabilidad 4.7.1 Eventos mutuamente excluyentes o disjuntos 4.7.2 Eventos independientes 4.7.3 Eventos dependientes 4.7.4 Eventos no excluyentes entre sí 4.8 Estadística inferencial
Determinar las medidas de tendencia central, posición y dispersión de un conjunto de datos.
Actividad Detonadora
Introducción al módulo
En nuestra vida diaria, constantemente nos encontramos con datos: calificaciones en la escuela, estadísticas deportivas, la predicción del clima o los posibles ganadores de un concurso de televisión. Las medidas numéricas nos permiten interpretar y comprender estos datos de manera efectiva. Con base en lo descrito, a lo largo de este módulo, exploraremos las medidas de tendencia central, posición y dispersión, y veremos cómo estas herramientas matemáticas nos ayudan a tomar decisiones informadas. Ahora, imagina que estás organizando una competencia deportiva en tu escuela y necesitas evaluar el rendimiento de los participantes; o quizá estés planeando un presupuesto mensual y necesitas entender tus gastos. Las medidas numéricas te permiten no solo resumir estos datos, sino también hacer comparaciones y tomar decisiones basadas en hechos. En nuestra vida real algunas de las aplicaciones prácticas son: •Educación: Evaluar el rendimiento promedio de una clase y entender cómo se distribuyen las calificaciones. •Deportes: Analizar estadísticas de jugadores para identificar fortalezas y áreas de mejora. •Salud: Interpretar datos de encuestas para mejorar programas de salud comunitaria.
“¿Cuánto tiempo pasan tus amigos más cercanos en redes sociales?” Alguna vez te has preguntado… ¿Cuánto tiempo pasan tus amigos más cercanos en redes sociales? Las medidas numéricas son herramientas valiosas para entender y analizar datos de nuestra vida cotidiana. Por ejemplo, conocer el promedio de horas que dedicamos a interactuar con nuestros amigos en plataformas como Instagram, X, TikTok y Snapchat puede ayudarnos a reflexionar sobre nuestras propias decisiones. Te invito a realizar la siguiente actividad: Pregunta a algunos de tus amigos (mínimo tres) ¿cuántos minutos pasan al día en aplicaciones como Instagram, X, TikTok y/o Snapchat? Luego, suma todos los minutos que te compartan y divídelos entre el número total de amigos que consultaste. Una vez que tengas el promedio, compáralo con el tiempo que tú dedicas diariamente a estas redes. Finalmente, responde a la siguiente pregunta: ¿pasas más o menos tiempo que ellos en las redes sociales?
4.1 Medidas de tendencia central
Con base en lo anterior, los objetivos del módulo IV son: • Comprender las medidas de tendencia central (media, mediana, moda) y su utilidad para resumir grandes cantidades de datos en un solo valor representativo. • Explorar las medidas de posición (cuartiles, deciles, percentiles) para interpretar la distribución de los datos y comparar resultados. • Analizar las medidas de dispersión (desviación media, varianza, desviación estándar) para evaluar la consistencia de los datos y su variabilidad. Al finalizar este módulo, podrás aplicar estas herramientas en situaciones cotidianas y académicas, comprendiendo mejor cómo los datos pueden informar nuestras decisiones y mejorar nuestra comprensión del mundo que nos rodea. Este módulo es muy práctico, por lo que procuraremos poner varios ejemplos de aplicación para que los ocupes en tu vida cotidiana y en tu entorno social.
Las medidas de tendencia central se refieren a valores que representan el centro o la ubicación central de un conjunto de datos. Estas medidas incluyen la media aritmética, la mediana y la moda. 4.1.1 Media aritmética La media aritmética es una de las medidas más antiguas y comunes de tendencia central. Se remonta a la época de los antiguos matemáticos griegos, como Euclides, que ya utilizaban conceptos similares de un modo implícito. En la actualidad, empleamos la siguiente definición: la media aritmética, también conocida como promedio, es el valor obtenido al sumar todos los datos de un conjunto y dividir esta suma entre el número total de datos. Es una medida que indica el valor central de un conjunto de datos. Una aplicación práctica la puedes encontrar en el presupuesto familiar. Por ejemplo, si tu familia gasta diferentes cantidades de dinero cada mes en alimentos, la media aritmética te ayuda a saber cuánto se gasta en promedio cada mes. Esto ayuda a planificar mejor el presupuesto. También te sirve para conocer el promedio de tus calificaciones.
4.1.2 Mediana
Ejemplo: Si las calificaciones de cinco exámenes son 80, 85, 90, 75 y 95, la media aritmética sería:
La mediana fue introducida en el siglo XIX por el matemático francés Adolphe Quetelet. Quetelet utilizó la mediana para analizar datos sobre características físicas de los seres humanos, como la altura y el peso, destacando que esta medida es menos afectada por valores atípicos en comparación con la media aritmética. Actualmente, la definimos como el valor que se encuentra en el centro de un conjunto de datos ordenados de menor a mayor. Si el número de datos es impar, la mediana es el valor central. Si es par, es el promedio de los dos valores centrales.Una aplicación práctica se puede dar en una empresa familiar: la mediana del salario puede mostrar el sueldo típico de un empleado. Esto es útil para evitar que valores extremos (muy altos o muy bajos) afecten la percepción general de los salarios. Un ejemplo de aplicación es el siguiente: encuentra la mediana de las siguientes calificaciones: 85, 90, 78, 88, 92, 76, 95. Procedimiento:- Ordena las calificaciones de menor a mayor. - Encuentra el valor central. - Calificaciones ordenadas: 76, 78, 85, 88, 90, 92, 95. Solución: La mediana es el cuarto valor (el valor central):- La mediana de las calificaciones es 88.
Otro ejemplo para tu vida escolar es el siguiente: Encuentra la media aritmética de las siguientes calificaciones de un estudiante en siete exámenes: 85, 90, 78, 88, 92, 76, 95. Procedimiento: - Suma todas las calificaciones. - Divide la suma entre el número de calificaciones.
- La media aritmética de las calificaciones es 86.29.
4.1.3 Moda
El concepto de moda, en su formulación matemática, fue desarrollado en el siglo XIX. Francis Galton, un primo de Charles Darwin y pionero en la estadística, promovió el uso de la moda en la estadística descriptiva. La moda se utiliza para identificar el valor que aparece con mayor frecuencia en un conjunto de datos, siendo útil en diversos campos, desde la biología hasta la economía, e incluso la “moda” en la industria del vestido. Nosotros definimos a la moda como el valor que más se repite en un conjunto de datos. Puede haber más de una moda si varios valores se repiten con la misma frecuencia y esta es la más alta. Ejemplos de aplicación práctica: Preferencias de productos: Si en una tienda de dulces, el sabor de helado más vendido es el de chocolate, este sabor es la moda. Esto ayuda al dueño a saber qué producto es el más popular y mantener suficiente inventario.
Ejemplo 1: En el conjunto de datos 75, 80, 85, 90, 85, 95, la moda es 85 porque es el valor que aparece más veces. Ejemplo 2: Encuentra la moda de las siguientes calificaciones: 85, 90, 78, 88, 88, 92, 76, 95. Procedimiento: - Encuentra el valor que más se repite. Solución: La moda es el valor que más veces aparece: La moda de las calificaciones es 88.
4.2 Medidas de posición
El concepto de medidas de posición incluye estudiar los términos cuartiles, deciles y percentiles, y son utilizadas para dividir un conjunto de datos en partes iguales, proporcionando una idea de cómo se distribuyen los datos.
Ejemplo 2: Encuentra el primer (Q1) y tercer cuartil (Q3) de las siguientes calificaciones: 85, 90, 78, 88, 92, 76, 95. Procedimiento: - Ordena las calificaciones de menor a mayor. - Divide los datos en cuatro partes iguales. - Encuentra los valores en las posiciones correspondientes a Q1 (25%) y Q3 (75%). - Calificaciones ordenadas: 76, 78, 85, 88, 90, 92, 95. Solución:
4.2.1 Cuartiles El uso de cuartiles se popularizó con el desarrollo de la estadística en el siglo XX. Francis Galton fue una figura clave en la introducción de estos conceptos, utilizando cuartiles para describir la dispersión de los datos. Los cuartiles dividen un conjunto de datos ordenados en cuatro partes iguales. El primer cuartil (Q1) es el valor que separa el 25% inferior de los datos, el segundo cuartil (Q2) es la mediana y el tercer cuartil (Q3) separa el 25% superior de los datos. Ejemplos de aplicación práctica: Rendimiento académico: en un examen, los cuartiles pueden dividir las calificaciones de los estudiantes en cuatro grupos. Esto ayuda a identificar a los estudiantes con mejor y peor rendimiento y planificar el apoyo necesario. Ejemplo 1: Para los datos 75, 80, 85, 90, 95, 100, 105, los cuartiles serían aproximadamente: Q1=80. Q2=90 Q3=100
4.2.2 Deciles
Los deciles, al igual que los cuartiles, se comenzaron a utilizar de manera formal en el siglo XX. Se derivan de la necesidad de dividir datos en partes más pequeñas y específicas para un análisis más detallado, siendo especialmente útiles en estudios de economía y educación. Los deciles dividen un conjunto de datos ordenados en diez partes iguales. Cada decil corresponde a un 10% de los datos. Por ejemplo, el primer decil (D1) es el valor que separa el 10% inferior de los datos, y así sucesivamente. Ejemplos de aplicación práctica: Distribución de ingresos: en un estudio sobre la distribución de ingresos en una ciudad, los deciles pueden mostrar cómo se distribuyen los ingresos entre los diferentes sectores de la población, ayudando a diseñar políticas de equidad económica. Ejemplo 1: Para un conjunto de datos grande, el primer decil (D1) se encuentra en la posición correspondiente al 10% de los datos. Ejemplo 2: Encuentra el segundo (D2) y el octavo decil (D8) de las siguientes calificaciones: 85, 90, 78, 88, 92, 76, 95.
Procedimiento: - Ordena las calificaciones de menor a mayor. - Divide los datos en diez partes iguales. - Encuentra los valores en las posiciones correspondientes a D2 (20%) y D8 (80%). - Calificaciones ordenadas: 76, 78, 85, 88, 90, 92, 95. Solución:
4.2.3 Percentiles
Los percentiles fueron desarrollados como una extensión natural de los deciles y cuartiles, permitiendo una división aún más precisa de los datos en 100 partes iguales. Son ampliamente utilizados en pruebas estandarizadas y estudios demográficos para comparar individuos o grupos dentro de una población más amplia. Los percentiles dividen un conjunto de datos ordenados en cien partes iguales. Cada percentil corresponde a un 1% de los datos. Por ejemplo, el percentil 25 (P25) es el valor que separa el 25% inferior de los datos. Ejemplos de aplicación práctica: Pruebas estandarizadas: en algunos exámenes, los percentiles indican el rendimiento de un estudiante en comparación con otros. Un percentil se refiere a un porcentaje de valores que se encuentran por encima de un valor especificado. En la práctica, si el puntaje de una prueba está dentro del percentil 70, significa que la persona obtuvo un puntaje superior al 70% de las personas que realizaron la prueba. Ejemplo 1: En un conjunto de 100 datos, el percentil 25 sería el valor en la posición 25. Ejemplo 2: Encuentra el percentil 25 (P25) y el percentil 75 (P75) de las siguientes calificaciones: 85, 90, 78, 88, 92, 76, 95.
Procedimiento: - Ordena las calificaciones de menor a mayor. - Encuentra los valores en las posiciones correspondientes a P25 (25%) y P75 (75%). - Calificaciones ordenadas: 76, 78, 85, 88, 90, 92, 95. Solución:
El percentil 25 (P25) es 78 y el percentil 75 (P75) es 92.
4.3 Desviación medial
La desviación media fue utilizada por los primeros estadísticos para medir la dispersión de los datos, proporcionando una manera de entender la variabilidad de un conjunto de datos. La desviación media es el promedio de las diferencias absolutas entre cada valor del conjunto de datos y la media aritmética. Mide la dispersión de los datos. Vamos a conocer lo que implica en las matemáticas del bachillerato. 4.3.1 Interpretación de la desviación media La desviación media muestra, en promedio, cuánto se desvían los datos respecto a la media. Un valor bajo indica que los datos están cerca de la media, mientras que un valor alto indica que están más dispersos. Ejemplos de aplicación práctica: Calcula la desviación media de las siguientes calificaciones: 2, 4, 6 y 8.
15
No sé qué hacer. Si estuvieras en mi lugar, cómo lo calcularías
Características de la actividad
4.3.2 Varianza y desviación estándar
La varianza y la desviación estándar fueron desarrolladas por el matemático británico Karl Pearson en el siglo XIX. Pearson introdujo estos conceptos para comprender mejor la distribución de los datos. Estos conceptos se han convertido en una herramienta esencial en la estadística y son ampliamente utilizados en diversas aplicaciones, desde las finanzas hasta la investigación científica. En estadística, la varianza y la desviación estándar son dos conceptos muy relacionados. Comencemos con las definiciones: Varianza: La varianza es el promedio de los cuadrados de las diferencias entre cada valor y la media aritmética.
En términos más simples, la varianza es como una medida de lo "revueltos" que están todos los datos, por ejemplo, de las alturas de todos tus compañeros de clase. Si todos miden casi lo mismo, la varianza será pequeña, porque no hay mucha diferencia entre ellos, pero si algunos son muy altos y otros muy bajos, la varianza será grande porque hay mucha diferencia entre las alturas. La desviación estándar es como si tomáramos la varianza y le sacáramos una especie de "raíz cuadrada".
Desviación estándar: La desviación estándar es la raíz cuadrada de la varianza. Mide la dispersión de los datos en las mismas unidades que los datos originales.
Esto hace que la desviación estándar sea más fácil de entender porque está en las mismas unidades que las alturas (centímetros, por ejemplo). Así, la desviación estándar nos dice, en promedio, qué tan lejos está cada compañero de la altura promedio del grupo. Varianza y desviación estándar son como dos caras de la misma moneda: ambas nos hablan de lo "esparcidos" que están los datos. Sin embargo, dado que la desviación estándar es la "raíz cuadrada" de la varianza, la podemos considerar como una forma de "simplificar" la varianza para que sea más fácil de interpretar. A continuación, vamos a explicar la relación entre ellas mediante un ejemplo:
4.3.2.1 Interpretación de la varianza
Respecto a las calificaciones 2, 4, 6 y 8, con base en los resultados de una varianza (5) y una desviación estándar (2.24), podemos concluir que las calificaciones de los alumnos muestran una dispersión moderada alrededor de la media aritmética de 5. Algunos alumnos obtuvieron calificaciones más cercanas a la media (4 y 6), mientras que otros obtuvieron calificaciones más alejadas (2 y 8). La desviación estándar de 2.24 unidades nos indica que la mayoría de las calificaciones se encuentra dentro de un rango de aproximadamente 4.48 unidades alrededor de la media. Esto indica que hay cierta variabilidad en el rendimiento de los alumnos, pero no tan extrema como para sugerir grupos muy separados.
Tal como lo apreciamos en el punto anterior, la varianza de las calificaciones en un examen nos puede indicar qué tan dispersas están las calificaciones de los estudiantes respecto al promedio. Un valor alto de varianza puede sugerir que algunos estudiantes obtuvieron calificaciones muy altas y otros muy bajas, mientras que un valor bajo de varianza puede indicar que la mayoría de los estudiantes obtuvieron calificaciones cercanas al promedio. Podemos ahondar en dicha interpretación con otro ejemplo: Supongamos que en un examen de matemáticas hay dos grupos, el grupo A y el grupo B. En el grupo A hay una varianza de 1.5 en las calificaciones. En el grupo B hay una varianza de 9. ¿Qué significan las varianzas de los dos grupos de alumnos en sus calificaciones?Interpretación para el grupo A. La varianza mide cuánto varían las calificaciones respecto a la media. Una varianza de 1.5 indica que las calificaciones están relativamente cerca de la media. La varianza baja sugiere que las calificaciones no están muy dispersas.
4.3.2.2 Interpretación de la desviación estándar
La desviación estándar de las calificaciones en un examen nos dice qué tan lejos, en promedio, están las calificaciones de cada estudiante del promedio. Un valor alto de desviación estándar indica que las calificaciones están muy dispersas, mientras que un valor bajo indica que las calificaciones están agrupadas alrededor del promedio. Ejemplo. Retomando el ejemplo anterior, en un examen de matemáticas hay dos grupos, el grupo A y el grupo B. En el grupo A hay una desviación estándar de dos en las calificaciones. En el grupo B hay una desviación estándar de 8.8. ¿Qué significan la desviación estándar de los dos grupos de alumnos en sus calificaciones? Interpretación para el grupo A. La desviación estándar es la raíz cuadrada de la varianza y mide la dispersión, pero en las mismas unidades que las calificaciones originales. Una desviación estándar de dos significa que, en promedio, las calificaciones se desvían de la media en dos puntos. Esto refuerza la idea de que las calificaciones están bastante concentradas alrededor de la media. Conclusión para el grupo A. Las calificaciones en este grupo son bastante consistentes en la desviación estándar y están agrupadas cerca de la media. Esto podría indicar que los estudiantes tienen un rendimiento similar y no hay grandes diferencias entre las calificaciones.
Conclusión para el grupo A. Las calificaciones en este grupo son bastante consistentes y están agrupadas cerca de la media. Esto podría indicar que los estudiantes tienen un rendimiento similar y no hay grandes diferencias entre las calificaciones. Interpretación para el grupo B. Una varianza de 9 indica que las calificaciones varían mucho más respecto a la media en comparación con el grupo A. La mayor varianza sugiere que las calificaciones están más dispersas y hay una mayor diferencia entre las notas de los estudiantes. Conclusión para el grupo B. Las calificaciones en este grupo son mucho más dispersas. Esto podría significar que hay estudiantes con calificaciones muy altas y otros con calificaciones muy bajas, indicando una gran diferencia en el rendimiento académico de los estudiantes.
4.4 Diagrama de dispersión y centro de gravedad
Interpretación para el grupo B. Una varianza de 9 indica que las calificaciones varían mucho más respecto a la media en comparación con el grupo A. La mayor varianza sugiere que las calificaciones están más dispersas y hay una mayor diferencia entre las notas de los estudiantes. Conclusión para el grupo B. Las calificaciones en este grupo son mucho más dispersas. Esto podría significar que hay estudiantes con calificaciones muy altas y otros con calificaciones muy bajas, indicando una gran diferencia en el rendimiento académico de los estudiantes. Comparación entre los dos grupos. El grupo A tiene calificaciones más consistentes y menos dispersas, mientras que el grupo B tiene calificaciones muy variadas. El grupo A parece tener un rendimiento académico más uniforme, mientras que el grupo B tiene una mayor disparidad en las calificaciones, lo que podría requerir una atención más personalizada para los estudiantes con calificaciones extremas.
El diagrama de dispersión fue popularizado por Francis Galton en el siglo XIX como parte de su trabajo en regresión y correlación. El centro de gravedad, o centroide, es un concepto que tiene sus raíces en la física, pero se ha adaptado para el análisis estadístico para representar el punto medio de un conjunto de datos. Para los efectos de este curso podemos definir un diagrama de dispersión como una representación gráfica que muestra la relación entre dos variables. Cada punto en el gráfico representa un par de valores (x, y), lo que permite observar patrones, tendencias y posibles correlaciones entre las variables. Por su parte, el centro de gravedad de un diagrama de dispersión, también conocido como el punto medio o centroide, es el punto promedio de todas las coordenadas (x, y). Se calcula como el promedio de los valores de x y el promedio de los valores de y. Un atleta puede usar un diagrama de dispersión para ver la relación entre el número de horas de entrenamiento y su rendimiento en competencias (por ejemplo, tiempos de carrera). Esto puede ayudar a optimizar su entrenamiento y observar cómo diferentes volúmenes de práctica afectan su desempeño. Vamos a entenderlo con un ejemplo:
Supongamos que un atleta registra las horas de entrenamiento semanales y sus tiempos en una carrera de 5 kilómetros durante cinco semanas, conforme la siguiente tabla:
Realiza el diagrama de dispersión, calcula el centro de gravedad e interpreta el significado de tus resultados. Graficar un diagrama de dispersión. Primero, se grafican los datos en un diagrama de dispersión, con las horas de entrenamiento en el eje x y los tiempos de carrera en el eje y. Luego se calculan las medias de horas de entrenamiento.
Interpretación. El centro de gravedad de los datos es el punto (5, 25), lo que indica que, en promedio, el atleta entrena 5 horas por semana y logra un tiempo de carrera de 25 minutos.
4.5 Covarianza
La covarianza fue desarrollada en el siglo XIX. La covarianza mide cómo dos variables cambian conjuntamente; es una base fundamental para el análisis de la correlación y la regresión en estadística. De manera más precisa, la covarianza es una medida que indica el grado en que dos variables cambian juntas. Si la covarianza es positiva, significa que cuando una variable aumenta, la otra también tiende a aumentar. Si es negativa, cuando una variable aumenta, la otra tiende a disminuir. Una covarianza cercana a cero indica que no hay una relación lineal clara entre las variables. Al entender que existe una relación positiva entre el tiempo de estudio y las calificaciones, un estudiante puede motivarse a dedicar más horas al estudio para mejorar su rendimiento académico. Fórmula:
Un ejemplo de aplicación es el siguiente: Relación entre horas de estudio y calificaciones. Un estudiante registra el número de horas que estudia y las calificaciones que obtiene en sus exámenes durante cinco semanas, conforme la siguiente tabla:
La covarianza calculada es de 12.5. Esto indica que hay una relación positiva entre las horas de estudio y las calificaciones del estudiante; esto es, cuando el estudiante dedica más horas al estudio, tiende a obtener mejores calificaciones.
¿Qué relación existe entre el tiempo que dedica a estudiar y sus calificaciones en diferentes materias?
16
Uniformes para un equipo de futbol
Características de la actividad
4.6 Distribución normal
La distribución normal originalmente se describió mediante la forma de la campana y fue popularizada por Carl Friedrich Gauss. Actualmente, se conoce como "curva de Gauss". La distribución normal es una forma de representar datos donde la mayoría de los valores se agrupan alrededor de un punto central (la media) y se dispersan simétricamente hacia los extremos. Esta gráfica tiene forma de campana y se usa para describir muchas variables naturales, como las alturas o las calificaciones. Las calificaciones de un examen estandarizado, por ejemplo, suelen seguir una distribución normal. Esto significa que la mayoría de los estudiantes obtienen calificaciones cercanas a la media, y menos estudiantes obtienen calificaciones extremadamente altas o bajas. Esto ayuda a los profesores a identificar el rendimiento general de la clase y a establecer curvas de calificación. Lo anterior, lo vamos a estudiar mediante un ejemplo: Un examen tiene una media de 75 puntos y una desviación estándar de 10 puntos. Suponiendo que las calificaciones se distribuyen normalmente, calcula la probabilidad de que un estudiante obtenga una calificación entre 65 y 85 puntos.
Procedimiento:
Solución. La probabilidad de que un estudiante obtenga una calificación entre 65 y 85 es aproximadamente 68.26%.
4.7 Clasificación de la probabilidad
La probabilidad comenzó a desarrollarse formalmente en el siglo XVII con matemáticos como Blaise Pascal y Pierre de Fermat, quienes estudiaron problemas relacionados con juegos de azar. La probabilidad mide la posibilidad de que ocurra un evento. Suele clasificarse en: exclusión, independencia y dependencia. 4.7.1 Eventos mutuamente excluyentes o disjuntos Dos eventos son mutuamente excluyentes si no pueden ocurrir al mismo tiempo. La clasificación de eventos en términos de exclusión, independencia y dependencia ha ayudado a entender mejor las situaciones de la vida real. Por ejemplo, al lanzar un dado, la probabilidad de obtener un 3 o un 5 es un ejemplo de eventos mutuamente excluyentes, ya que no se pueden obtener ambos resultados al mismo tiempo Ejemplo. Al lanzar un dado, ¿cuál es la probabilidad de obtener un 2 o un 5? Procedimiento: - Identificar eventos. Evento A: Obtener un 2. Evento B: Obtener un 5. Eventos excluyentes: No se pueden obtener ambos resultados a la vez.
Suma de probabilidades:
Solución. La probabilidad de obtener un 2 o un 5 es 1/3.
4.7.3 Eventos dependientes
4.7.2 Eventos independientes
Entender cómo las acciones anteriores pueden influir en las probabilidades futuras ha permito, en la actualidad, el estudio de eventos dependientes en campos como la genética y la economía: dos eventos son dependientes, si el resultado de uno afecta al resultado del otro. Sacar una carta de una baraja y luego sacar otra sin devolver la primera es un caso de eventos dependientes porque el resultado del primer evento afecta al segundo. Vamos a realizar un ejemplo: De una baraja de 52 cartas, ¿cuál es la probabilidad de sacar una carta de corazones y luego otra carta de corazones sin reemplazar la primera? Procedimiento. Probabilidad de la primera carta:
Los eventos independientes fueron definidos en el siglo XVIII. Este concepto fue crucial para el desarrollo de la teoría de la probabilidad y la estadística, ya que permitió el cálculo de probabilidades compuestas en situaciones donde los eventos no se afectan entre sí. Se define de la siguiente manera: dos eventos son independientes, si el resultado de uno no afecta al resultado del otro. El resultado de lanzar una moneda (cara o cruz) y un dado (cualquier número del uno al seis) son eventos independientes. El resultado de uno no afecta al otro. Ejemplo. ¿Cuál es la probabilidad de lanzar una moneda y obtener cara, y luego seleccionar una carta del mazo de cartas estándar y obtener un as? Procedimiento: Evento A. Hay una cara en una moneda de dos caras. La probabilidad es 1/2 o sea 0.5. Evento B. Hay cuatro ases en un mazo de 52 cartas. La probabilidad es 4/52, o sea 0.0769. Interpretación. El hecho de que exista más probabilidad en ganar jugando a un lanzamiento de moneda no implica que necesariamente ganarás en el siguiente juego de cartas.
4.7.3 Eventos dependientes
Ejemplo. En una clase, 10 estudiantes juegan baloncesto, 15 juegan fútbol, y 5 juegan ambos deportes. ¿Cuál es la probabilidad de que un estudiante seleccionado al azar juegue baloncesto o fútbol? Procedimiento. Eventos no excluyentes: Evento A: Juega baloncesto (10). Evento B: Juega fútbol (15). Ambos (intersección): 5. Uso de la fórmula de probabilidad no excluyente:
La probabilidad de sacar dos corazones consecutivos es 1/17. Razonamiento. Sacar una carta de corazones (hay 13 corazones en una baraja de 52 cartas) tiene una probabilidad de 1/4 es decir 0.25; luego, volver sacar otra sin devolver la primera (hay 12 corazones en una baraja de 51 cartas, en esta ocasión) tiene una probabilidad de 12/51 es decir 0.23. Por tanto, son eventos dependientes en el entendido de que el resultado del primer evento afecta al segundo.
4.7.4 Eventos no excluyentes entre sí
La idea de eventos no excluyentes ayuda a manejar situaciones donde hay superposición, como en análisis de datos demográficos y encuestas. Esto es útil para calcular probabilidades en situaciones donde hay superposición entre grupos. Dado que dos eventos son no excluyentes si pueden ocurrir al mismo tiempo, podemos entender que, en un grupo de estudiantes, algunos pueden jugar baloncesto y también futbol. Estos eventos no se excluyen mutuamente porque un estudiante puede participar en ambos deportes.
Solución. La probabilidad de que un estudiante juegue baloncesto o fútbol es 1.0 (o 100%, ya que todos juegan al menos uno de los deportes).
4.8 Estadística inferencial
Ejemplo. Eres el encargado de un departamento de producción en una fábrica y recibes un lote de 2000 piezas necesarias para la fabricación de un artículo. Tienes la responsabilidad de aceptar o rechazar el lote, si estimas que la calidad de este no es suficiente. El fabricante te asegura que en este lote no hay más de 100 piezas defectuosas, pero decides tomar una muestra para estimar su proporción: a) ¿Cuántas piezas decides examinar para que, con un nivel de confianza del 95%, el error que cometas en la estimación de la proporción poblacional de defectuosas no sea mayor que 0.05? Para determinar cuántas piezas debes examinar para que el error en la estimación de la proporción poblacional de piezas defectuosas no sea mayor que 0.05, con un nivel de confianza del 95%, usaremos la fórmula del tamaño de muestra para una proporción. Esta fórmula es:
La estadística inferencial tiene sus raíces en el siglo XVII, cuando matemáticos como Pierre-Simon Laplace y Thomas Bayes comenzaron a desarrollar métodos para hacer inferencias sobre poblaciones a partir de muestras. Sin embargo, fue en el siglo XX cuando Ronald A. Fisher y Jerzy Neyman establecieron formalmente las bases de la inferencia estadística, incluyendo el desarrollo de pruebas de hipótesis y la teoría de la estimación. Estos métodos se han convertido en herramientas fundamentales para la investigación científica y la toma de decisiones en diversas disciplinas. En la actualidad, la estadística inferencial es una rama de la estadística que utiliza una muestra de datos para hacer estimaciones o inferencias sobre una población más grande. Esto se logra mediante el uso de métodos como intervalos de confianza y pruebas de hipótesis. A partir de la información empírica proporcionada por una muestra, permite conocer cuál es el comportamiento de una determinada población con un riesgo de error medible en términos de probabilidad.
Donde: n= tamaño de la muestra Z= valor crítico de la distribución normal para el nivel de confianza deseado p= proporción estimada de la población (piezas defectuosas) E= error máximo permitido en la estimación
Paso 1. Determinación del valor crítico Z para un nivel de confianza del 95% En la distribución normal estándar, el valor crítico Z se utiliza para establecer los límites de un intervalo de confianza o para realizar pruebas de hipótesis con un nivel de confianza específico. El nivel de confianza representa la probabilidad de que la estimación obtenida se encuentre dentro del intervalo verdadero. Existen dos métodos principales para determinar el valor crítico Z para un nivel de confianza del 95%: 1. Utilizar una tabla de distribución normal estándar: las tablas de distribución normal estándar proporcionan valores de probabilidad acumulada (P(z)) para diferentes valores de z (desviaciones estándar de la media). Para un nivel de confianza del 95%, se debe buscar el valor de Z que corresponde a un área acumulada de 0.95. Pasos: -Buscar una tabla de distribución normal estándar: existen diversas tablas disponibles en libros de texto, software estadístico o páginas web especializadas. -Localizar la fila correspondiente al nivel de confianza del 95% (0.95). -Identificar el valor de Zzen la columna que representa el área acumulada más cercana a 0.95. Este valor será el valor crítico Z para un nivel de confianza del 95%. -El nivel de confianza del 95% corresponde a un valor crítico Z de aproximadamente 1.96.
- Estimar la proporción p El fabricante asegura que no hay más de 100 piezas defectuosas en un lote de 2000, lo que nos da una proporción estimada p:
Redondeamos al número entero más cercano, ya que no se puede examinar una fracción de una pieza. Solución: 73 piezas. Este ejemplo demuestra cómo usar la estadística inferencial para hacer estimaciones sobre una población a partir de una muestra, una habilidad esencial en muchas áreas, desde la investigación científica hasta la toma de decisiones en negocios.
-Determinar el error máximo permitido E. El error máximo permitido en la estimación es 0.05. -Sustituir los valores en la fórmula.
17
Actividad 17. ¡Hoy es mi día de buena suerte!
Características de la actividad
Conclusiones del módulo
Este capítulo ha sentado las bases para comprender y analizar datos de manera más profunda. Analizamos aspectos que dan validación a la información proveniente de fuentes científicas, aprendimos a distinguir temas relacionados con “la buena suerte” y reflexionamos sobre el papel social que pueden tener estos conocimientos. A medida que avancemos en nuestro estudio de la estadística, en grados superiores, desarrollaremos modelos más sofisticados para la toma de decisiones basadas en datos.
En este capítulo hemos explorado las herramientas fundamentales para describir y analizar conjuntos de datos. Desde las medidas de tendencia central, que nos permiten identificar el valor "típico" de un conjunto de datos, hasta las medidas de dispersión, que cuantifican cuán dispersos están los datos alrededor de ese valor central, hemos visto cómo la media, la mediana y la moda nos ofrecen diferentes perspectivas de los datos, y cómo las medidas de posición como cuartiles, deciles y percentiles nos permiten dividir los datos en grupos de igual tamaño. Además, hemos profundizado en la varianza y la desviación estándar, que son medidas clave para entender la dispersión de los datos. El diagrama de dispersión y la covarianza nos han permitido explorar la relación entre dos variables, mientras que la distribución normal, una de las distribuciones de probabilidad más importantes, nos ha proporcionado una herramienta poderosa para modelar fenómenos naturales y sociales. Finalmente, hemos introducido los conceptos básicos de la probabilidad, como eventos mutuamente excluyentes, independientes y dependientes, y hemos hecho una breve incursión en la estadística inferencial.
18
Actividad 18. Evaluación módulo III y IV
Características de la actividad
Referencias
BACHILLERATO UNIVERSITARIO (CBU) NMS PeriOdo 2024B