Want to create interactive content? It’s easy in Genially!
Menu interactivo
Cristian Salinas
Created on September 21, 2025
Start designing with a free template
Discover more than 1500 professional designs like these:
Transcript
Menu interactivo
Estadistica Multivariada (A)
Tutor: IQ. Óscar González González
Alumno: Cristian Gonzalez Salinas
Universidad Ciudadana de Nuevo
Leon
Igenieria en Desarrollo de Sofware
4to Tetramestre
Actividad 1
Índice
INTRODUCCION ................................................................................................... 3 Conceptos básicos de estadística multivariada....................................................... 4 Métodos multivariados clave y qué responden ........................................................ 5 Relación con la estadística inferencial .................................................................... 6 Ejemplos prácticos y correlacionales ..................................................................... 7 Contenido (Liga de Genially) .................................................................................. 8 CONCLUSION ....................................................................................................... 9 Bibliografía (Formato APA).................................................................................... 10
INTRODUCCION
La estadística multivariada estudia conjuntos de variables observadas simultáneamente para analizar relaciones, estructuras y patrones que no son visibles cuando se examina cada variable de forma aislada. Permite describir dependencias mediante matrices de covarianza y correlación, reducir dimensionalidad con técnicas como PCA, identificar factores latentes, agrupar observaciones y modelar múltiples respuestas de manera conjunta. Su vínculo con la estadística inferencial radica en que las decisiones y pruebas estadísticas deben considerar la covarianza entre variables: los contrastes multivariados (por ejemplo, Hotelling T2 o MANOVA) evalúan hipótesis sobre vectores de parámetros y reducen errores por pruebas múltiples, mientras que modelos multivariados estiman efectos y su incertidumbre en un espacio conjunto.
Conceptos básicos de estadística multivariada
Una variable es una magnitud medida por observación. Un vector de variables agrupa varias variables observadas por unidad de análisis, por ejemplo, X = (X_1,
Variable y vector de variables
X_2, \dots, X_p). Covarianza y correlación Covarianza entre X_i y X_j: [\mathrm{Cov}(X_i,X_j)=E[(X_i-\mu_i)(X_j-\mu_j)].] Correlación de Pearson entre X_i y X_j: [r_{ij}=\frac{\mathrm{Cov}(X_i,X_j)}{\sigma_i\sigma_j},] donde \sigma_i y \sigma_j son desviaciones estándar. El coeficiente r_{ij} varía
entre -1 y 1.
Matriz de covarianza y matriz de correlación
La matriz de covarianza \Sigma es la matriz p\times p con \Sigma_{ij}=\mathrm{Cov}(X_i,X_j). La matriz de correlación es la versión
estandarizada con elementos r_{ij}. Dimensionalidad y reducción de dimensión Técnicas como PCA reducen p variables a k
mayor parte de la varianza total. Dependencia y multicolinealidad Dependencia entre variables expresa asociación; multicolinealidad ocurre cuando predictores en un modelo son altamente correlacionados y afectan la estimación
de coeficientes. Vectores aleatorios y normalidad multivariante Un vector X sigue una normal multivariante si su distribución está caracterizada por media \mu y covarianza \Sigma. Muchos métodos asumen normalidad
multivariante o aproximada.
Métodos multivariados clave y qué responden
Responde cómo reducir dimensionalidad manteniendo varianza. Calcula autovalores y autovectores de \Sigma. El porcentaje de varianza explicada por la componente k es \lambda_k/\sum_{j}\lambda_j.
Análisis de Componentes Principales PCA
Identifica factores latentes que explican correlaciones observadas entre variables. Regresión múltiple y regresión multivariante Regresión múltiple modela una respuesta Y con varios predictores X. Regresión multivariante modela múltiples respuestas simultáneamente y considera
Análisis factorial
covarianza entre errores. MANOVA y pruebas multivariadas MANOVA compara vectores de medias entre grupos usando estadísticos como Pillai o Wilks para controlar correlación entre respuestas.
Agrupa observaciones en conjuntos homogéneos basados en múltiples variables.
Análisis de clusters
Busca combinaciones lineales de dos conjuntos de variables que maximicen la
Correlación canónica
correlación entre esas combinaciones.
Relación con la estadística inferencial
En lugar de probar hipótesis univariadas aisladas, la estadística multivariada permite contrastes sobre vectores de parámetros y matrices de covarianza para
Inferencia sobre vectores y estructuras
evitar errores tipo I por multiplicidad. Contrastes multivariados Pruebas como Hotelling T^2 y MANOVA realizan inferencias conjuntas sobre medias vectoriales y consideran estructura de covarianza entre variables.
Estimadores multivariados (medias vectoriales, matrices de covarianza, loadings) van acompañados de medidas de incertidumbre y, cuando proceda, intervalos de
Estimación y confiabilidad
confianza multivariados. Supuestos y consecuencias en la inferencia Supuestos típicos: independencia entre unidades, normalidad multivariante, homogeneidad de covarianzas entre grupos. Violaciones afectan validez de tests y requieren métodos robustos o no paramétricos.
La potencia de pruebas multivariadas depende de efecto conjunto, correlación entre variables y tamaño muestral; variables altamente correlacionadas pueden reducir la información útil si no se corrige la dimensionalidad.
Potencia y tamaño muestral
Ejemplos prácticos y correlacionales
1. PCA con variables correlacionadas Contexto: cuatro indicadores económicos X_1\dots X_4 con r_{12}=0.8. Procedimiento: calcular \Sigma, obtener autovalores
\lambda_1,\lambda_2,\dots y observar que \lambda_1 explica la mayor varianza. Interpretación: alta correlación entre X_1 y X_2 lleva a que PC1 represente la «dimensión económica común» y permita resumir datos sin perder información relevante
2. Regresión múltiple con multicolinealidad
Contexto: predecir rendimiento Y con horas estudio X_1, asistencia X_2 y ansiedad X_3; r_{12}=0.85. Diagnóstico: calcular VIF; VIF alto para X_1 o X_2 indica inestabilidad en
coeficientes. Solución: eliminar o combinar variables correlacionadas, usar PCA como
predictores, o regularización (Ridge). 3. MANOVA para respuestas correlacionadas Contexto: comparar dos tratamientos A y B sobre presión sistólica Y_1 y
Procedimiento: realizar MANOVA y revisar estadísticos multivariados; si Pillai significativo, concluir efecto conjunto del tratamiento sobre Y_1 y Y_2. Interpretación: aunque tests univariados puedan fallar, la prueba multivariada detecta cambios en la estructura conjunta de las respuestas.
Contenido (Liga de Genially)
CONCLUSION
Usar enfoques multivariados en análisis estadístico mejora la validez y la potencia inferencial cuando las variables están correlacionadas, porque integran información conjunta y controlan la estructura de covarianza. Elegir correctamente entre métodos (reducción de dimensión, regresión multivariante, MANOVA, correlación canónica, clustering) y comprobar supuestos como normalidad multivariante e igualdad de covarianzas son pasos esenciales para obtener conclusiones robustas. En presencia de multicolinealidad o violaciones de supuestos, aplicar reducción de dimensión, regularización o métodos robustos preserva la interpretabilidad y la capacidad inferencial del análisis.
Bibliografía (Formato APA)
Gomila, J. G. (2019). Curso avanzado de estadística multivariante con R y Python [Video]. YouTube. https://www.youtube.com/watch?v=DxbnZRqM1dA Joanby. (s. f.). Curso de estadística multivariante con R y Python [Repositorio]. GitHub. https://github.com/joanby/curso-estadistica-multivariante Curso/Guía práctica: Estadística práctica para ciencia de datos con R y Python. (s. f.). StudyLib. https://studylib.es/doc/9484941/estadi%CC%81stica-pra%CC%81ctica-para-ciencia-de-datos-con-r-y-pyth...
Cristian_Gonzales_Salinas_ACT1_IDS_Estadistica_Multivariada