Estadística multivariada
Y su relación con la estadística inferencial César Jared Jacobo Puebla Estadística Multivariada A Universidad Ciudadana de Nuevo León
Empezar
Objetivos
Analizar los conceptos básicos de estadística multivariada y su relación con la estadística inferencial.
- Conocer sus conceptos clave
- Ver la estadística inferencial en el contexto multivariado.
- Relacionar ambos tipos de estadística
Estadística multivariada
La estadística multivariada es una rama de la estadística que se ocupa del análisis de datos en los que se miden dos o más variables en cada individuo, objeto o unidad de observación. En lugar de estudiar cada variable por separado (como en estadística descriptiva o inferencial univariada), se centra en cómo las variables se relacionan entre sí y en cómo, en conjunto, describen y explican los fenómenos observados.
La estadística multivariada se centra en cómo las variables se relacionan entre sí.
Visualización de datos multivariados
Conceptos clave
Definición / Idea central
Parámetros y estadísticos asociados
Datos multivariados
Definición / Idea central
Definición / Idea central
Distancias
Técnicas multivariadas
Definición / Idea central
Definición / Idea central
Variable aleatoria multidimensional
Datos faltantes
Definición / Idea central
Definición / Idea central
Estadística inferencial en el contexto multivariado
- Estimación de vectores de medias multivariadas: cómo estimar el vector de medias poblacionales, propiedades del estimador, distribución muestral.
- Inferencia sobre la matriz de covarianza (o varianza-covarianza): estimadores, pruebas para ver si la covarianza tiene ciertas estructuras, comparaciones entre covarianzas de diferentes poblaciones.
- Pruebas de hipótesis multivariadas: contrastar si dos grupos tienen el mismo vector de medias, o si una población tiene una matriz de covarianza específica, etc. (aunque los detalles técnicos vendrán en capítulos posteriores).
Cómo se relacionan estadística multivariada e inferencial
Técnicas compartidas
Extensión de conceptos
Modelado
¡Gracias por su atención!
Técnicas compartidas
Muchas técnicas multivariadas dependen de la inferencia porque usan estimaciones de parámetros poblacionales (media, covarianza), necesitan pruebas de hipótesis sobre esos parámetros, validaciones, comparación de modelos, etc.
Extensión de conceptos
La estadística multivariada extiende muchos de los conceptos de la inferencia univariada al caso de múltiples variables: estimadores vectoriales, matrices en lugar de varianzas, distribuciones conjuntas, etc.
Definición
Cuando para cada individuo u objeto se registran varias variables simultáneamente. Se puede considerar una matriz de datos 𝑋 de tamaño 𝑛 × 𝑝 (n objetos, p variables).
Relación con estadística inferencial
Permite modelar relaciones, dependencias y estructuras entre variables; facilita hacer inferencias sobre vectores de parámetros multivariados (por ejemplo medias multivariadas, matrices de covarianza) en lugar de parámetros univariados.
Definición
- Distancia Euclidiana: medida de similitud/similitud directa usando unidades originales. - Distancia de Mahalanobis: corrige por varianza y covarianza entre variables, mide cuán lejos está un punto del centro, tomando en cuenta la dispersión de los datos
Relación con estadística inferencial
En inferencia sirve para detectar valores atípicos, para clasificación (discriminante), para definir regiones de aceptación/rechazo en pruebas multivariadas, etc.
Modelado
Implica modelar la probabilidad conjunta de varias variables, considerar covarianzas, correlaciones, dependencia entre variables; esto complica la inferencia: necesidad de supuestos más fuertes (por ejemplo normal multivariable), de tamaños de muestra más grandes, de métodos de estimación más generales.
Definición
Se clasifican varias técnicas según su objetivo: métodos de dependencia (por ejemplo regresión, análisis discriminante), métodos de interdependencia (por ejemplo componentes principales, análisis factorial), clasificación, reducción de dimensión, etc.
Relación con estadística inferencial
Cada técnica requiere de inferencia para estimar parámetros, hacer pruebas de hipótesis multivariadas, validación de modelos, etc. Por ejemplo, decidir cuántos factores comunes usar, o si grupos difieren en vectores de medias.
Definición
Situaciones donde algunas entradas de la matriz de datos están vacías. Se analiza su distribución, si son aleatorios o siguen algún patrón, y se discuten técnicas de imputación o de omisión de observaciones incompletas.
Relación con estadística inferencial
Para inferencia, los datos faltantes pueden sesgar estimaciones, reducir poder estadístico, afectar la validez de pruebas. Se precisa tratarlos adecuadamente.
Definición
Un vector 𝑋=(𝑋1, 𝑋2, …, 𝑋𝑝)′ cuyas componentes son variables aleatorias. Tiene una distribución conjunta, parámetros de localización (media vectorial), matriz de varianzas-covarianzas, etc.
Relación con estadística inferencial
Los parámetros multivariados (media vectorial, matriz de covarianzas) son objeto de estimación; pruebas como de hipótesis multivariadas sobre vectores de medias, etc.
Definición
Diagramas múltiples: perfiles de individuos, dispersogramas por pares de variables, etc. Estas representaciones ayudan a explorar la estructura de los datos.
Relación con estadística inferencial
Aunque descriptiva, la exploración visual ayuda a identificar supuestos para inferencia (normalidad, linearidad, homogeneidad, presencia de outliers), elegir técnicas adecuadas, decidir transformaciones.
Definición
Media vectorial 𝜇=𝐸(𝑋), matriz de varianzas-covarianzas Σ= Var(𝑋) = 𝐸[(𝑋−𝜇)(𝑋−𝜇)′]. También covarianzas entre pares de variables.
Relación con estadística inferencial
En inferencia se usan estimadores de estos parámetros, construir intervalos de confianza, pruebas de hipótesis, etc.
Estadística multivariada
CESAR JARED JACOBO PUEBLA
Created on September 22, 2025
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Neodigital CPD Course
View
Minimal Course
View
Basic Interactive Course
View
Laws and Regulations Course
Explore all templates
Transcript
Estadística multivariada
Y su relación con la estadística inferencial César Jared Jacobo Puebla Estadística Multivariada A Universidad Ciudadana de Nuevo León
Empezar
Objetivos
Analizar los conceptos básicos de estadística multivariada y su relación con la estadística inferencial.
Estadística multivariada
La estadística multivariada es una rama de la estadística que se ocupa del análisis de datos en los que se miden dos o más variables en cada individuo, objeto o unidad de observación. En lugar de estudiar cada variable por separado (como en estadística descriptiva o inferencial univariada), se centra en cómo las variables se relacionan entre sí y en cómo, en conjunto, describen y explican los fenómenos observados.
La estadística multivariada se centra en cómo las variables se relacionan entre sí.
Visualización de datos multivariados
Conceptos clave
Definición / Idea central
Parámetros y estadísticos asociados
Datos multivariados
Definición / Idea central
Definición / Idea central
Distancias
Técnicas multivariadas
Definición / Idea central
Definición / Idea central
Variable aleatoria multidimensional
Datos faltantes
Definición / Idea central
Definición / Idea central
Estadística inferencial en el contexto multivariado
Cómo se relacionan estadística multivariada e inferencial
Técnicas compartidas
Extensión de conceptos
Modelado
¡Gracias por su atención!
Técnicas compartidas
Muchas técnicas multivariadas dependen de la inferencia porque usan estimaciones de parámetros poblacionales (media, covarianza), necesitan pruebas de hipótesis sobre esos parámetros, validaciones, comparación de modelos, etc.
Extensión de conceptos
La estadística multivariada extiende muchos de los conceptos de la inferencia univariada al caso de múltiples variables: estimadores vectoriales, matrices en lugar de varianzas, distribuciones conjuntas, etc.
Definición
Cuando para cada individuo u objeto se registran varias variables simultáneamente. Se puede considerar una matriz de datos 𝑋 de tamaño 𝑛 × 𝑝 (n objetos, p variables).
Relación con estadística inferencial
Permite modelar relaciones, dependencias y estructuras entre variables; facilita hacer inferencias sobre vectores de parámetros multivariados (por ejemplo medias multivariadas, matrices de covarianza) en lugar de parámetros univariados.
Definición
- Distancia Euclidiana: medida de similitud/similitud directa usando unidades originales. - Distancia de Mahalanobis: corrige por varianza y covarianza entre variables, mide cuán lejos está un punto del centro, tomando en cuenta la dispersión de los datos
Relación con estadística inferencial
En inferencia sirve para detectar valores atípicos, para clasificación (discriminante), para definir regiones de aceptación/rechazo en pruebas multivariadas, etc.
Modelado
Implica modelar la probabilidad conjunta de varias variables, considerar covarianzas, correlaciones, dependencia entre variables; esto complica la inferencia: necesidad de supuestos más fuertes (por ejemplo normal multivariable), de tamaños de muestra más grandes, de métodos de estimación más generales.
Definición
Se clasifican varias técnicas según su objetivo: métodos de dependencia (por ejemplo regresión, análisis discriminante), métodos de interdependencia (por ejemplo componentes principales, análisis factorial), clasificación, reducción de dimensión, etc.
Relación con estadística inferencial
Cada técnica requiere de inferencia para estimar parámetros, hacer pruebas de hipótesis multivariadas, validación de modelos, etc. Por ejemplo, decidir cuántos factores comunes usar, o si grupos difieren en vectores de medias.
Definición
Situaciones donde algunas entradas de la matriz de datos están vacías. Se analiza su distribución, si son aleatorios o siguen algún patrón, y se discuten técnicas de imputación o de omisión de observaciones incompletas.
Relación con estadística inferencial
Para inferencia, los datos faltantes pueden sesgar estimaciones, reducir poder estadístico, afectar la validez de pruebas. Se precisa tratarlos adecuadamente.
Definición
Un vector 𝑋=(𝑋1, 𝑋2, …, 𝑋𝑝)′ cuyas componentes son variables aleatorias. Tiene una distribución conjunta, parámetros de localización (media vectorial), matriz de varianzas-covarianzas, etc.
Relación con estadística inferencial
Los parámetros multivariados (media vectorial, matriz de covarianzas) son objeto de estimación; pruebas como de hipótesis multivariadas sobre vectores de medias, etc.
Definición
Diagramas múltiples: perfiles de individuos, dispersogramas por pares de variables, etc. Estas representaciones ayudan a explorar la estructura de los datos.
Relación con estadística inferencial
Aunque descriptiva, la exploración visual ayuda a identificar supuestos para inferencia (normalidad, linearidad, homogeneidad, presencia de outliers), elegir técnicas adecuadas, decidir transformaciones.
Definición
Media vectorial 𝜇=𝐸(𝑋), matriz de varianzas-covarianzas Σ= Var(𝑋) = 𝐸[(𝑋−𝜇)(𝑋−𝜇)′]. También covarianzas entre pares de variables.
Relación con estadística inferencial
En inferencia se usan estimadores de estos parámetros, construir intervalos de confianza, pruebas de hipótesis, etc.