Want to create interactive content? It’s easy in Genially!

Get started free

Estadística multivariada

CESAR JARED JACOBO PUEBLA

Created on September 22, 2025

Start designing with a free template

Discover more than 1500 professional designs like these:

Transcript

Estadística multivariada

Y su relación con la estadística inferencial César Jared Jacobo Puebla Estadística Multivariada A Universidad Ciudadana de Nuevo León

Empezar

Objetivos

Analizar los conceptos básicos de estadística multivariada y su relación con la estadística inferencial.

  • Conocer sus conceptos clave
  • Ver la estadística inferencial en el contexto multivariado.
  • Relacionar ambos tipos de estadística

Estadística multivariada

La estadística multivariada es una rama de la estadística que se ocupa del análisis de datos en los que se miden dos o más variables en cada individuo, objeto o unidad de observación. En lugar de estudiar cada variable por separado (como en estadística descriptiva o inferencial univariada), se centra en cómo las variables se relacionan entre sí y en cómo, en conjunto, describen y explican los fenómenos observados.

La estadística multivariada se centra en cómo las variables se relacionan entre sí.

Visualización de datos multivariados

Conceptos clave

Definición / Idea central

Parámetros y estadísticos asociados

Datos multivariados

Definición / Idea central
Definición / Idea central

Distancias

Técnicas multivariadas

Definición / Idea central
Definición / Idea central

Variable aleatoria multidimensional

Datos faltantes

Definición / Idea central
Definición / Idea central

Estadística inferencial en el contexto multivariado

  • Estimación de vectores de medias multivariadas: cómo estimar el vector de medias poblacionales, propiedades del estimador, distribución muestral.
  • Inferencia sobre la matriz de covarianza (o varianza-covarianza): estimadores, pruebas para ver si la covarianza tiene ciertas estructuras, comparaciones entre covarianzas de diferentes poblaciones.
  • Pruebas de hipótesis multivariadas: contrastar si dos grupos tienen el mismo vector de medias, o si una población tiene una matriz de covarianza específica, etc. (aunque los detalles técnicos vendrán en capítulos posteriores).

Cómo se relacionan estadística multivariada e inferencial

Técnicas compartidas

Extensión de conceptos

Modelado

¡Gracias por su atención!

Técnicas compartidas

Muchas técnicas multivariadas dependen de la inferencia porque usan estimaciones de parámetros poblacionales (media, covarianza), necesitan pruebas de hipótesis sobre esos parámetros, validaciones, comparación de modelos, etc.

Extensión de conceptos

La estadística multivariada extiende muchos de los conceptos de la inferencia univariada al caso de múltiples variables: estimadores vectoriales, matrices en lugar de varianzas, distribuciones conjuntas, etc.

Definición

Cuando para cada individuo u objeto se registran varias variables simultáneamente. Se puede considerar una matriz de datos 𝑋 de tamaño 𝑛 × 𝑝 (n objetos, p variables).

Relación con estadística inferencial

Permite modelar relaciones, dependencias y estructuras entre variables; facilita hacer inferencias sobre vectores de parámetros multivariados (por ejemplo medias multivariadas, matrices de covarianza) en lugar de parámetros univariados.

Definición

- Distancia Euclidiana: medida de similitud/similitud directa usando unidades originales.   - Distancia de Mahalanobis: corrige por varianza y covarianza entre variables, mide cuán lejos está un punto del centro, tomando en cuenta la dispersión de los datos

Relación con estadística inferencial

En inferencia sirve para detectar valores atípicos, para clasificación (discriminante), para definir regiones de aceptación/rechazo en pruebas multivariadas, etc.

Modelado

Implica modelar la probabilidad conjunta de varias variables, considerar covarianzas, correlaciones, dependencia entre variables; esto complica la inferencia: necesidad de supuestos más fuertes (por ejemplo normal multivariable), de tamaños de muestra más grandes, de métodos de estimación más generales.

Definición

Se clasifican varias técnicas según su objetivo: métodos de dependencia (por ejemplo regresión, análisis discriminante), métodos de interdependencia (por ejemplo componentes principales, análisis factorial), clasificación, reducción de dimensión, etc.

Relación con estadística inferencial

Cada técnica requiere de inferencia para estimar parámetros, hacer pruebas de hipótesis multivariadas, validación de modelos, etc. Por ejemplo, decidir cuántos factores comunes usar, o si grupos difieren en vectores de medias.

Definición

Situaciones donde algunas entradas de la matriz de datos están vacías. Se analiza su distribución, si son aleatorios o siguen algún patrón, y se discuten técnicas de imputación o de omisión de observaciones incompletas.

Relación con estadística inferencial

Para inferencia, los datos faltantes pueden sesgar estimaciones, reducir poder estadístico, afectar la validez de pruebas. Se precisa tratarlos adecuadamente.

Definición

Un vector 𝑋=(𝑋1, 𝑋2, …, 𝑋𝑝)′ cuyas componentes son variables aleatorias. Tiene una distribución conjunta, parámetros de localización (media vectorial), matriz de varianzas-covarianzas, etc.

Relación con estadística inferencial

Los parámetros multivariados (media vectorial, matriz de covarianzas) son objeto de estimación; pruebas como de hipótesis multivariadas sobre vectores de medias, etc.

Definición

Diagramas múltiples: perfiles de individuos, dispersogramas por pares de variables, etc. Estas representaciones ayudan a explorar la estructura de los datos.

Relación con estadística inferencial

Aunque descriptiva, la exploración visual ayuda a identificar supuestos para inferencia (normalidad, linearidad, homogeneidad, presencia de outliers), elegir técnicas adecuadas, decidir transformaciones.

Definición

Media vectorial 𝜇=𝐸(𝑋), matriz de varianzas-covarianzas Σ= Var(𝑋) = 𝐸[(𝑋−𝜇)(𝑋−𝜇)′]. También covarianzas entre pares de variables.

Relación con estadística inferencial

En inferencia se usan estimadores de estos parámetros, construir intervalos de confianza, pruebas de hipótesis, etc.