Análisis de componentes
principales
Introducción
¡Te doy la bienvenida!
Estás por conocer los pasos para realizar un análisis de componentes principales empleando Python con precisión y coherencia.
¡Adelante!
fundamentos
y motivación
Análisis de componentes principales
Ha llegado el momento de iniciar con la Lección.
Para ello, conviene retomar el concepto de análisis de componentes principales.
Utilidad del PCA
El PCA suele formar parte del análisis exploratorio de datos, de ahí que conozcas su utilidad en estos procesos.
Lectura y escritura de datos tabulares
Dentro del PCA se vuelve necesario considerar que…
El PCA permite encontrar una representación 2-dimensional de un conjunto de datos, de forma que captura la mayor variabilidad posible.
La idea es que cada una de las observaciones vive en un espacio de p dimensiones, pero no todas las componentes son igual de interesantes.
El PCA busca una dimensión pequeña que resulte tan interesante como sea posible; aquí el concepto de interesante se mide como la variación de dichas observaciones a lo largo de cada dimensión.
¿Cómo encontrar las componentes principales?
A partir de este momento es fundamental que pongas atención en cada paso y cálculo para encontrar la primera y segunda componente principal.
Tip Toma nota de lo que representa cada elemento de la fórmula para que logres más tarde realizar tus cálculos con facilidad.
Análisis de componentes principales
Considera un dataset con n observaciones y p variables X1, X2,...,, Xp donde cada variable ha sido centrada para tener media cero.
Pulsa los botones para conocer el resto del proceso.
Paso 2
Paso 1
Primera componente principal
Después de revisar detalladamente los elementos de los pasos 1 y 2, considera lo siguiente:
El vector es la primera componente principal.
Los números son llamados puntuaciones de la primera componente principal.
El vector de cargas es de la primera componente principal.
Los números son las cargas de la primera componente principal.
Segunda componente principal
Ahora te presento el proceso para determinar la segunda componente principal.
Pulsa los botones para conocer el resto del proceso.
Paso 2
Paso 1
Primera componente principal
Después de revisar detalladamente los elementos de los pasos 1 y 2, considera lo siguiente:
El vector es la primera componente principal.
Los números son llamados puntuaciones de la segunda componente principal.
El vector de cargas es de la segunda componente principal.
Los números son las cargas de la segunda componente principal.
Más sobre el PCA
Recapitula los temas abordados en esta sección a través del siguiente video.
Video
Autora: Rocío Chávez Ciencia de Datos
Título: ¿Qué es el Análisis de Componentes Principales (PCA)?
Más sobre el PCA
De igual manera, consulta el Enlace para ahondar en los conceptos que sustentan el análisis de componentes principales (PCA). Los aspectos más relevantes del álgebra lineal que se utilizan en dicho capítulo se desarrollan en las páginas 13-42 .
Enlace
Autor: Daniel Peña
Título: Análisis de datos multivariantes Páginas: 13-42
Procesamiento y
escalado
Escalamiento y PCA
Cuando realices un PCA centra cada una de las variables, puesto que sólo tienes interés en medir la varianza en las observaciones. Así, antes de realizar el PCA comienza restando la media muestral de la variable X a cada una de las observaciones obtenidas para esta misma variable (Pedregosa, et al., 2020).
Pulsa los botones para reconocer la importancia de este procedimiento.
Variables y varianza
Escalamiento de variables
Cálculo y selección de
componentes
Cálculo y selección de componentes
A continuación, te muestro el paso a paso para calcular los componentes principales:
Pulsa cada número para aplicar los cálculos.
Cálculo y selección de componentes
Partiendo de lo anterior, revisa las expresiones matemáticas:
Cálculo y selección de componentes
En general, una matriz X de tamaño n x p tiene a lo más: min{n - 1, p} componentes principales distintas.
Tip
No todas las componentes principales son de interés, sino que se busca visualizar o interpretar los datos con la menor cantidad de ellas.
Cálculo y selección de componentes
Para determinar el número de componentes principales, típicamente se inspecciona un gráfico de sedimentación (como el que te muestro en la Figura 1). En el cual se busca un punto de inflexión (conocido como codo) a partir del cual la varianza explicada por cada componente principal subsecuente decae.
Interpretación y visualización
de datos
Interpretación y visualización de datos
Te invito a consultar el siguiente video para que puedas visualizar gráficamente cómo se representan las componentes principales.
Video
Autora: Nayeli González Novelo
Título: Interpretación y visualización de resultados
PCA en
Python
PCA en Python
Después de haber leído los aspectos más relevantes del PCA, te recomiendo los siguientes recursos que muestran cómo realizar un PCA en Python con la ayuda de la librería Scikit-learn.
Video Autor: Minuteman
Título: Principal Component Analysis (PCA) in Python
Enlace
Autor: Joaquín Amat Rodrigo
Título: PCA con Python. Ciencia de Datos Sección: Ejemplos PCA
Conclusión
Finalmente, el objetivo de esta Lección fue presentarte de manera detallada el método de componentes principales, por lo que identificaste los pasos claves para realizarlo en Python a través de la librería Scikitlearn.
Recuerda consultar todos los recursos que se te recomendaron a lo largo de esta Lección, ya que al ser un tema que involucra ciertos cálculos, requiere de más tiempo de estudio.
¡Felicidades!
Has concluido con
la Lección
James, G., Witten, D., Hastie, T. & Tibshirani, R. (2023). An Introduction to Statistical Learning: with Applications in Python (Springer Texts in Statistics). Springer Cham. https://doi.org/10.1007/978-3-031-38747-0
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … Duchesnay, É. (2020). Principal component analysis (PCA). Scikit-learn documentation. https://scikit-learn.org/stable/modules/decomposition.html#pca
Bibliografía
Abdi, H., & Williams, L. J. (2010). Principal component analysis. Wiley Interdisciplinary Reviews: Computational Statistics, 2(4). https://doi.org/10.1002/wics.101
Amat Rodrigo, J. (2025). PCA con Python. Cienciadedatos.net. https://cienciadedatos.net/documentos/py19-pca-python Gabriel, K. R. (1971). The biplot graphic display of matrices with application to principal component analysis. Biometrika, 58(3). https://doi.org/10.1093/biomet/58.3.453
Jolliffe, I. T., & Cadima, J. (2016). Principal component analysis: A review and recent developments. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 374(2065). https://doi.org/10.1098/rsta.2015.0202Minuteman. (2020). Principal Component Analysis (PCA) in Python [Video]. Youtube. https://www.youtube.com/watch?v=-0GvjcQ3VyA
Rocio Chavez Ciencia de Datos. (2023). Que es el Analisis de Componentes Principales (PCA) #shorts [Video]. Youtube. https://www.youtube.com/watch?v=CYHbSNmRJ08
Concepto clave
El análisis de componentes principales (PCA por sus siglas en inglés) es un método de aprendizaje no supervisado; es decir, analiza un conjunto de características X1, X2,..., Xp pero no considera una respuesta Y (contrario a los métodos supervisados como la regresión) (James et al., 2023).
Variables y varianza
Cuando el dataset analizado cuenta con variables escaladas por factores diferentes (por ejemplo, las ganancias representadas en millones de pesos y los precios en miles de pesos) el resultado del PCA puede verse afectado, pues la medición de la varianza podría arrojar una cantidad mayor al utilizar un factor mayor y una cantidad menor en caso contrario.
De lo anterior, la proporción de varianza explicada por la m-ésima componente principal se representa como:
La varianza total del dataset se expresa como:
La varianza explicada por la m-ésima componente principal está dada por:
Autora: Nayeli del Carmen González Novelo © UVEG. Derechos reservados. El contenido de este formato está sujeto a las disposiciones aplicables en materia de Propiedad Intelectual, por lo que no puede ser distribuido, ni transmitido, parcial o totalmente mediante cualquier medio, método o sistema impreso, electrónico o magnético, incluyendo el fotocopiado, la fotografía o la grabación, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. Este material propiedad de UVEG, integra aportes asistidos tecnológicamente (como IA, entre otros), los cuales fueron revisados y validados por el equipo UVEG, conforme a las disposiciones vigentes aplicables. Los recursos visuales y/o audiovisuales fueron tomados total y/o parcialmente de Freepik.
Figura 1. Gráfico de sedimentación.
Método para producir variables derivadas para usarlas posteriormente en problemas de aprendizaje supervisado.
Parte del procedimiento de imputación de datos (llenar valores faltantes).
Escalamiento de variables
Por esta razón, resulta necesario escalar todas las variables por el mismo factor antes de realizar el PCA. Típicamente, se escalan las variables de tal modo que cada una posea una desviación estándar muestral igual a 1. Un caso especial surge cuando cada una de las variables se encuentran representadas en exactamente las mismas unidades; en este escenario no se realiza el escalamiento.
Herramienta de visualización de las variables.
ADP_L10
Producción UVEG
Created on March 12, 2026
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Video: Responsible Use of Social Media and Internet
View
Mothers Days Card
View
Momentum: First Operational Steps
View
Momentum: Employee Introduction Presentation
View
Mind Map: The 4 Pillars of Success
View
Big Data: The Data That Drives the World
View
Momentum: Onboarding Presentation
Explore all templates
Transcript
Análisis de componentes
principales
Introducción
¡Te doy la bienvenida! Estás por conocer los pasos para realizar un análisis de componentes principales empleando Python con precisión y coherencia. ¡Adelante!
fundamentos
y motivación
Análisis de componentes principales
Ha llegado el momento de iniciar con la Lección. Para ello, conviene retomar el concepto de análisis de componentes principales.
Utilidad del PCA
El PCA suele formar parte del análisis exploratorio de datos, de ahí que conozcas su utilidad en estos procesos.
Lectura y escritura de datos tabulares
Dentro del PCA se vuelve necesario considerar que…
El PCA permite encontrar una representación 2-dimensional de un conjunto de datos, de forma que captura la mayor variabilidad posible.
La idea es que cada una de las observaciones vive en un espacio de p dimensiones, pero no todas las componentes son igual de interesantes.
El PCA busca una dimensión pequeña que resulte tan interesante como sea posible; aquí el concepto de interesante se mide como la variación de dichas observaciones a lo largo de cada dimensión.
¿Cómo encontrar las componentes principales?
A partir de este momento es fundamental que pongas atención en cada paso y cálculo para encontrar la primera y segunda componente principal.
Tip Toma nota de lo que representa cada elemento de la fórmula para que logres más tarde realizar tus cálculos con facilidad.
Análisis de componentes principales
Considera un dataset con n observaciones y p variables X1, X2,...,, Xp donde cada variable ha sido centrada para tener media cero.
Pulsa los botones para conocer el resto del proceso.
Paso 2
Paso 1
Primera componente principal
Después de revisar detalladamente los elementos de los pasos 1 y 2, considera lo siguiente:
El vector es la primera componente principal.
Los números son llamados puntuaciones de la primera componente principal.
El vector de cargas es de la primera componente principal.
Los números son las cargas de la primera componente principal.
Segunda componente principal
Ahora te presento el proceso para determinar la segunda componente principal.
Pulsa los botones para conocer el resto del proceso.
Paso 2
Paso 1
Primera componente principal
Después de revisar detalladamente los elementos de los pasos 1 y 2, considera lo siguiente:
El vector es la primera componente principal.
Los números son llamados puntuaciones de la segunda componente principal.
El vector de cargas es de la segunda componente principal.
Los números son las cargas de la segunda componente principal.
Más sobre el PCA
Recapitula los temas abordados en esta sección a través del siguiente video.
Video Autora: Rocío Chávez Ciencia de Datos Título: ¿Qué es el Análisis de Componentes Principales (PCA)?
Más sobre el PCA
De igual manera, consulta el Enlace para ahondar en los conceptos que sustentan el análisis de componentes principales (PCA). Los aspectos más relevantes del álgebra lineal que se utilizan en dicho capítulo se desarrollan en las páginas 13-42 .
Enlace Autor: Daniel Peña Título: Análisis de datos multivariantes Páginas: 13-42
Procesamiento y
escalado
Escalamiento y PCA
Cuando realices un PCA centra cada una de las variables, puesto que sólo tienes interés en medir la varianza en las observaciones. Así, antes de realizar el PCA comienza restando la media muestral de la variable X a cada una de las observaciones obtenidas para esta misma variable (Pedregosa, et al., 2020).
Pulsa los botones para reconocer la importancia de este procedimiento.
Variables y varianza
Escalamiento de variables
Cálculo y selección de
componentes
Cálculo y selección de componentes
A continuación, te muestro el paso a paso para calcular los componentes principales:
Pulsa cada número para aplicar los cálculos.
Cálculo y selección de componentes
Partiendo de lo anterior, revisa las expresiones matemáticas:
Cálculo y selección de componentes
En general, una matriz X de tamaño n x p tiene a lo más: min{n - 1, p} componentes principales distintas.
Tip No todas las componentes principales son de interés, sino que se busca visualizar o interpretar los datos con la menor cantidad de ellas.
Cálculo y selección de componentes
Para determinar el número de componentes principales, típicamente se inspecciona un gráfico de sedimentación (como el que te muestro en la Figura 1). En el cual se busca un punto de inflexión (conocido como codo) a partir del cual la varianza explicada por cada componente principal subsecuente decae.
Interpretación y visualización
de datos
Interpretación y visualización de datos
Te invito a consultar el siguiente video para que puedas visualizar gráficamente cómo se representan las componentes principales.
Video Autora: Nayeli González Novelo Título: Interpretación y visualización de resultados
PCA en
Python
PCA en Python
Después de haber leído los aspectos más relevantes del PCA, te recomiendo los siguientes recursos que muestran cómo realizar un PCA en Python con la ayuda de la librería Scikit-learn.
Video Autor: Minuteman Título: Principal Component Analysis (PCA) in Python
Enlace Autor: Joaquín Amat Rodrigo Título: PCA con Python. Ciencia de Datos Sección: Ejemplos PCA
Conclusión
Finalmente, el objetivo de esta Lección fue presentarte de manera detallada el método de componentes principales, por lo que identificaste los pasos claves para realizarlo en Python a través de la librería Scikitlearn. Recuerda consultar todos los recursos que se te recomendaron a lo largo de esta Lección, ya que al ser un tema que involucra ciertos cálculos, requiere de más tiempo de estudio.
¡Felicidades!
Has concluido con
la Lección
James, G., Witten, D., Hastie, T. & Tibshirani, R. (2023). An Introduction to Statistical Learning: with Applications in Python (Springer Texts in Statistics). Springer Cham. https://doi.org/10.1007/978-3-031-38747-0 Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … Duchesnay, É. (2020). Principal component analysis (PCA). Scikit-learn documentation. https://scikit-learn.org/stable/modules/decomposition.html#pca Bibliografía Abdi, H., & Williams, L. J. (2010). Principal component analysis. Wiley Interdisciplinary Reviews: Computational Statistics, 2(4). https://doi.org/10.1002/wics.101 Amat Rodrigo, J. (2025). PCA con Python. Cienciadedatos.net. https://cienciadedatos.net/documentos/py19-pca-python Gabriel, K. R. (1971). The biplot graphic display of matrices with application to principal component analysis. Biometrika, 58(3). https://doi.org/10.1093/biomet/58.3.453 Jolliffe, I. T., & Cadima, J. (2016). Principal component analysis: A review and recent developments. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 374(2065). https://doi.org/10.1098/rsta.2015.0202Minuteman. (2020). Principal Component Analysis (PCA) in Python [Video]. Youtube. https://www.youtube.com/watch?v=-0GvjcQ3VyA Rocio Chavez Ciencia de Datos. (2023). Que es el Analisis de Componentes Principales (PCA) #shorts [Video]. Youtube. https://www.youtube.com/watch?v=CYHbSNmRJ08
Concepto clave El análisis de componentes principales (PCA por sus siglas en inglés) es un método de aprendizaje no supervisado; es decir, analiza un conjunto de características X1, X2,..., Xp pero no considera una respuesta Y (contrario a los métodos supervisados como la regresión) (James et al., 2023).
Variables y varianza Cuando el dataset analizado cuenta con variables escaladas por factores diferentes (por ejemplo, las ganancias representadas en millones de pesos y los precios en miles de pesos) el resultado del PCA puede verse afectado, pues la medición de la varianza podría arrojar una cantidad mayor al utilizar un factor mayor y una cantidad menor en caso contrario.
De lo anterior, la proporción de varianza explicada por la m-ésima componente principal se representa como:
La varianza total del dataset se expresa como:
La varianza explicada por la m-ésima componente principal está dada por:
Autora: Nayeli del Carmen González Novelo © UVEG. Derechos reservados. El contenido de este formato está sujeto a las disposiciones aplicables en materia de Propiedad Intelectual, por lo que no puede ser distribuido, ni transmitido, parcial o totalmente mediante cualquier medio, método o sistema impreso, electrónico o magnético, incluyendo el fotocopiado, la fotografía o la grabación, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. Este material propiedad de UVEG, integra aportes asistidos tecnológicamente (como IA, entre otros), los cuales fueron revisados y validados por el equipo UVEG, conforme a las disposiciones vigentes aplicables. Los recursos visuales y/o audiovisuales fueron tomados total y/o parcialmente de Freepik.
Figura 1. Gráfico de sedimentación.
Método para producir variables derivadas para usarlas posteriormente en problemas de aprendizaje supervisado.
Parte del procedimiento de imputación de datos (llenar valores faltantes).
Escalamiento de variables Por esta razón, resulta necesario escalar todas las variables por el mismo factor antes de realizar el PCA. Típicamente, se escalan las variables de tal modo que cada una posea una desviación estándar muestral igual a 1. Un caso especial surge cuando cada una de las variables se encuentran representadas en exactamente las mismas unidades; en este escenario no se realiza el escalamiento.
Herramienta de visualización de las variables.