Want to create interactive content? It’s easy in Genially!

Get started free

ADP_L10

Producción UVEG

Created on March 12, 2026

Start designing with a free template

Discover more than 1500 professional designs like these:

Video: Responsible Use of Social Media and Internet

Mothers Days Card

Momentum: First Operational Steps

Momentum: Employee Introduction Presentation

Mind Map: The 4 Pillars of Success

Big Data: The Data That Drives the World

Momentum: Onboarding Presentation

Transcript

Análisis de componentes

principales

Introducción

¡Te doy la bienvenida! Estás por conocer los pasos para realizar un análisis de componentes principales empleando Python con precisión y coherencia. ¡Adelante!

fundamentos

y motivación

Análisis de componentes principales

Ha llegado el momento de iniciar con la Lección. Para ello, conviene retomar el concepto de análisis de componentes principales.

Utilidad del PCA

El PCA suele formar parte del análisis exploratorio de datos, de ahí que conozcas su utilidad en estos procesos.

Lectura y escritura de datos tabulares

Dentro del PCA se vuelve necesario considerar que…

El PCA permite encontrar una representación 2-dimensional de un conjunto de datos, de forma que captura la mayor variabilidad posible.

La idea es que cada una de las observaciones vive en un espacio de p dimensiones, pero no todas las componentes son igual de interesantes.

El PCA busca una dimensión pequeña que resulte tan interesante como sea posible; aquí el concepto de interesante se mide como la variación de dichas observaciones a lo largo de cada dimensión.

¿Cómo encontrar las componentes principales?

A partir de este momento es fundamental que pongas atención en cada paso y cálculo para encontrar la primera y segunda componente principal.

Tip Toma nota de lo que representa cada elemento de la fórmula para que logres más tarde realizar tus cálculos con facilidad.

Análisis de componentes principales

Considera un dataset con n observaciones y p variables X1, X2,...,, Xp donde cada variable ha sido centrada para tener media cero.

Pulsa los botones para conocer el resto del proceso.

Paso 2

Paso 1

Primera componente principal

Después de revisar detalladamente los elementos de los pasos 1 y 2, considera lo siguiente:

El vector es la primera componente principal.

Los números son llamados puntuaciones de la primera componente principal.

El vector de cargas es de la primera componente principal.

Los números son las cargas de la primera componente principal.

Segunda componente principal

Ahora te presento el proceso para determinar la segunda componente principal.

Pulsa los botones para conocer el resto del proceso.

Paso 2

Paso 1

Primera componente principal

Después de revisar detalladamente los elementos de los pasos 1 y 2, considera lo siguiente:

El vector es la primera componente principal.

Los números son llamados puntuaciones de la segunda componente principal.

El vector de cargas es de la segunda componente principal.

Los números son las cargas de la segunda componente principal.

Más sobre el PCA

Recapitula los temas abordados en esta sección a través del siguiente video.

Video Autora: Rocío Chávez Ciencia de Datos Título: ¿Qué es el Análisis de Componentes Principales (PCA)?

Más sobre el PCA

De igual manera, consulta el Enlace para ahondar en los conceptos que sustentan el análisis de componentes principales (PCA). Los aspectos más relevantes del álgebra lineal que se utilizan en dicho capítulo se desarrollan en las páginas 13-42 .

Enlace Autor: Daniel Peña Título: Análisis de datos multivariantes Páginas: 13-42

Procesamiento y

escalado

Escalamiento y PCA

Cuando realices un PCA centra cada una de las variables, puesto que sólo tienes interés en medir la varianza en las observaciones. Así, antes de realizar el PCA comienza restando la media muestral de la variable X a cada una de las observaciones obtenidas para esta misma variable (Pedregosa, et al., 2020).

Pulsa los botones para reconocer la importancia de este procedimiento.

Variables y varianza

Escalamiento de variables

Cálculo y selección de

componentes

Cálculo y selección de componentes

A continuación, te muestro el paso a paso para calcular los componentes principales:

Pulsa cada número para aplicar los cálculos.

Cálculo y selección de componentes

Partiendo de lo anterior, revisa las expresiones matemáticas:

Cálculo y selección de componentes

En general, una matriz X de tamaño n x p tiene a lo más: min{n - 1, p} componentes principales distintas.

Tip No todas las componentes principales son de interés, sino que se busca visualizar o interpretar los datos con la menor cantidad de ellas.

Cálculo y selección de componentes

Para determinar el número de componentes principales, típicamente se inspecciona un gráfico de sedimentación (como el que te muestro en la Figura 1). En el cual se busca un punto de inflexión (conocido como codo) a partir del cual la varianza explicada por cada componente principal subsecuente decae.

Interpretación y visualización

de datos

Interpretación y visualización de datos

Te invito a consultar el siguiente video para que puedas visualizar gráficamente cómo se representan las componentes principales.

Video Autora: Nayeli González Novelo Título: Interpretación y visualización de resultados

PCA en

Python

PCA en Python

Después de haber leído los aspectos más relevantes del PCA, te recomiendo los siguientes recursos que muestran cómo realizar un PCA en Python con la ayuda de la librería Scikit-learn.

Video Autor: Minuteman Título: Principal Component Analysis (PCA) in Python

Enlace Autor: Joaquín Amat Rodrigo Título: PCA con Python. Ciencia de Datos Sección: Ejemplos PCA

Conclusión

Finalmente, el objetivo de esta Lección fue presentarte de manera detallada el método de componentes principales, por lo que identificaste los pasos claves para realizarlo en Python a través de la librería Scikitlearn. Recuerda consultar todos los recursos que se te recomendaron a lo largo de esta Lección, ya que al ser un tema que involucra ciertos cálculos, requiere de más tiempo de estudio.

¡Felicidades!

Has concluido con

la Lección

James, G., Witten, D., Hastie, T. & Tibshirani, R. (2023). An Introduction to Statistical Learning: with Applications in Python (Springer Texts in Statistics). Springer Cham. https://doi.org/10.1007/978-3-031-38747-0 Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … Duchesnay, É. (2020). Principal component analysis (PCA). Scikit-learn documentation. https://scikit-learn.org/stable/modules/decomposition.html#pca Bibliografía Abdi, H., & Williams, L. J. (2010). Principal component analysis. Wiley Interdisciplinary Reviews: Computational Statistics, 2(4). https://doi.org/10.1002/wics.101 Amat Rodrigo, J. (2025). PCA con Python. Cienciadedatos.net. https://cienciadedatos.net/documentos/py19-pca-python Gabriel, K. R. (1971). The biplot graphic display of matrices with application to principal component analysis. Biometrika, 58(3). https://doi.org/10.1093/biomet/58.3.453 Jolliffe, I. T., & Cadima, J. (2016). Principal component analysis: A review and recent developments. Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 374(2065). https://doi.org/10.1098/rsta.2015.0202Minuteman. (2020). Principal Component Analysis (PCA) in Python [Video]. Youtube. https://www.youtube.com/watch?v=-0GvjcQ3VyA Rocio Chavez Ciencia de Datos. (2023). Que es el Analisis de Componentes Principales (PCA) #shorts [Video]. Youtube. https://www.youtube.com/watch?v=CYHbSNmRJ08

Concepto clave El análisis de componentes principales (PCA por sus siglas en inglés) es un método de aprendizaje no supervisado; es decir, analiza un conjunto de características X1, X2,..., Xp pero no considera una respuesta Y (contrario a los métodos supervisados como la regresión) (James et al., 2023).

Variables y varianza Cuando el dataset analizado cuenta con variables escaladas por factores diferentes (por ejemplo, las ganancias representadas en millones de pesos y los precios en miles de pesos) el resultado del PCA puede verse afectado, pues la medición de la varianza podría arrojar una cantidad mayor al utilizar un factor mayor y una cantidad menor en caso contrario.

De lo anterior, la proporción de varianza explicada por la m-ésima componente principal se representa como:

La varianza total del dataset se expresa como:

La varianza explicada por la m-ésima componente principal está dada por:

Autora: Nayeli del Carmen González Novelo © UVEG. Derechos reservados. El contenido de este formato está sujeto a las disposiciones aplicables en materia de Propiedad Intelectual, por lo que no puede ser distribuido, ni transmitido, parcial o totalmente mediante cualquier medio, método o sistema impreso, electrónico o magnético, incluyendo el fotocopiado, la fotografía o la grabación, sin la autorización por escrito de la Universidad Virtual del Estado de Guanajuato. Este material propiedad de UVEG, integra aportes asistidos tecnológicamente (como IA, entre otros), los cuales fueron revisados y validados por el equipo UVEG, conforme a las disposiciones vigentes aplicables. Los recursos visuales y/o audiovisuales fueron tomados total y/o parcialmente de Freepik.

Figura 1. Gráfico de sedimentación.

Método para producir variables derivadas para usarlas posteriormente en problemas de aprendizaje supervisado.

Parte del procedimiento de imputación de datos (llenar valores faltantes).

Escalamiento de variables Por esta razón, resulta necesario escalar todas las variables por el mismo factor antes de realizar el PCA. Típicamente, se escalan las variables de tal modo que cada una posea una desviación estándar muestral igual a 1. Un caso especial surge cuando cada una de las variables se encuentran representadas en exactamente las mismas unidades; en este escenario no se realiza el escalamiento.

Herramienta de visualización de las variables.