2.1. Qué es el aprendizaje automático y cómo aprende una máquina
Empezar
2.1.1. Programación Tradicional vs. Machine Learning
Para entender qué es el machine learning, primero necesitamos comprender cómo funciona la programación tradicional y en qué se diferencia.
un desarrollador escribe reglas explícitas que la máquina debe seguir. Es como darle a alguien una receta de cocina: «primero calienta el horno a 180 grados, después mezcla la harina con el azúcar, luego hornea durante 30 minutos». La máquina no decide nada por sí misma; simplemente ejecuta instrucciones paso a paso. Si el programador no ha previsto una situación concreta, la máquina no sabrá cómo reaccionar.
+ En la programación tradicional
+ En el machine learning
en cambio, el proceso se invierte. En lugar de darle reglas a la máquina, le damos datos y resultados, y la máquina descubre por sí misma las reglas o patrones que conectan unos con otros. Es como si, en vez de dar la receta, le mostrásemos 10.000 pasteles diferentes junto con sus ingredientes, y la máquina aprendiese sola qué combinaciones producen un buen pastel y cuáles no.
Veamos esta diferencia de forma más visual:
2.1.2. El Concepto de «Aprender» en una Máquina
Cuando decimos que una máquina «aprende», no queremos decir que piense o sienta como un ser humano. Lo que realmente ocurre es un proceso matemático de optimización: la máquina ajusta millones de parámetros numéricos internos hasta que sus predicciones se acercan lo máximo posible a la realidad.
Imaginemos que queremos enseñar a una máquina a predecir el precio de una vivienda. El proceso sería el siguiente:
Reunimos información de miles de viviendas vendidas (metros cuadrados, número de habitaciones, barrio, año de construcción, precio real de venta).
1. Recogida de datos
La máquina empieza con parámetros aleatorios, como un estudiante que no sabe nada del tema.
2. Modelo inicial
Intenta predecir el precio de cada vivienda con esos parámetros aleatorios. Obviamente, se equivoca mucho.
3. Predicción
Medimos cuánto se ha equivocado (la diferencia entre el precio predicho y el precio real).
4. Cálculo del error:
La máquina modifica ligeramente sus parámetros para reducir ese error.
5. Ajuste
Repite los pasos 3 a 5 miles o millones de veces, cada vez cometiendo menos errores.
Analogía del profesor
6. Repetición:
Tras muchas iteraciones, los parámetros están tan bien ajustados que la máquina puede predecir precios de viviendas nuevas con notable precisión.
7. Modelo entrenado:
2.1.3. Los Tres Ingredientes del Machine Learning
Todo proyecto de machine learning necesita tres ingredientes fundamentales, sin excepción:
Algoritmo
Capacidad de cómputo
Datos
2.1.4. El Flujo de Trabajo de un Proyecto de ML
Cualquier proyecto de machine learning, desde el más simple al más complejo, sigue un flujo de trabajo similar. Comprender estas fases es esencial para cualquier profesional que quiera liderar o participar en proyectos de ML:
- Definición del problema: ¿Qué pregunta empresarial queremos responder? Por ejemplo: ¿Qué clientes tienen mayor probabilidad de abandonar nuestro servicio?
- Recogida y preparación de datos: Reunir datos relevantes, limpiarlos (eliminar duplicados, corregir errores) y transformarlos a un formato que el algoritmo pueda procesar.
- Exploración de datos: Analizar los datos para entender sus características, detectar patrones iniciales y posibles problemas como datos faltantes o sesgos.
- Selección y entrenamiento del modelo: Elegir uno o varios algoritmos, dividir los datos en conjuntos de entrenamiento y prueba, y entrenar el modelo.
- Evaluación: Medir el rendimiento del modelo con datos que no ha visto durante el entrenamiento (datos de prueba) para comprobar si generaliza bien.
- Despliegue: Poner el modelo en producción para que empiece a hacer predicciones en el mundo real.
- Monitorización y mejora continua: Vigilar que el modelo siga funcionando
2.1.5. Conceptos Clave: Overfitting y Underfitting
Dos de los problemas más comunes en machine learning son el sobreajuste (overfitting) y el subajuste (underfitting). Entenderlos es crucial para cualquier persona involucrada en proyectos de datos.
Ocurre cuando el modelo ha «memorizado» los datos de entrenamiento en lugar de aprender los patrones generales. Es como un estudiante que memoriza las respuestas de un examen anterior pero no entiende la materia. Cuando le ponen preguntas nuevas, falla estrepitosamente. Un modelo sobreajustado funciona increíblemente bien con los datos con los que fue entrenado, pero mal con datos nuevos.
Overfitting (sobreajuste):
Ocurre cuando el modelo es demasiado simple para capturar los patrones de los datos. Es como intentar explicar la economía mundial con una sola variable. El modelo no funciona bien ni siquiera con los datos de entrenamiento.
El objetivo siempre es encontrar el equilibrio: un modelo lo suficientemente complejo para capturar los patrones reales, pero no tanto como para memorizar ruido y datos irrelevantes.
Underfitting (subajuste):
Autoevaluación
Empezar
¡Autoevaluacion finalizada!
Unidad finalizada
¡Buen trabajo!
Reflexiona sobre lo que has aprendido en la misma
Los datos son el combustible del machine learning. Sin datos de calidad, ningún algoritmo puede aprender. Los datos pueden ser numéricos (ventas, temperaturas), textuales (correos electrónicos, reseñas), imágenes (fotos de productos, radiografías), o incluso de audio y vídeo. La regla de oro es que la cantidad importa, pero la calidad importa más. Un millón de datos erróneos o sesgados producirán un modelo terrible, mientras que 10.000 datos bien etiquetados y representativos pueden generar resultados excelentes.
Entrenar un modelo de machine learning requiere capacidad de procesamiento. Para modelos simples, un ordenador portátil es suficiente. Pero para modelos de deep learning complejos, como los que procesan imágenes o texto a gran escala, se necesitan GPUs (procesadores gráficos especializados) o incluso clústeres de servidores en la nube. Servicios como AWS, Google Cloud o Microsoft Azure permiten alquilar esta potencia de cálculo sin necesidad de comprar hardware costoso.
El algoritmo es el método matemático que la máquina usa para encontrar patrones en los datos. Existen decenas de algoritmos diferentes, cada uno con fortalezas y debilidades. Elegir el algoritmo adecuado es como elegir la herramienta correcta para un trabajo: no usas un martillo para atornillar. Algunos algoritmos son simples y rápidos (como la regresión lineal), mientras que otros son complejos y poderosos (como las redes neuronales profundas).
Piensa en un niño aprendiendo a lanzar una pelota a una canasta. Al principio falla mucho, pero cada intento le da información: «he lanzado muy fuerte», «he tirado demasiado a la izquierda». Con cada intento, ajusta la fuerza y el ángulo. Después de cientos de lanzamientos, encesta con facilidad. La máquina hace exactamente lo mismo, pero con números en lugar de músculos.
2.1. Qué es el aprendizaje automático y cómo aprende una máquina
José Javier González Notario
Created on April 24, 2026
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Math Lesson Plan
View
Primary Unit Plan 2
View
Animated Chalkboard Learning Unit
View
Business Learning Unit
View
Corporate Signature Learning Unit
View
Code Training Unit
View
History Unit plan
Explore all templates
Transcript
2.1. Qué es el aprendizaje automático y cómo aprende una máquina
Empezar
2.1.1. Programación Tradicional vs. Machine Learning
Para entender qué es el machine learning, primero necesitamos comprender cómo funciona la programación tradicional y en qué se diferencia.
un desarrollador escribe reglas explícitas que la máquina debe seguir. Es como darle a alguien una receta de cocina: «primero calienta el horno a 180 grados, después mezcla la harina con el azúcar, luego hornea durante 30 minutos». La máquina no decide nada por sí misma; simplemente ejecuta instrucciones paso a paso. Si el programador no ha previsto una situación concreta, la máquina no sabrá cómo reaccionar.
+ En la programación tradicional
+ En el machine learning
en cambio, el proceso se invierte. En lugar de darle reglas a la máquina, le damos datos y resultados, y la máquina descubre por sí misma las reglas o patrones que conectan unos con otros. Es como si, en vez de dar la receta, le mostrásemos 10.000 pasteles diferentes junto con sus ingredientes, y la máquina aprendiese sola qué combinaciones producen un buen pastel y cuáles no.
Veamos esta diferencia de forma más visual:
2.1.2. El Concepto de «Aprender» en una Máquina
Cuando decimos que una máquina «aprende», no queremos decir que piense o sienta como un ser humano. Lo que realmente ocurre es un proceso matemático de optimización: la máquina ajusta millones de parámetros numéricos internos hasta que sus predicciones se acercan lo máximo posible a la realidad. Imaginemos que queremos enseñar a una máquina a predecir el precio de una vivienda. El proceso sería el siguiente:
Reunimos información de miles de viviendas vendidas (metros cuadrados, número de habitaciones, barrio, año de construcción, precio real de venta).
1. Recogida de datos
La máquina empieza con parámetros aleatorios, como un estudiante que no sabe nada del tema.
2. Modelo inicial
Intenta predecir el precio de cada vivienda con esos parámetros aleatorios. Obviamente, se equivoca mucho.
3. Predicción
Medimos cuánto se ha equivocado (la diferencia entre el precio predicho y el precio real).
4. Cálculo del error:
La máquina modifica ligeramente sus parámetros para reducir ese error.
5. Ajuste
Repite los pasos 3 a 5 miles o millones de veces, cada vez cometiendo menos errores.
Analogía del profesor
6. Repetición:
Tras muchas iteraciones, los parámetros están tan bien ajustados que la máquina puede predecir precios de viviendas nuevas con notable precisión.
7. Modelo entrenado:
2.1.3. Los Tres Ingredientes del Machine Learning
Todo proyecto de machine learning necesita tres ingredientes fundamentales, sin excepción:
Algoritmo
Capacidad de cómputo
Datos
2.1.4. El Flujo de Trabajo de un Proyecto de ML
Cualquier proyecto de machine learning, desde el más simple al más complejo, sigue un flujo de trabajo similar. Comprender estas fases es esencial para cualquier profesional que quiera liderar o participar en proyectos de ML:
2.1.5. Conceptos Clave: Overfitting y Underfitting
Dos de los problemas más comunes en machine learning son el sobreajuste (overfitting) y el subajuste (underfitting). Entenderlos es crucial para cualquier persona involucrada en proyectos de datos.
Ocurre cuando el modelo ha «memorizado» los datos de entrenamiento en lugar de aprender los patrones generales. Es como un estudiante que memoriza las respuestas de un examen anterior pero no entiende la materia. Cuando le ponen preguntas nuevas, falla estrepitosamente. Un modelo sobreajustado funciona increíblemente bien con los datos con los que fue entrenado, pero mal con datos nuevos.
Overfitting (sobreajuste):
Ocurre cuando el modelo es demasiado simple para capturar los patrones de los datos. Es como intentar explicar la economía mundial con una sola variable. El modelo no funciona bien ni siquiera con los datos de entrenamiento. El objetivo siempre es encontrar el equilibrio: un modelo lo suficientemente complejo para capturar los patrones reales, pero no tanto como para memorizar ruido y datos irrelevantes.
Underfitting (subajuste):
Autoevaluación
Empezar
¡Autoevaluacion finalizada!
Unidad finalizada
¡Buen trabajo!
Reflexiona sobre lo que has aprendido en la misma
Los datos son el combustible del machine learning. Sin datos de calidad, ningún algoritmo puede aprender. Los datos pueden ser numéricos (ventas, temperaturas), textuales (correos electrónicos, reseñas), imágenes (fotos de productos, radiografías), o incluso de audio y vídeo. La regla de oro es que la cantidad importa, pero la calidad importa más. Un millón de datos erróneos o sesgados producirán un modelo terrible, mientras que 10.000 datos bien etiquetados y representativos pueden generar resultados excelentes.
Entrenar un modelo de machine learning requiere capacidad de procesamiento. Para modelos simples, un ordenador portátil es suficiente. Pero para modelos de deep learning complejos, como los que procesan imágenes o texto a gran escala, se necesitan GPUs (procesadores gráficos especializados) o incluso clústeres de servidores en la nube. Servicios como AWS, Google Cloud o Microsoft Azure permiten alquilar esta potencia de cálculo sin necesidad de comprar hardware costoso.
El algoritmo es el método matemático que la máquina usa para encontrar patrones en los datos. Existen decenas de algoritmos diferentes, cada uno con fortalezas y debilidades. Elegir el algoritmo adecuado es como elegir la herramienta correcta para un trabajo: no usas un martillo para atornillar. Algunos algoritmos son simples y rápidos (como la regresión lineal), mientras que otros son complejos y poderosos (como las redes neuronales profundas).
Piensa en un niño aprendiendo a lanzar una pelota a una canasta. Al principio falla mucho, pero cada intento le da información: «he lanzado muy fuerte», «he tirado demasiado a la izquierda». Con cada intento, ajusta la fuerza y el ángulo. Después de cientos de lanzamientos, encesta con facilidad. La máquina hace exactamente lo mismo, pero con números en lugar de músculos.