Calleja Enrique_R5_U2
Hector Calleja
Created on September 11, 2024
More creations to inspire you
Transcript
Aprendizaje de máquinas y principales algoritmos.
Principales Algoritmos.
Aprendizaje supervisado
K-means
Algoritmos jerárquicos:
DBSCAN
Aprendizaje no supervisado
Algoritmos:
Algoritmo predictivo:
¿Comó aprenden las máquinas?
Clasificación y Predicción.
Agrupamiento. Tipos y aplicaciones.
Redes neuronales artificiales. Aplicaciones de las RNA.
Tipos de algoritmos de agrupamiento
Reconocimiento de patrones
Predicción y clasificación
Optimización y control
Aprendizaje por refuerzo
Mean Shift
Procesamiento del lenguaje natural
Detección de anomalías
Héctor Enrique Calleja Brito
Matricula: 22012585Fecha de creación11/9/2024
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vestibulum euismod venenatis euismod. Donec commodo rhoncus diam, vel ullamcorper odio ornare id. Sed ut massa ultrices, tempus nisi quis, semper est.
Son fundamentales para el aprendizaje y la toma de decisiones en sistemas inteligentes, facilitando la resolución de problemas complejos de manera eficiente.
Es una representación matemática que modela un factor de la realidad, permitiendo prever comportamientos futuros en diversos contextos, como el funcionamiento de máquinas o procesos de producción.
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vestibulum euismod venenatis euismod. Donec commodo rhoncus diam, vel ullamcorper odio ornare id. Sed ut massa ultrices, tempus nisi quis, semper est.
Identificar objetos, caras, texto, etc. en imágenes y audio.
Pronosticar tendencias, clasificar datos en categorías, etc.
Optimizar procesos, controlar sistemas complejos.
Traducción, generación de texto, respuesta a preguntas.
Identificar comportamientos inusuales en datos.
El machine learning es una rama de la Inteligencia Artificial que permite a los sistemas aprender y mejorar automáticamente a partir de la experiencia. Estos sistemas convierten datos en información útil, lo que les permite tomar decisiones. Para que un modelo realice predicciones efectivas, es esencial que esté alimentado con datos de calidad.
¿Comó aprenden las máquinas?
Son una técnica de aprendizaje automático no supervisada. Permiten encontrar grupos o agrupaciones en un conjunto de datos sin etiquetas, basándose en la similitud de los datos. Estas agrupaciones revelan patrones y relaciones en los datos que pueden ser útiles para tareas como ingeniería de características o descubrimiento de información. El agrupamiento es una buena forma de empezar a entender datos desconocidos, ya que permite identificar grupos naturales sin necesidad de supervisión previa.
¿Qué son los algoritmos de agrupamiento?
es una técnica en machine learning donde los algoritmos analizan datos sin etiquetas previas. Esto significa que no tienen un conocimiento inicial sobre los datos, lo que les permite encontrar patrones y estructuras inherentes en ellos.
Aprendizaje no supervisado
Es una técnica en machine learning donde los algoritmos se entrenan utilizando un conjunto de datos etiquetados. Esto significa que cada dato de entrada está asociado con una etiqueta que indica la respuesta correcta. A través de este proceso, el algoritmo aprende a identificar patrones y, posteriormente, puede hacer predicciones o tomar decisiones basadas en nuevos datos.
Aprendizaje supervisado
El machine learning es una rama de la Inteligencia Artificial que permite a los sistemas aprender y mejorar automáticamente a partir de la experiencia. Estos sistemas convierten datos en información útil, lo que les permite tomar decisiones. Para que un modelo realice predicciones efectivas, es esencial que esté alimentado con datos de calidad.
¿Comó aprenden las máquinas?
Es una técnica en machine learning que se centra en que un algoritmo aprenda a través de la experiencia directa. En este enfoque, el algoritmo toma decisiones en diferentes situaciones y recibe retroalimentación en forma de recompensas o penalizaciones. A través de un proceso de prueba y error, el algoritmo ajusta sus decisiones para maximizar las recompensas obtenidas.
Aprendizaje por refuerzo
Las redes neuronales artificiales están basadas en el funcionamiento de las redes de neuronas biológicas. Las neuronas que todos tenemos en nuestro cerebro están compuestas de dendritas, el soma y el axón: Las dendritas se encargan de captar los impulsos nerviosos que emiten otras neuronas. Estos impulsos, se procesan en el soma y se transmiten a través del axón que emite un impulso nervioso hacia las neuronas contiguas.
Aplicaciones de las RNA.
Es fácil implementar. Es útil cuando queremos segmentar grandes volúmenes de datos (Cuando se trata de big data se utilizan variantes como el Mini-Batch KMeans). Computacionalmente es menos costos que el clustering Jerárquico. Ha sido ampliamente utilizado en base de datos reales con buenos resultados
VENTAJAS
DESVENTAJAS
Necesitamos conocer de antemano la cantidad de clusters a formar Debido a que crea los fgrupos en base a las distancias entre los individuos, solamente manjea vaiables numéricas. La calidad de los clusters depende en gran medida de los valores con los que se inicializa el algoritmo. Puede ser que se obtenga un resultado que sea óptimo localmente pero no globalmente. El resultado se vé muy afectado por los ouliers
No es necesario especificar el número de clusteres necesarios para el algoritmo. El clustering jerárquico es fácil de implementar. El dendrograma producido es muy útil para comprender los datos.
VENTAJAS
DESVENTAJAS
El algoritmo nunca puede deshacer ninguna de los pasos anteriores. Si, por ejemplo, el algoritmo agrupa 2 puntos, y más tarde vemos que la conexión no era buena, el programa no puede deshacer ese paso. La complejidad del tiempo para el clustering puede dar lugar a tiempos de cálculo muy largos, en comparación con algoritmos eficientes, como K-Means. Si tenemos un conjunto de datos grande, puede ser difícil determinar el número correcto de clusteres por el dendrograma.
A diferencia de K-means, DBSCAN no requiere que se especifique el número de grupos de antemano y puede encontrar formas arbitrarias de grupos. Es útil cuando se quiere explorar la estructura de los datos sin tener que definir el número de grupos
DBSCAN
Se centra en encontrar áreas de alta densidad en el espacio de datos y agrupar los puntos en estas áreas. Es bueno para datos no esféricos.
Mean Shift