Want to create interactive content? It’s easy in Genially!
ODA7 U3 | Detección y reconocimiento de objetos
Diana Selene Hernánd
Created on February 28, 2024
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Math Calculations
View
Interactive QR Code Generator
View
Interactive Scoreboard
View
Interactive Bingo
View
Interactive Hangman
View
Secret Code
View
Branching Scenario: Academic Ethics and AI Use
Transcript
Detección y reconocimiento de objetos
Comencemos
Conceptos
La detección de objetos es una tecnología innovadora que consiste en identificar y localizar varios objetos específicos dentro de una imagen, para ello proporciona información precisa sobre su posición. No se limita a imágenes estáticas, también es aplicable a videos y streaming en tiempo real. Su versatilidad la convierte en una herramienta efectiva para resolver problemas complejos en diferentes sectores.
Info
Técnicas de detección de objetos Métodos basados en características
Estos enfoques se centran en extraer características visuales específicas de los objetos presentes en una imagen.
Histograma de gradientes orientados (HOG)
Descriptores SIFT (Scale-Invariant Feature Transform)
Características de textura:
Métodos para describir la textura:
Pasos
Has finalizado esta lección ¡Felicidades!
Para detectar rostros en esta imagen utilizando HOG, simplemente buscamos la región de la imagen que más se asemeje a un patrón de HOG previamente conocido, el cual fue extraído de un extenso conjunto de datos de entrenamiento que contiene otros rostros.
Descriptores estructurales: identifican elementos primitivos o texels que se repiten en la imagen y describir cómo se organizan para formar la textura. Este método requiere que la textura tenga una estructura reconocible, lo que no ocurre en todos los casos.
Los algoritmos analizan las imágenes de entrada o los fotogramas de vídeo, detectan los objetos que contienen y proporcionan información sobre su ubicación a través de cuadros delimitadores. El reconocimiento implica asignar una etiqueta o clasificación e identifica su tipo o categoría. Estos algoritmos utilizan modelos de aprendizaje profundo, como las redes neuronales convolucionales (CNN), para aprender y reconocer patrones dentro de los datos. Ellas se entrenan con grandes conjuntos de datos etiquetados para reconocer una amplia variedad de objetos, desde personas y automóviles hasta animales y objetos cotidianos.
Descriptores basados en modelos: construyen un modelo matemático o estadístico que represente las características esenciales de la textura. Algunos ejemplos son las cadenas de Markov, que modelan la dependencia entre píxeles vecinos, o los fractales, que modelan la rugosidad de la superficie.
Es una técnica para detectar rostros en imágenes. Su objetivo es describir las características de un objeto, como un rostro, de forma que sea invariante a las condiciones de iluminación, escala y orientación. Consiste de varios pasos:
Primero se convierte la imagen a escala de grises, para eliminar la información del color.
Se basa en la detección y descripción de puntos característicos de la imagen que son invariantes a cambios de escala, rotación e iluminación. Estos puntos se pueden utilizar para establecer correspondencias entre imágenes de la misma escena u objeto tomadas desde diferentes puntos de vista o condiciones de iluminación.
Tercero, se divide la imagen en pequeñas celdas de 16x16 píxeles, y se cuenta el número de gradientes que apuntan a cada dirección principal (horizontal, vertical, diagonal, etc.).
Al usar esta técnica podemos encontrar caras de forma rápida en cualquier imagen.
Cuarto, se reemplaza cada celda por el histograma de los gradientes, que es una representación simplificada de la forma y la estructura del objeto.
Pasos principales del método SIFT:
- La construcción del espacio escala: aplica filtros gaussianos a la imagen original a diferentes niveles de resolución para obtener una pirámide de imágenes.
- La detección de puntos extremos: busca los máximos y mínimos locales de la diferencia de gaussianos (DoG) en el espacio escala, que corresponden a los puntos característicos.
- La asignación de orientaciones: asigna una o más orientaciones a cada punto característico basándose en el histograma de gradientes locales en una región alrededor del punto.
- La generación de descriptores: representa cada punto característico por un vector de 128 dimensiones que contiene los histogramas de gradientes locales en una región de 16x16 píxeles alrededor del punto, dividida en 16 subregiones de 4x4 píxeles.
Atiene el siguiente capítulo para comprender mejor el tema:
Quinto, se compara el histograma de cada celda con un patrón de HOG predefinido, que se ha obtenido a partir de un conjunto de entrenamiento de imágenes de rostros. Si el histograma se parece al patrón, se clasifica como rostro, y si no, se descarta.
Segundo, se calcula el gradiente de cada pixel. Es una flecha que indica la dirección y la magnitud del cambio de brillo en la imagen.
Descriptores probabilísticos: calculan medidas estadísticas a partir del histograma de niveles de gris de la imagen o de la matriz de co-ocurrencia, que indica la frecuencia con la que aparecen pares de píxeles con cierta distancia y ángulo. Este método es simple y rápido, y puede aplicarse a texturas de origen aleatorio.
La textura es una propiedad visual que depende de la variación de los tonos de gris, la dirección y el contraste de los píxeles que forman una imagen. La textura puede ser útil para segmentar, identificar o analizar objetos o regiones de interés en una imagen.
Descriptores en frecuencia: se basan en obtener la transformada de Fourier de la imagen y analizar el espectro de frecuencias resultante. Este método es adecuado para texturas periódicas y homogéneas, pero no para texturas aleatorias o heterogéneas.
