Detector de esquinas Harris: Revelando la magia de la detección de características de imagen
Por Fouad Sabry
()
Información de este libro electrónico
¿Qué es el detector de esquinas Harris?
El detector de esquinas de Harris es un operador de detección de esquinas que se usa comúnmente en algoritmos de visión por computadora para extraer esquinas e inferir características de una imagen. Fue introducido por primera vez por Chris Harris y Mike Stephens en 1988 tras la mejora del detector de esquinas de Moravec. En comparación con su predecesor, el detector de esquinas de Harris tiene en cuenta el diferencial de la puntuación de las esquinas con referencia directa a la dirección, en lugar de utilizar parches cambiantes para cada ángulo de 45 grados, y ha demostrado ser más preciso al distinguir entre bordes y esquinas. Desde entonces, se ha mejorado y adoptado en muchos algoritmos para preprocesar imágenes para aplicaciones posteriores.
Cómo te beneficiarás
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Detector de esquinas Harris
Capítulo 2: Detección de esquinas
Capítulo 3: Estructura tensor
Capítulo 4: Detector de región afín de Harris
Capítulo 5: Método Lucas-Kanade
Capítulo 6: Matriz de Hesse
Capítulo 7: Aprendizaje de características geométricas
Capítulo 8: Densidad tensorial
Capítulo 9: Método predictor-corrector de Mehrotra
Capítulo 10: Operador discreto de Laplace
(II) Respondiendo a las principales preguntas del público sobre el detector de esquinas Harris.
(III) Ejemplos del mundo real para el uso del detector de esquinas Harris en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o información básica para cualquier tipo de detector de esquinas Harris.
Lee más de Fouad Sabry
Tecnologías Emergentes En Robótica [Spanish]
Relacionado con Detector de esquinas Harris
Títulos en esta serie (100)
Retinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificacionesCorrelación cruzada: Desbloqueo de patrones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Detección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesTransformación de característica invariante de escala: Revelando el poder de la transformación de características invariantes de escala en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesClasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz Calificación: 0 de 5 estrellas0 calificacionesFlujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSuperficie procesal: Explorando la generación y el análisis de texturas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesLeast Squares: Técnicas de optimización para visión por computadora: métodos de mínimos cuadrados Calificación: 0 de 5 estrellas0 calificacionesGráficos de trazado de rayos: Explorando la representación fotorrealista en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMétodo de ajuste de nivel: Avances en la visión por computadora, exploración del método de conjunto de niveles Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de vértice: Explorando la intersección de los gráficos por computadora Vertex y la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCampo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesGráfico de trama digital: Revelando el poder de los gráficos rasterizados digitales en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos vectoriales: Potenciando la creación visual con algoritmos avanzados Calificación: 0 de 5 estrellas0 calificacionesReconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos Calificación: 0 de 5 estrellas0 calificacionesEje medial: Explorando el núcleo de la visión por computadora: revelando el eje medial Calificación: 0 de 5 estrellas0 calificacionesGráficos rasterizados: Comprender los fundamentos de los gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCuadro delimitador mínimo: Revelando el poder de la optimización espacial en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelado y renderizado basado en imágenes: Explorando el realismo visual: técnicas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHashing geométrico: Algoritmos eficientes para el reconocimiento y la comparación de imágenes Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos ráster: Transformando realidades visuales: dominio de los editores de gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVolumen límite: Explorando la representación espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de línea de exploración: Explorando el realismo visual a través de técnicas de renderizado Scanline Calificación: 0 de 5 estrellas0 calificacionesModelo de reflexión de Phong: Comprender las interacciones de la luz en la visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Cómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesKlara y el Sol Calificación: 5 de 5 estrellas5/5Resumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesPython fácil Calificación: 4 de 5 estrellas4/5Máquinas como yo Calificación: 4 de 5 estrellas4/5El imperio de los algoritmos: IA inclusiva, ética y al servicio de la humanidad Calificación: 0 de 5 estrellas0 calificacionesCómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesMáquinas predictivas: La sencilla economía de la inteligencia artificial Calificación: 5 de 5 estrellas5/5Big data: La revolución de los datos masivos Calificación: 4 de 5 estrellas4/5El mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5El poder de las imagenes, la palabra no tiene poder Calificación: 0 de 5 estrellas0 calificacionesMecatrónica Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesSobreviviendo a la IA Calificación: 3 de 5 estrellas3/5Desarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesAprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesProgramación de Inteligencia Artificial. Curso Práctico Calificación: 0 de 5 estrellas0 calificacionesMetodología de la programación Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Metodología de la Programación Orientada a Objetos Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Programacion Orientada a Objetos y Estructura de Datos a Fondo Calificación: 0 de 5 estrellas0 calificacionesANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificacionesBusiness Intelligence: Técnicas herramientas y aplicaciones Calificación: 0 de 5 estrellas0 calificacionesUML: Modelado de Software para Profesionales Calificación: 0 de 5 estrellas0 calificaciones
Comentarios para Detector de esquinas Harris
0 clasificaciones0 comentarios
Vista previa del libro
Detector de esquinas Harris - Fouad Sabry
Capítulo 1: Detector de esquinas Harris
Comúnmente empleado en algoritmos de visión por computadora para la extracción de esquinas y la inferencia de características, el detector de esquinas Harris es un tipo de operador de detección de esquinas. Chris Harris y Mike Stephens lo lanzaron inicialmente en 1988, después de refinar el detector de esquinas de Moravec. Desde entonces, se ha perfeccionado e implementado en una amplia variedad de algoritmos utilizados para preparar imágenes para su uso en otros contextos.
Una esquina es una ubicación en la que se encuentran dos aristas tangenciales principales. Una forma de pensar en una esquina es como el punto de encuentro de dos bordes, donde un borde representa un cambio distintivo en el valor tonal dentro de una imagen. Las características importantes de la imagen, o puntos de interés, son esquinas porque permanecen sin cambios cuando la imagen se traduce, gira o ilumina. Las esquinas de una imagen pueden constituir solo una pequeña fracción del total, pero contienen algunas de las características más cruciales para restaurar la información de la imagen y se pueden utilizar para reducir la cantidad de datos que deben procesarse para tareas como el seguimiento de movimiento, la unión de imágenes, la creación de mosaicos 2D, la visión estereoscópica, la representación de imágenes, y así sucesivamente.
Los investigadores han desarrollado muchos detectores de esquinas diferentes para extraer las esquinas de la imagen, pero el operador Kanade-Lucas-Tomasi (KLT) y el operador Harris se destacan como los más simples, eficientes y confiables. Estos dos enfoques comunes están relacionados y dependen de la matriz estructural local. El detector de esquinas Harris es el preferido para su uso en la coincidencia estéreo y la recuperación de bases de datos de imágenes porque mantiene una alta precisión a pesar de los cambios en la luz y la rotación. El detector de esquinas Harris sigue siendo un método crucial y fundamental en muchas aplicaciones de visión artificial, a pesar de sus defectos y restricciones.
Sin reducir el alcance, aquí, se asumen imágenes en escala de grises bidimensionales.
Sea esta imagen dada por I .
Considere la posibilidad de tomar un parche de imagen {\displaystyle (x,y)\in W} (ventana) y desplazarlo por {\displaystyle (\Delta x,\Delta y)} .
El SSD compara la distancia entre estos dos parches, denotado f , es el resultado de:
{\displaystyle f(\Delta x,\Delta y)={\underset {(x_{k},y_{k})\in W}{\sum }}\left(I(x_{k},y_{k})-I(x_{k}+\Delta x,y_{k}+\Delta y)\right)^{2}}{\displaystyle I(x+\Delta x,y+\Delta y)} puede ser aproximado por una expansión de Taylor.
Sea I_{x} y I_y sean las derivadas parciales de I , tales que
{\displaystyle I(x+\Delta x,y+\Delta y)\approx I(x,y)+I_{x}(x,y)\Delta x+I_{y}(x,y)\Delta y}La aproximación resulta de esto.
{\displaystyle f(\Delta x,\Delta y)\approx {\underset {(x,y)\in W}{\sum }}\left(I_{x}(x,y)\Delta x+I_{y}(x,y)\Delta y\right)^{2},}cuyas respuestas pueden ser representadas por matrices:
{\displaystyle f(\Delta x,\Delta y)\approx {\begin{pmatrix}\Delta x&\Delta y\end{pmatrix}}M{\begin{pmatrix}\Delta x\\\Delta y\end{pmatrix}},}donde M denota un tensor de estructura,
{\displaystyle M={\underset {(x,y)\in W}{\sum }}{\begin{bmatrix}I_{x}^{2}&I_{x}I_{y}\\I_{x}I_{y}&I_{y}^{2}\end{bmatrix}}={\begin{bmatrix}{\underset {(x,y)\in W}{\sum }}I_{x}^{2}&{\underset {(x,y)\in W}{\sum }}I_{x}I_{y}\\{\underset {(x,y)\in W}{\sum }}I_{x}I_{y}&{\underset {(x,y)\in W}{\sum }}I_{y}^{2}\end{bmatrix}}}Los algoritmos de detección de esquinas de Harris a menudo se dividen en cinco etapas.
Color a escala de grises
Cálculo de derivadas espaciales
Configuración del tensor de estructura
Cálculo de la respuesta de Harris
Supresión reducida
Para mejorar la velocidad de procesamiento cuando se utiliza el detector de esquinas Harris en una imagen en color, primero se convierte a escala de grises.
Los valores de píxel de la imagen en escala de grises son solo las sumas ponderadas de los valores RGB correspondientes, {\displaystyle \sum _{C\,\in \,\{R,G,B\}}w_{C}\cdot C} por ejemplo, donde
,
A continuación, las derivadas de interés son las que se refieren a x e y, y las determinaremos, {\displaystyle I_{x}(x,y)} y {\displaystyle I_{y}(x,y)} .
Con {\displaystyle I_{x}(x,y)} , {\displaystyle I_{y}(x,y)} , podemos construir el tensor de estructura M .
Para {\displaystyle x\ll y} , se tiene {\displaystyle {\tfrac {x\cdot y}{x+y}}=x{\tfrac {1}{1+x/y}}\approx x.} En este paso, Usando esa aproximación, obtenemos el menor valor propio del tensor de estructura:
{\displaystyle \lambda _{\min }\approx {\frac {\lambda _{1}\lambda _{2}}{(\lambda _{1}+\lambda _{2})}}={\frac {\det(M)}{\operatorname {tr} (M)}}}con el rastro {\displaystyle \mathrm {tr} (M)=m_{11}+m_{22}} .
A continuación se muestra un cálculo alternativo de la respuesta de Harris que se utiliza con frecuencia,
{\displaystyle R=\lambda _{1}\lambda _{2}-k(\lambda _{1}+\lambda _{2})^{2}=\det(M)-k\operatorname {tr} (M)^{2}}donde k es una constante empíricamente determinada; {\displaystyle k\in [0.04,0.06]} .
Encontrar los máximos locales como esquinas dentro de la ventana, que es un filtro de 3 por 3, nos permite seleccionar los mejores valores para significar las esquinas.
Detector de esquinas formadas por Harris-Laplace
Detector de esquinas que utiliza descomposición morfológica diferencial
Un detector de esquinas basado en tensores de estructura bilaterales multiescala
Registro, unión y alineación de imágenes
Creación de mosaicos 2D
Reconstrucción y modelado de escenas 3D
Detección de movimiento
Reconocimiento de objetos
Recuperación e indexación de imágenes basadas en contenido
Seguimiento de video
{Fin del capítulo 1}
Capítulo 2: Detección de esquinas
En los sistemas de visión artificial, la detección de esquinas se utiliza para inferir la naturaleza de una imagen mediante la extracción de tipos específicos de características. El análisis de movimiento, el registro de imágenes, el seguimiento de vídeo, el mosaico, la unión de panoramas, la reconstrucción 3D y el reconocimiento de objetos hacen uso de la detección de esquinas de una forma u otra. Existe cierta duplicación de esfuerzos entre la detección de esquinas y la detección de puntos de interés.
Una esquina es el punto donde se unen dos aristas. Una definición alternativa de una esquina es un punto con dos direcciones de borde distintas inmediatamente adyacentes a él.
Un punto de interés es una ubicación específica dentro de una imagen que se puede identificar con precisión. Un punto de interés no se limita a una esquina, sino que también puede ser algo así como un máximo o mínimo local de intensidad, la terminación de una línea o un punto en una curva donde la curvatura está en su máximo.
En la práctica, la mayoría de los enfoques de detección de esquinas
solo detectan puntos de interés, y los términos se usan más o menos indistintamente en la literatura.
Varios autores usan los términos esquina
, punto de interés
y característica
indistintamente, lo que nubla aún más la discusión. Específicamente, hay una serie de detectores de blobs que se pueden llamar operadores de puntos de interés
, pero se conocen más comúnmente como detectores de esquina
. Además, se conoce la existencia de la detección de crestas para identificar objetos lineales.
Debido a su fragilidad inherente, los detectores de esquinas suelen requerir el uso de cantidades considerables de redundancia para mitigar el impacto de los errores individuales en el proceso de reconocimiento.
La calidad de un detector de esquinas se puede medir probando su capacidad para identificar la misma esquina en imágenes que de otro modo serían comparables, pero que han sido sometidas a transformaciones como el escalado, la rotación y los cambios de iluminación.
La correlación es un método sencillo para detectar esquinas en imágenes, pero rápidamente se vuelve computacionalmente costoso e ineficiente. El método propuesto por Harris y Stephens (abajo), que es una mejora de un método propuesto por Moravec, constituye la base de un enfoque alternativo popular.
Este enfoque, que se remonta a los primeros días del reconocimiento de esquinas, utiliza un umbral de autosimilitud para identificar las esquinas. La técnica examina la proximidad de un parche centrado en el píxel a otros parches que se superponen ampliamente para determinar si hay una esquina. La similitud se calcula sumando las desviaciones al cuadrado (SSD) de los píxeles relacionados en cada parche. Cuando el número es menor, hay mayor acuerdo.
Si el píxel se encuentra en un área de brillo constante, los parches vecinos tendrán una apariencia similar. Si el píxel está cerca de un borde, la apariencia de los parches cercanos perpendiculares al borde variará significativamente, mientras que los parches cercanos paralelos al borde cambiarán ligeramente de apariencia. Si el píxel se encuentra en una entidad variable multidireccional, ninguno de los parches vecinos compartirá una apariencia común.
Como la suma mínima de las diferencias cuadradas (SSD) entre un parche y sus vecinos, la fuerza de las esquinas (horizontal, vertical y en las dos diagonales). Todos los parches circundantes aparecerán diferentes si este valor es alto, ya que la variación a lo largo de todos los turnos será igual o mayor que este valor.
Para determinar si una entidad de interés está presente o no en