Detección de manchas: Revelando patrones en datos visuales
Por Fouad Sabry
()
Información de este libro electrónico
¿Qué es la detección de manchas?
En el campo de la visión por computadora, los algoritmos de detección de manchas están diseñados para identificar áreas dentro de una imagen digital que son distintas de las regiones que las rodean en términos de características como el brillo o las características del color. En un sentido más casual, una mancha es una región de una imagen en la que ciertas cualidades permanecen constantes o casi constantes. Todos los puntos que componen un blob pueden considerarse comparables entre sí de alguna manera. El uso de convolución es el método que se utiliza con más frecuencia para la detección de blobs.
Cómo se beneficiará
(I) Información y validaciones sobre los siguientes temas:
Capítulo 1: Detección de manchas
Capítulo 2: Detección de bordes
Capítulo 3: Detector de bordes Canny
Capítulo 4 : Transformación de características invariantes de escala
Capítulo 5: Espacio de escala
Capítulo 6: Característica (visión por computadora)
Capítulo 7: Diferencia de gaussianas
Capítulo 8: Detección de esquinas
Capítulo 9: Detección de crestas
Capítulo 10: Operador de función invariante de escala
(II) Respondiendo a las principales preguntas del público sobre la detección de blobs.
(III) Ejemplos del mundo real sobre el uso de la detección de blobs en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de Detección de Blob.
Lee más de Fouad Sabry
Tecnologías Emergentes En Entretenimiento [Spanish]
Relacionado con Detección de manchas
Títulos en esta serie (100)
Ecualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFiltro de partículas: Explorando los filtros de partículas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesMapeo de colores: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesDetección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Procesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de característica invariante de escala: Revelando el poder de la transformación de características invariantes de escala en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesMétodo de ajuste de nivel: Avances en la visión por computadora, exploración del método de conjunto de niveles Calificación: 0 de 5 estrellas0 calificacionesHistograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesClasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz Calificación: 0 de 5 estrellas0 calificacionesFlujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDeterminación de superficies ocultas: Revelando los secretos de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de línea de exploración: Explorando el realismo visual a través de técnicas de renderizado Scanline Calificación: 0 de 5 estrellas0 calificacionesCampo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado Calificación: 0 de 5 estrellas0 calificacionesSuperficie procesal: Explorando la generación y el análisis de texturas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de vértice: Explorando la intersección de los gráficos por computadora Vertex y la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificacionesEstimación de movimiento: Avances y aplicaciones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelado y renderizado basado en imágenes: Explorando el realismo visual: técnicas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia activa: Liberando el poder de los modelos de apariencia activa en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesRepresentación de volumen: Explorando el realismo visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de relieve: Mapeo de relieve: exploración de la profundidad en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVolumen límite: Explorando la representación espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de reflexión de Phong: Comprender las interacciones de la luz en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBolsa de palabras modelo: Desbloqueando la inteligencia visual con Bag of Words Calificación: 0 de 5 estrellas0 calificacionesGráficos de trazado de rayos: Explorando la representación fotorrealista en visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Desarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de software con netbeans 7.1: Programe para scritorio, web y dispositivos móviles Calificación: 0 de 5 estrellas0 calificacionesANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificaciones¿Cómo piensan las máquinas?: Inteligencia artificial para humanos Calificación: 5 de 5 estrellas5/5Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesDiseño de algoritmos y su programación en C Calificación: 0 de 5 estrellas0 calificacionesAprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5Dominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Programación de Inteligencia Artificial. Curso Práctico Calificación: 0 de 5 estrellas0 calificacionesMonetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Oracle 12c PL/SQL: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesMetodología de la programación Calificación: 0 de 5 estrellas0 calificacionesGuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio Calificación: 0 de 5 estrellas0 calificacionesMecatrónica Calificación: 0 de 5 estrellas0 calificacionesArquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Introducción a la programación: Algoritmos y su implementación en vb.net, c#, java y c++ Calificación: 0 de 5 estrellas0 calificacionesPython fácil Calificación: 4 de 5 estrellas4/5El poder de las imagenes, la palabra no tiene poder Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la Ingeniería Industrial Calificación: 0 de 5 estrellas0 calificacionesArrancar con html5 curso de programación: Curso de programación Calificación: 0 de 5 estrellas0 calificacionesResumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesCómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5
Comentarios para Detección de manchas
0 clasificaciones0 comentarios
Vista previa del libro
Detección de manchas - Fouad Sabry
Capítulo 1: Detección de blobs
El objetivo de las técnicas de detección de manchas en visión artificial es identificar áreas de una imagen digital que tienen características significativamente diferentes de su entorno. Se puede considerar que todos los puntos dentro de una mancha son algo similares entre sí, por lo tanto, el término mancha
se usa para describir un área de una imagen donde ciertas cualidades son constantes o esencialmente constantes. La convolución es la técnica más utilizada para la detección de blobs.
Los dos tipos principales de detectores de blobs son los enfoques diferenciales I, que se basan en derivadas de la función con respecto a la posición, y (ii) los métodos extremos locales, que se centran en la detección de los máximos y mínimos locales de la función. Estos detectores también se conocen como operadores de puntos de interés u operadores de regiones de interés de acuerdo con la nomenclatura más actualizada en el campo (véase también detección de puntos de interés y detección de esquinas).
Hay varias razones para investigar y refinar los detectores de blobs. La motivación principal es complementar los datos proporcionados por los detectores de bordes y esquinas proporcionando más información sobre las regiones. En los primeros estudios de campo, se utilizó la detección de manchas para aislar las secciones relevantes. Estos puntos en la imagen podrían servir como indicadores de objetos o partes de objetos con el fin de reconocer y/o rastrear objetos. El análisis de histogramas es solo una de las áreas en las que se pueden utilizar los descriptores de blobs para la identificación de picos en el contexto de la segmentación. Los descriptores de blob también se utilizan con frecuencia como bloques de construcción fundamentales en los campos del análisis de texturas y el reconocimiento de texturas. Recientemente, los descriptores de blob se han utilizado ampliamente para indicar la presencia de características de imagen informativas para la detección de objetos basada en la apariencia basada en estadísticas de imágenes locales, y como puntos de interés para la coincidencia estéreo de línea de base amplia. De manera similar, la detección de crestas se puede utilizar para indicar la existencia de elementos lineales.
El laplaciano de la distribución gaussiana fue la base de uno de los primeros y más utilizados detectores de blobs (LoG).
Dada una imagen de entrada f(x,y) , se utiliza un kernel gaussiano para convolucionar esta imagen.
{\displaystyle g(x,y,t)={\frac {1}{2\pi t}}e^{-{\frac {x^{2}+y^{2}}{2t}}}}a una escala determinada t para dar una representación del espacio de escala
L(x,y;t)\ =g(x,y,t)*f(x,y).
A continuación, el resultado de una operación laplaciana
\nabla ^{2}L=L_{xx}+L_{yy}se calcula, lo que normalmente da como resultado respuestas positivas fuertes para manchas oscuras de radio {\textstyle r^{2}=2t} (para una imagen bidimensional, {\textstyle r^{2}=dt} para una {\textstyle d} imagen -dimensional) y respuestas negativas fuertes para manchas brillantes de tamaño similar.
Sin embargo, cuando se utiliza este operador a una sola escala, el problema fundamental es que la reacción del operador depende en gran medida de la correlación entre los tamaños de las estructuras de blob en el dominio de la imagen y el tamaño gaussiano del kernel de presuavizado.
En el dominio de la imagen, la captura automática de blobs de diferentes tamaños (desconocidos), Por lo tanto, es importante tener en cuenta varios niveles a la vez.
Teniendo en cuenta el operador laplaciano normalizado a escala, es una técnica sencilla construir un detector de blobs multiescala con selección automática de escalas.
{\displaystyle \nabla _{\mathrm {norm} }^{2}L=t\,(L_{xx}+L_{yy})}también, para identificar los extremos de escala-espacio, que son puntos que son simultáneamente máximos/mínimos locales de {\displaystyle \nabla _{\mathrm {norm} }^{2}L} con respecto tanto al espacio como a la escala (Lindeberg 1994, 1998).
Por lo tanto, dada una imagen de entrada bidimensional discreta, f(x,y) se calcula un volumen de espacio de escala discreto tridimensional L(x,y,t) y un punto se considera una mancha brillante (oscura) si el valor en este punto es mayor (menor) que el valor en todos sus 26 vecinos.
De este modo, la selección simultánea de puntos de interés ({\hat {x}},{\hat {y}}) y escalas {\hat {t}} se realiza de acuerdo con
{\displaystyle ({\hat {x}},{\hat {y}};{\hat {t}})=\operatorname {argmaxminlocal} _{(x,y;t)}((\nabla _{\mathrm {norm} }^{2}L)(x,y;t))}.
Tenga en cuenta que este concepto de blob define el término de una manera operativa simple y matemáticamente precisa, lo que conduce a una técnica de identificación de blob que es eficaz y confiable.
Los blobs definidos a partir de los máximos del espacio de escala del operador laplaciano normalizado tienen varias cualidades fundamentales, como las respuestas que son invariantes a la traducción, las transformaciones de las imágenes mediante la rotación y el cambio de tamaño.
Por lo tanto, si se asume un máximo de espacio de escala en un punto, (x_{0},y_{0};t_{0}) entonces bajo un cambio de escala de la imagen por un factor de escala s , habrá un máximo de espacio de escala en {\displaystyle \left(sx_{0},sy_{0};s^{2}t_{0}\right)} en la imagen reescalada (Lindeberg 1998).
Debido a su cualidad extremadamente práctica, el tema de la detección de manchas laplacianas puede ampliarse para incluir extremos locales en la distribución normalizada de escala. Otras aplicaciones de Laplacian incluyen la selección de escalas, por ejemplo, al detectar esquinas, el monitoreo consciente de la escala de características (Bretzner y Lindeberg 1998), en la coincidencia de imágenes y el reconocimiento de objetos utilizando la transformación de características invariantes de escala (Lowe, 2004) y otros descriptores de imágenes.
Tanto el operador laplaciano como otros detectores similares de puntos de interés en el espacio de escala tienen sus características de selección de escala estudiadas en (Lindeberg 2013a). Se ha demostrado que otros detectores de puntos de interés de espacio de escala, como el determinante del operador hessiano, superan al operador laplaciano y su aproximación de diferencia de gaussianos en (Lindeberg 2013b, 2015) cuando se trata de coincidencia basada en imágenes utilizando descriptores de imagen locales similares a SIFT.
A partir del hecho de que la representación del espacio de escala L(x,y,t) satisface la ecuación de difusión
\partial _{t}L={\frac {1}{2}}\nabla ^{2}Lse deduce que el laplaciano del operador gaussiano \nabla ^{2}L(x,y,t) también se puede calcular como el caso límite de la diferencia entre dos imágenes suavizadas gaussianas (representaciones de espacio de escala)
{\displaystyle \nabla _{\mathrm {norm} }^{2}L(x,y;t)\approx {\frac {t}{\Delta t}}\left(L(x,y;t+\Delta t)-L(x,y;t)\right)}.
Este método a menudo se conoce como la diferencia del método gaussiano (DoG) en el campo de la visión por computadora. Aunque hay algunas diferencias sutiles, este operador se puede considerar como una aproximación del operador laplaciano y comparte muchas de sus propiedades. Véase (Lindeberg 2012, 2015) para una relación explícita entre el operador de diferencia de gaussiano y el detector de manchas laplacianas normalizado a escala. Las manchas también se pueden identificar a partir de los extremos de las diferencias de los gaussianos en el espacio de escala. El algoritmo SIFT (Scale-Invariant Feature Transform) es una implementación de esta estrategia; para más información, véase Lowe (2004).
Teniendo en cuenta el determinante hessiano después de escalarlo, podemos, también denominado operador de Monge-Ampère,
{\displaystyle \det H_{\mathrm {norm} }L=t^{2}\left(L_{xx}L_{yy}-L_{xy}^{2}\right)}donde HL denota la matriz hessiana de la representación del espacio de escala L y luego detectando los máximos del espacio de escala de este operador se obtiene otro detector de blob diferencial sencillo con selección automática de escala que también responde a las sillas de montar (Lindeberg 1994, 1998)
{\displaystyle ({\hat {x}},{\hat {y}};{\hat {t}})=\operatorname {argmaxlocal} _{(x,y;t)}((\det H_{\mathrm {norm} }L)(x,y;t))}.
Los puntos ({\hat {x}},{\hat {y}}) y escalas de blob {\hat {t}} también se definen a partir de definiciones geométricas diferenciales operacionales que conducen a descriptores de blob que son covariantes con traslaciones, transformaciones de imágenes por medio de rotación y cambio de tamaño.
Con respecto a la selección de escalas, las cualidades de selección de escalas para transformaciones afines no euclidianas se mejoran marginalmente para blobs construidos a partir de extremos del espacio de escala del determinante de la matriz hessiana (DoH) (Lindeberg 1994), 1998, 2015).
El descriptor SURF (Bay et al.) utiliza el determinante normalizado de escala de la matriz hessiana calculado a partir de ondículas de Haar como su operador de punto de interés fundamental.
) en 2006 para su uso en el reconocimiento de patrones y la coincidencia de imágenes.
El determinante del operador hessiano tiene capacidades de selección de escala superiores bajo transformaciones de imagen afines que el operador laplaciano, como se muestra en un análisis completo de sus respectivas propiedades de selección publicado en (Lindeberg 2013a). Para la coincidencia basada en imágenes con descriptores de imagen locales similares a SIFT o SURF, se ha demostrado en (Lindeberg 2013b, 2015) que el determinante del operador hessiano funciona significativamente mejor que el operador laplaciano o su aproximación de diferencia de gaussianos, así como mejor que los operadores de Harris o Harris-Laplace, lo que conduce a valores de eficiencia más altos y puntuaciones de precisión 1 más bajas.
Para la detección de blobs, se ha desarrollado un operador híbrido entre el laplaciano y el determinante de la matriz hessiana, donde el determinante de la matriz hessiana se utiliza para la selección espacial y el laplaciano normalizado a escala se utiliza para la selección de escalas. (Mikolajczyk y Schmid 2004)
:
Este operador ha encontrado aplicación en el análisis de texturas, el reconocimiento de objetos y la coincidencia de imágenes.
Estos detectores de blobs con selección automática de escalas producen descriptores de blobs que son robustos frente a transformaciones espaciales como traslaciones, rotaciones y reescalamientos uniformes. Sin embargo, las distorsiones de perspectiva también están presentes en las imágenes que componen la entrada a un sistema de visión artificial. La creación de un