Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Detección de manchas: Revelando patrones en datos visuales
Detección de manchas: Revelando patrones en datos visuales
Detección de manchas: Revelando patrones en datos visuales
Libro electrónico150 páginas1 hora

Detección de manchas: Revelando patrones en datos visuales

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

¿Qué es la detección de manchas?


En el campo de la visión por computadora, los algoritmos de detección de manchas están diseñados para identificar áreas dentro de una imagen digital que son distintas de las regiones que las rodean en términos de características como el brillo o las características del color. En un sentido más casual, una mancha es una región de una imagen en la que ciertas cualidades permanecen constantes o casi constantes. Todos los puntos que componen un blob pueden considerarse comparables entre sí de alguna manera. El uso de convolución es el método que se utiliza con más frecuencia para la detección de blobs.


Cómo se beneficiará


(I) Información y validaciones sobre los siguientes temas:


Capítulo 1: Detección de manchas


Capítulo 2: Detección de bordes


Capítulo 3: Detector de bordes Canny


Capítulo 4 : Transformación de características invariantes de escala


Capítulo 5: Espacio de escala


Capítulo 6: Característica (visión por computadora)


Capítulo 7: Diferencia de gaussianas


Capítulo 8: Detección de esquinas


Capítulo 9: Detección de crestas


Capítulo 10: Operador de función invariante de escala


(II) Respondiendo a las principales preguntas del público sobre la detección de blobs.


(III) Ejemplos del mundo real sobre el uso de la detección de blobs en muchos campos.


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de Detección de Blob.


 


 

IdiomaEspañol
Fecha de lanzamiento1 may 2024
Detección de manchas: Revelando patrones en datos visuales

Lee más de Fouad Sabry

Autores relacionados

Relacionado con Detección de manchas

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Detección de manchas

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Detección de manchas - Fouad Sabry

    Capítulo 1: Detección de blobs

    El objetivo de las técnicas de detección de manchas en visión artificial es identificar áreas de una imagen digital que tienen características significativamente diferentes de su entorno. Se puede considerar que todos los puntos dentro de una mancha son algo similares entre sí, por lo tanto, el término mancha se usa para describir un área de una imagen donde ciertas cualidades son constantes o esencialmente constantes. La convolución es la técnica más utilizada para la detección de blobs.

    Los dos tipos principales de detectores de blobs son los enfoques diferenciales I, que se basan en derivadas de la función con respecto a la posición, y (ii) los métodos extremos locales, que se centran en la detección de los máximos y mínimos locales de la función. Estos detectores también se conocen como operadores de puntos de interés u operadores de regiones de interés de acuerdo con la nomenclatura más actualizada en el campo (véase también detección de puntos de interés y detección de esquinas).

    Hay varias razones para investigar y refinar los detectores de blobs. La motivación principal es complementar los datos proporcionados por los detectores de bordes y esquinas proporcionando más información sobre las regiones. En los primeros estudios de campo, se utilizó la detección de manchas para aislar las secciones relevantes. Estos puntos en la imagen podrían servir como indicadores de objetos o partes de objetos con el fin de reconocer y/o rastrear objetos. El análisis de histogramas es solo una de las áreas en las que se pueden utilizar los descriptores de blobs para la identificación de picos en el contexto de la segmentación. Los descriptores de blob también se utilizan con frecuencia como bloques de construcción fundamentales en los campos del análisis de texturas y el reconocimiento de texturas. Recientemente, los descriptores de blob se han utilizado ampliamente para indicar la presencia de características de imagen informativas para la detección de objetos basada en la apariencia basada en estadísticas de imágenes locales, y como puntos de interés para la coincidencia estéreo de línea de base amplia. De manera similar, la detección de crestas se puede utilizar para indicar la existencia de elementos lineales.

    El laplaciano de la distribución gaussiana fue la base de uno de los primeros y más utilizados detectores de blobs (LoG).

    Dada una imagen de entrada f(x,y) , se utiliza un kernel gaussiano para convolucionar esta imagen.

    {\displaystyle g(x,y,t)={\frac {1}{2\pi t}}e^{-{\frac {x^{2}+y^{2}}{2t}}}}

    a una escala determinada t para dar una representación del espacio de escala

    L(x,y;t)\ =g(x,y,t)*f(x,y)

    .

    A continuación, el resultado de una operación laplaciana

    \nabla ^{2}L=L_{xx}+L_{yy}

    se calcula, lo que normalmente da como resultado respuestas positivas fuertes para manchas oscuras de radio {\textstyle r^{2}=2t} (para una imagen bidimensional, {\textstyle r^{2}=dt} para una {\textstyle d} imagen -dimensional) y respuestas negativas fuertes para manchas brillantes de tamaño similar.

    Sin embargo, cuando se utiliza este operador a una sola escala, el problema fundamental es que la reacción del operador depende en gran medida de la correlación entre los tamaños de las estructuras de blob en el dominio de la imagen y el tamaño gaussiano del kernel de presuavizado.

    En el dominio de la imagen, la captura automática de blobs de diferentes tamaños (desconocidos), Por lo tanto, es importante tener en cuenta varios niveles a la vez.

    Teniendo en cuenta el operador laplaciano normalizado a escala, es una técnica sencilla construir un detector de blobs multiescala con selección automática de escalas.

    {\displaystyle \nabla _{\mathrm {norm} }^{2}L=t\,(L_{xx}+L_{yy})}

    también, para identificar los extremos de escala-espacio, que son puntos que son simultáneamente máximos/mínimos locales de {\displaystyle \nabla _{\mathrm {norm} }^{2}L} con respecto tanto al espacio como a la escala (Lindeberg 1994, 1998).

    Por lo tanto, dada una imagen de entrada bidimensional discreta, f(x,y) se calcula un volumen de espacio de escala discreto tridimensional L(x,y,t) y un punto se considera una mancha brillante (oscura) si el valor en este punto es mayor (menor) que el valor en todos sus 26 vecinos.

    De este modo, la selección simultánea de puntos de interés ({\hat {x}},{\hat {y}}) y escalas {\hat {t}} se realiza de acuerdo con

    {\displaystyle ({\hat {x}},{\hat {y}};{\hat {t}})=\operatorname {argmaxminlocal} _{(x,y;t)}((\nabla _{\mathrm {norm} }^{2}L)(x,y;t))}

    .

    Tenga en cuenta que este concepto de blob define el término de una manera operativa simple y matemáticamente precisa, lo que conduce a una técnica de identificación de blob que es eficaz y confiable.

    Los blobs definidos a partir de los máximos del espacio de escala del operador laplaciano normalizado tienen varias cualidades fundamentales, como las respuestas que son invariantes a la traducción, las transformaciones de las imágenes mediante la rotación y el cambio de tamaño.

    Por lo tanto, si se asume un máximo de espacio de escala en un punto, (x_{0},y_{0};t_{0}) entonces bajo un cambio de escala de la imagen por un factor de escala s , habrá un máximo de espacio de escala en {\displaystyle \left(sx_{0},sy_{0};s^{2}t_{0}\right)} en la imagen reescalada (Lindeberg 1998).

    Debido a su cualidad extremadamente práctica, el tema de la detección de manchas laplacianas puede ampliarse para incluir extremos locales en la distribución normalizada de escala. Otras aplicaciones de Laplacian incluyen la selección de escalas, por ejemplo, al detectar esquinas, el monitoreo consciente de la escala de características (Bretzner y Lindeberg 1998), en la coincidencia de imágenes y el reconocimiento de objetos utilizando la transformación de características invariantes de escala (Lowe, 2004) y otros descriptores de imágenes.

    Tanto el operador laplaciano como otros detectores similares de puntos de interés en el espacio de escala tienen sus características de selección de escala estudiadas en (Lindeberg 2013a). Se ha demostrado que otros detectores de puntos de interés de espacio de escala, como el determinante del operador hessiano, superan al operador laplaciano y su aproximación de diferencia de gaussianos en (Lindeberg 2013b, 2015) cuando se trata de coincidencia basada en imágenes utilizando descriptores de imagen locales similares a SIFT.

    A partir del hecho de que la representación del espacio de escala L(x,y,t) satisface la ecuación de difusión

    \partial _{t}L={\frac {1}{2}}\nabla ^{2}L

    se deduce que el laplaciano del operador gaussiano \nabla ^{2}L(x,y,t) también se puede calcular como el caso límite de la diferencia entre dos imágenes suavizadas gaussianas (representaciones de espacio de escala)

    {\displaystyle \nabla _{\mathrm {norm} }^{2}L(x,y;t)\approx {\frac {t}{\Delta t}}\left(L(x,y;t+\Delta t)-L(x,y;t)\right)}

    .

    Este método a menudo se conoce como la diferencia del método gaussiano (DoG) en el campo de la visión por computadora. Aunque hay algunas diferencias sutiles, este operador se puede considerar como una aproximación del operador laplaciano y comparte muchas de sus propiedades. Véase (Lindeberg 2012, 2015) para una relación explícita entre el operador de diferencia de gaussiano y el detector de manchas laplacianas normalizado a escala. Las manchas también se pueden identificar a partir de los extremos de las diferencias de los gaussianos en el espacio de escala. El algoritmo SIFT (Scale-Invariant Feature Transform) es una implementación de esta estrategia; para más información, véase Lowe (2004).

    Teniendo en cuenta el determinante hessiano después de escalarlo, podemos, también denominado operador de Monge-Ampère,

    {\displaystyle \det H_{\mathrm {norm} }L=t^{2}\left(L_{xx}L_{yy}-L_{xy}^{2}\right)}

    donde HL denota la matriz hessiana de la representación del espacio de escala L y luego detectando los máximos del espacio de escala de este operador se obtiene otro detector de blob diferencial sencillo con selección automática de escala que también responde a las sillas de montar (Lindeberg 1994, 1998)

    {\displaystyle ({\hat {x}},{\hat {y}};{\hat {t}})=\operatorname {argmaxlocal} _{(x,y;t)}((\det H_{\mathrm {norm} }L)(x,y;t))}

    .

    Los puntos ({\hat {x}},{\hat {y}}) y escalas de  blob {\hat {t}} también se definen a partir de definiciones geométricas diferenciales operacionales que conducen a descriptores de blob que son covariantes con traslaciones, transformaciones de imágenes por medio de rotación y cambio de tamaño.

    Con respecto a la selección de escalas, las cualidades de selección de escalas para transformaciones afines no euclidianas se mejoran marginalmente para blobs construidos a partir de extremos del espacio de escala del determinante de la matriz hessiana (DoH) (Lindeberg 1994), 1998, 2015).

    El descriptor SURF (Bay et al.) utiliza el determinante normalizado de escala de la matriz hessiana calculado a partir de ondículas de Haar como su operador de punto de interés fundamental.

    ) en 2006 para su uso en el reconocimiento de patrones y la coincidencia de imágenes.

    El determinante del operador hessiano tiene capacidades de selección de escala superiores bajo transformaciones de imagen afines que el operador laplaciano, como se muestra en un análisis completo de sus respectivas propiedades de selección publicado en (Lindeberg 2013a). Para la coincidencia basada en imágenes con descriptores de imagen locales similares a SIFT o SURF, se ha demostrado en (Lindeberg 2013b, 2015) que el determinante del operador hessiano funciona significativamente mejor que el operador laplaciano o su aproximación de diferencia de gaussianos, así como mejor que los operadores de Harris o Harris-Laplace, lo que conduce a valores de eficiencia más altos y puntuaciones de precisión 1 más bajas.

    Para la detección de blobs, se ha desarrollado un operador híbrido entre el laplaciano y el determinante de la matriz hessiana, donde el determinante de la matriz hessiana se utiliza para la selección espacial y el laplaciano normalizado a escala se utiliza para la selección de escalas. (Mikolajczyk y Schmid 2004):

    {\displaystyle ({\hat {x}},{\hat {y}})=\operatorname {argmaxlocal} _{(x,y)}((\det HL)(x,y;t))}{\displaystyle {\hat {t}}=\operatorname {argmaxminlocal} _{t}((\nabla _{\mathrm {norm} }^{2}L)({\hat {x}},{\hat {y}};t))}

    Este operador ha encontrado aplicación en el análisis de texturas, el reconocimiento de objetos y la coincidencia de imágenes.

    Estos detectores de blobs con selección automática de escalas producen descriptores de blobs que son robustos frente a transformaciones espaciales como traslaciones, rotaciones y reescalamientos uniformes. Sin embargo, las distorsiones de perspectiva también están presentes en las imágenes que componen la entrada a un sistema de visión artificial. La creación de un

    ¿Disfrutas la vista previa?
    Página 1 de 1