Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Contorno activo: Avances en la visión por computadora con técnicas de contorno activo
Contorno activo: Avances en la visión por computadora con técnicas de contorno activo
Contorno activo: Avances en la visión por computadora con técnicas de contorno activo
Libro electrónico192 páginas1 hora

Contorno activo: Avances en la visión por computadora con técnicas de contorno activo

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

Qué es Contorno activo 


El modelo de contorno activo, al que a menudo se hace referencia como serpientes, es un marco en el campo de la visión por computadora que fue introducido inicialmente por Michael Kass. , Andrew Witkin y Demetri Terzopoulos. Su finalidad es delinear un objeto a partir de una imagen bidimensional que puede contener ruido. El seguimiento de objetos, el reconocimiento de formas, la segmentación, la detección de bordes y la coincidencia estéreo son sólo algunas de las aplicaciones que hacen un uso extensivo de las serpientes. El modelo de serpientes se está volviendo cada vez más popular en el campo de la visión por computadora.


Cómo se beneficiará


(I) Información y validaciones sobre los siguientes temas :


Capítulo 1: Modelo de contorno activo


Capítulo 2: Teorema de Stokes generalizado


Capítulo 3: Flujo potencial


Capítulo 4: Del


Capítulo 5: Multiplicador de Lagrange


Capítulo 6: Cálculo de variaciones


Capítulo 7: Operador de Laplace


Capítulo 8: Función de Green


Capítulo 9: Derivada covariante


Capítulo 10: Cálculo tensorial


(II) Respondiendo a las principales preguntas del público sobre el contorno activo.


( III) Ejemplos del mundo real sobre el uso del contorno activo en muchos campos.


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de Active Contour.


 


 

IdiomaEspañol
Fecha de lanzamiento30 abr 2024
Contorno activo: Avances en la visión por computadora con técnicas de contorno activo

Lee más de Fouad Sabry

Autores relacionados

Relacionado con Contorno activo

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Contorno activo

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Contorno activo - Fouad Sabry

    Capítulo 1: Modelo de contorno activo

    Para extraer el contorno de un objeto de una imagen 2D que puede estar contaminada con ruido, los investigadores de visión por computadora Michael Kass, Andrew Witkin y Demetri Terzopoulos desarrollaron el modelo de contorno activo, a menudo conocido como serpientes. Las aplicaciones de visión por computadora, como el seguimiento de objetos, el reconocimiento de formas, la segmentación, la detección de bordes y la coincidencia estéreo, hacen un uso extensivo del modelo de serpientes.

    Una serpiente es una ranura deformable que minimiza su energía mientras es empujada y tirada por las fuerzas de restricción e imagen a lo largo de los contornos del objeto y las fuerzas internas que actúan para evitar una mayor deformación. Hacer coincidir un modelo deformable con una imagen minimizando la energía puede considerarse como una estrategia general, y las serpientes pueden verse como un caso específico de esto. El modelo de forma activa es una representación discreta de esta estrategia en dos dimensiones; Hace uso del modelo de distribución de puntos para limitar las formas que se pueden usar a las de un dominio específico, que a su vez se aprende de un conjunto de entrenamiento.

    Dado que el uso de serpientes para descubrir contornos en fotos implica conocer de antemano la forma del contorno prevista, no es una solución completa al problema. En su lugar, se basan en la entrada externa, ya sea del usuario, un proceso de comprensión de imágenes externo o incluso solo datos de imágenes vecinas en el tiempo o la ubicación.

    Los límites de la imagen se describen mediante modelos de contorno en visión artificial. Por ejemplo, las serpientes sobresalen en desafíos en los que la forma del borde se entiende a grandes rasgos. Dado que son un modelo flexible, las serpientes son resistentes a las variaciones y al ruido cuando participan en la coincidencia estéreo y el seguimiento del movimiento. Al omitir la información de los bordes, el enfoque también es capaz de localizar contornos ilusorios en la imagen.

    Hay muchos beneficios de usar serpientes en lugar de los métodos tradicionales de extracción de características:

    Buscan la condición de la zona cero de una manera autónoma y variable.

    La serpiente se ve afectada intuitivamente por las influencias visuales del mundo exterior.

    La introducción de la sensibilidad de escala en la función de energía de la imagen mediante el uso de suavizado gaussiano.

    Puede usarlos para controlar los elementos en movimiento.

    Los principales problemas de las serpientes normales son

    Debido a su susceptibilidad a los estados mínimos locales, los métodos de recocido simulado son útiles para evitar resultados indeseables.

    Durante la minimización de la energía a lo largo de todo el contorno, a menudo se pasan por alto los pequeños detalles.

    El éxito de la política de convergencia determina su precisión.

    Una serpiente elástica simple se define por un conjunto de n puntos {\mathbf v}_{i} para {\displaystyle i=0,\ldots ,n-1} , el término de energía elástica interna {\displaystyle E_{\text{internal}}} , y el término de energía basado en el borde externo {\displaystyle E_{\text{external}}} .

    El término de energía interna está ahí para evitar que la serpiente se deforme permanentemente, la función del término de energía externa es regular el grado en que el contorno se superpone sobre la imagen.

    La energía externa suele ser una combinación de las fuerzas debidas a la propia imagen {\displaystyle E_{\text{image}}} y las fuerzas de restricción introducidas por el usuario {\displaystyle E_{\text{con}}}

    Cuando sumamos las energías internas y externas de la serpiente, obtenemos su función energética.

    {\displaystyle E_{\text{snake}}^{*}=\int \limits _{0}^{1}E_{\text{snake}}(\mathbf {v} (s))\,ds=\int \limits _{0}^{1}(E_{\text{internal}}(\mathbf {v} (s))+E_{\text{image}}(\mathbf {v} (s))+E_{\text{con}}(\mathbf {v} (s)))\,ds}

    La energía interna de la serpiente está compuesta por la continuidad del contorno {\displaystyle E_{\text{cont}}} y la suavidad del contorno {\displaystyle E_{\text{curv}}} .

    {\displaystyle E_{\text{internal}}=E_{\text{cont}}+E_{\text{curv}}}

    Puede elaborar esto de la siguiente manera:

    {\displaystyle E_{\text{internal}}={\frac {1}{2}}(\alpha \,\!(s)\left|\mathbf {v} _{s}(s)\right\vert ^{2})+{\frac {1}{2}}(\beta \,\!(s)\left|\mathbf {v} _{ss}(s)\right\vert ^{2})={\frac {1}{2}}{\bigg (}\alpha \,\!(s)\left\|{\frac {d{\bar {v}}}{ds}}(s)\right\Vert ^{2}+\beta \,\!(s)\left\|{\frac {d^{2}{\bar {v}}}{ds^{2}}}(s)\right\Vert ^{2}{\bigg )}}

    donde \alpha (s) y \beta (s) son ponderaciones definidas por el usuario; Estos determinan cuánto peso se le da al estiramiento y la curvatura de la serpiente por la función de energía interna, respectivamente, y regulan el grado en que la forma de la serpiente está restringida.

    En la práctica, un peso grande \alpha (s) para el término de continuidad penaliza los cambios en las distancias entre puntos en el contorno.

    Un peso grande \beta (s) para el término de suavidad penaliza las oscilaciones en el contorno y hará que el contorno actúe como una placa delgada.

    El nivel de energía en una imagen está relacionado con sus características específicas. Este es un lugar popular para realizar ajustes en las estrategias derivadas. Existe una amplia gama de opciones para procesar tanto las características de la imagen como las imágenes completas.

    Para una imagen I(x,y) , líneas, aristas y una finalidad que existe en la imagen, el modelo general de energía de la imagen es

    {\displaystyle E_{\text{image}}=w_{\text{line}}E_{\text{line}}+w_{\text{edge}}E_{\text{edge}}+w_{\text{term}}E_{\text{term}},}

    donde {\displaystyle w_{\text{line}}} , {\displaystyle w_{\text{edge}}} , {\displaystyle w_{\text{term}}} son los pesos de estas características sobresalientes.

    Aumentar el peso de un elemento llamativo significa que tendrá un impacto más significativo en la fuerza general de la imagen.

    Es posible describir la intensidad de la imagen, o la línea funcional, como

    {\displaystyle E_{\text{line}}=I(x,y)}

    El signo de {\displaystyle w_{\text{line}}} determinará si la línea será atraída por líneas oscuras o líneas claras.

    La función de línea se oculta hasta que se suaviza la imagen o se reduce el ruido.

    {\displaystyle E_{\text{line}}=\operatorname {filter} (I(x,y))}

    El degradado de la imagen se utiliza como el borde funcional. Un ejemplo de esto en la práctica es

    {\displaystyle E_{\text{edge}}=-\left|\nabla I(x,y)\right\vert ^{2}.}

    Es posible que una serpiente converja erróneamente a un mínimo local si comienza lejos del contorno del objeto objetivo. Para evitar estos mínimos locales, podemos aplicar la continuación del espacio de escala. Para ello, se utiliza un filtro de desenfoque en la imagen, y el grado de desenfoque disminuye a medida que el cálculo continúa mejorando el ajuste de la serpiente. La continuación del espacio de escala se utiliza en el funcional de energía para producir

    {\displaystyle E_{\text{edge}}=-\left|G_{\sigma }\cdot \nabla ^{2}I\right\vert ^{2}}

    donde {\displaystyle G_{\sigma }} es un gaussiano con desviación estándar \sigma .

    Los mínimos de esta función recaen en los cruces por cero {\displaystyle G_{\sigma }\,\nabla ^{2}I} que definen las aristas según la teoría de Marr-Hildreth.

    Es posible identificar las esquinas y los bordes de la imagen midiendo la curvatura de las líneas horizontales y verticales en una imagen que se ha suavizado parcialmente.

    Aplicando esta estrategia, sea C(x,y) la imagen suavizada por

    {\displaystyle C(x,y)=G_{\sigma }\cdot I(x,y)}

    con ángulo de gradiente

    {\displaystyle \theta =\arctan \left({\frac {C_{y}}{C_{x}}}\right),}

    vectores paralelos a la dirección del gradiente

    {\displaystyle \mathbf {n} =(\cos \theta ,\sin \theta ),}

    y vectores que son ortogonales al gradiente

    {\displaystyle \mathbf {n} _{\perp }=(-\sin \theta ,\cos \theta ).}

    Una expresión para el funcional de terminación de energía es

    {\displaystyle E_{\text{term}}={\partial \theta \over \partial n_{\perp }}={\partial ^{2}C/\partial n_{\perp }^{2} \over \partial C/\partial n}={{C_{yy}C_{x}^{2}-2C_{xy}C_{x}C_{y}+C_{xx}C_{y}^{2}} \over (C_{x}^{2}+C_{y}^{2})^{3/2}}}

    Algunos sistemas, como la primera implementación de serpientes, serpientes controlables por el usuario que respondían a la entrada, tanto en términos de su posicionamiento inicial como de sus necesidades energéticas.

    Dicha energía de restricción E_{{con}} se puede utilizar para guiar interactivamente a las serpientes hacia o lejos de características particulares.

    Asumiendo una serpiente a primera vista, reduciendo iterativamente la función energética de la serpiente.

    Una de las optimizaciones más sencillas que se pueden aplicar para reducir la energía de la serpiente es la minimización del descenso del gradiente.

    Cada iteración da un paso en el gradiente negativo del punto con un tamaño de paso controlado \gamma para encontrar los mínimos locales.

    Es posible aplicar esta minimización de gradiente-descenso como

    {\displaystyle {\bar {v}}_{i}\leftarrow {\bar {v}}_{i}+F_{\text{snake}}({\bar {v}}_{i})}

    Donde {\displaystyle F_{\text{snake}}({\bar {v}}_{i})} es la fuerza sobre la serpiente, en la que el opuesto del gradiente del campo de energía sirve como definición.

    {\displaystyle F_{\text{snake}}({\bar {v}}_{i})=-\nabla E_{\text{snake}}({\bar {v}}_{i})=-{\Bigg (}w_{\text{internal}}\,\nabla E_{\text{internal}}({\bar {v}}_{i})+w_{\text{external}}\,\nabla E_{\text{external}}({\bar {v}}_{i}){\Bigg )}}

    Suponiendo que los pesos \alpha (s) y \beta (s) son constantes con respecto a s , Es posible reducir este procedimiento iterativo a

    {\displaystyle {\bar {v}}_{i}\leftarrow {\bar {v}}_{i}-\gamma {\Bigg \{}w_{\text{internal}}{\bigg [}\alpha {\frac {\partial ^{2}{\bar {v}}}{\partial s^{2}}}({\bar {v}}_{i})+\beta {\frac {\partial ^{4}{\bar {v}}}{\partial s^{4}}}({\bar {v}}_{i}){\bigg ]}+\nabla E_{\text{ext}}({\bar {v}}_{i}){\Bigg \}}}

    En la práctica, las imágenes tienen una resolución finita y solo se pueden integrar en pasos de tiempo finitos \tau .

    Como tal, para las aplicaciones de serpientes en el mundo real, se necesitan aproximaciones discretas.

    Las manchas discretas en la serpiente se pueden usar como aproximaciones a la función energética de la serpiente.

    {\displaystyle E_{\text{snake}}^{*}\approx \sum _{1}^{n}E_{\text{snake}}({\bar {v}}_{i})}

    Por lo tanto, las fuerzas de la serpiente se pueden calcular aproximadamente como

    {\displaystyle F_{\text{snake}}^{*}\approx -\sum _{i=1}^{n}\nabla E_{\text{snake}}({\bar {v}}_{i}).}

    La aproximación de gradiente se puede realizar mediante cualquier enfoque de aproximación finita con respecto a s, como la diferencia finita.

    Cuando se tiene en cuenta el tiempo discreto en el método, es posible que se introduzcan actualizaciones en las que la serpiente se mueva más allá de los mínimos a los que se siente atraída, lo que lleva a oscilaciones alrededor de los mínimos o a que se encuentre un nuevo mínimo.

    Ajustar el paso de tiempo para que el tamaño del paso nunca sea superior a un píxel debido a las fuerzas de la imagen puede evitar que esto suceda. Las actualizaciones serán impulsadas principalmente por energías internas en zonas de baja energía.

    Otra opción es normalizar las fuerzas de la imagen en cada etapa de modo que solo cambien la apariencia de la serpiente en un píxel. Una formulación equivalente sería

    {\displaystyle F_{\text{image}}=-k{\frac {\nabla E_{\text{image}}}{\|\nabla E_{\text{image}}\|}}}

    donde \tau k está cerca del valor del tamaño de píxel.

    Esto evita que las energías internas dominantes se originen al afinar el paso de tiempo.

    En una imagen continua, puede haber cruces por cero entre las energías que no corresponden a píxeles discretos de la imagen. La posición de una serpiente en este cruce por cero se balancearía hacia arriba y hacia abajo entre los dos píxeles adyacentes. El uso de

    ¿Disfrutas la vista previa?
    Página 1 de 1