Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Cortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora
Cortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora
Cortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora
Libro electrónico96 páginas1 hora

Cortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

¿Qué son los cortes de gráficos en visión por computadora?


Tal como se aplica en el campo de la visión por computadora, la optimización del corte de gráficos se puede emplear para resolver de manera eficiente una amplia variedad de problemas de visión por computadora de bajo nivel. problemas, como el suavizado de imágenes, el problema de la correspondencia estéreo, la segmentación de imágenes, la cosegmentación de objetos y muchos otros problemas de visión por computadora que pueden formularse en términos de minimización de energía. Muchos de estos problemas de minimización de energía se pueden aproximar resolviendo un problema de flujo máximo en un gráfico. En la mayoría de las formulaciones de este tipo de problemas en visión por computadora, la solución de energía mínima corresponde a la estimación máxima a posteriori de una solución. Aunque muchos algoritmos de visión por computadora implican cortar un gráfico, el término "cortes de gráfico" se aplica específicamente a aquellos modelos que emplean una optimización de flujo máximo/corte mínimo.


Cómo se beneficiará


(I) Insights y validaciones sobre los siguientes temas:


Capítulo 1: Cortes de gráficos en visión por computadora


Capítulo 2: Max-flow min -teorema de corte


Capítulo 3: Segmentación de imágenes


Capítulo 4: Corte (teoría de grafos)


Capítulo 5: Corte mínimo


Capítulo 6: Cuenca hidrográfica (procesamiento de imágenes)


Capítulo 7: GrabCut


Capítulo 8: Algoritmo de caminante aleatorio


Capítulo 9: Optimización del corte de gráficos


Capítulo 10: Video matting


(II) Respondiendo a las principales preguntas del público sobre cortes de gráficos de visión por computadora.


(III) Ejemplos del mundo real para el uso de cortes de gráficos de visión por computadora en muchos campos.


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básicos. para cualquier tipo de cortes de gráficos de visión por computadora.


 


 

IdiomaEspañol
Fecha de lanzamiento11 may 2024
Cortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora

Lee más de Fouad Sabry

Relacionado con Cortes de gráficos de visión por computadora

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Cortes de gráficos de visión por computadora

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Cortes de gráficos de visión por computadora - Fouad Sabry

    Capítulo 1: Cortes de grafos en visión artificial

    La optimización del corte de grafos, cuando se aplica al tema de la visión por computadora, se puede utilizar para abordar una amplia gama de problemas de visión por computadora de bajo nivel (también conocidos como problemas de visión temprana) de una manera efectiva y eficiente (y por lo tanto, por el teorema de corte mínimo de flujo máximo, definir un corte mínimo del gráfico). La mayoría de los enfoques para formular problemas de este tipo en visión artificial coinciden en que la respuesta con la menor cantidad de gasto energético corresponde a la estimación a posteriori más alta de una solución. Aunque muchos algoritmos de visión artificial incluyen el corte de un gráfico (por ejemplo, cortes normalizados), la frase cortes de gráfico se refiere particularmente a aquellos modelos que utilizan una optimización de flujo máximo/corte mínimo. Esto se debe a que muchos métodos de visión artificial implican cortar un grafo (otros algoritmos de corte de grafos pueden considerarse como algoritmos de partición de grafos).

    Con este método, los problemas binarios, como la eliminación de ruido de una imagen binaria, se pueden resolver con exactitud; los problemas en los que los píxeles se pueden etiquetar con más de dos etiquetas diferentes, como la correspondencia estéreo o la eliminación de ruido de una imagen en escala de grises, no se pueden resolver exactamente; Sin embargo, las soluciones que se producen suelen estar muy cerca del óptimo global.

    En su estudio histórico, Greig, Porteous y Seheult de la Universidad de Durham fueron los primeros en aplicar la idea de los cortes de grafos al proceso de optimización de la visión por computadora. Los cortes de gráficos son una técnica de optimización. Allan Seheult y Bruce Porteous eran miembros del aclamado grupo de estadística de Durham de la época, que estaba dirigido por Julian Besag y Peter Green (estadístico), con la experta en optimización Margaret Greig notable por ser la primera mujer miembro del personal del Departamento de Ciencias Matemáticas de Durham.

    En el contexto estadístico bayesiano de suavizado de imágenes ruidosas (o corruptas), mostraron cómo la estimación máxima a posteriori de una imagen binaria se puede obtener exactamente maximizando el flujo a través de una red de imágenes asociada, lo que implicó la introducción de una fuente y un sumidero. Esto les permitió demostrar cómo se puede obtener exactamente la estimación máxima a posteriori de una imagen binaria. Como resultado, se demostró que el problema puede resolverse con éxito. Antes de este hallazgo, se utilizaron enfoques de aproximación como el recocido simulado, que fue presentado por los hermanos Geman, para abordar problemas similares de suavizado de imágenes. Pero ahora que tenemos esta solución, podemos resolver estos problemas con mayor precisión.

    Aunque el problema general k del color sigue sin resolverse para k>2, el enfoque de Greig, se espera que Porteous y Seheult tengan una amplia gama de aplicaciones en cuestiones generales de visión por computadora.

    Es una práctica común utilizar los métodos Porteous y Seheult de manera iterativa en una serie de problemas binarios, lo que a menudo resulta en soluciones que están muy cerca de lo ideal.

    En 2011, C.

    Couprie y cols.

    Se presentó un marco integral para la segmentación de imágenes, a menudo denominado Cuenca hidrográfica de energía, que logró el mejor resultado posible para una función indicadora de valor real que va desde [0,1] en un gráfico, restringido por las semillas plantadas por los usuarios (o términos unarios) hasta 0 o 1, respectivamente, en el que la minimización de la función del indicador sobre el gráfico se optimiza con respecto a un exponente p .

    Cuando p=1 , los cortes de grafos permiten la optimización de la cuenca hidrográfica de potencia, cuando p=0 la cuenca hidrográfica de potencia está optimizada por las rutas más cortas, p=2 se optimiza mediante el algoritmo de caminante aleatorio y p=\infty se optimiza mediante el algoritmo de cuenca hidrográfica (procesamiento de imágenes).

    Siendo este el caso, es posible pensar en la cuenca hidrográfica como una extensión de los cortes de gráficos, que ofrece un enlace fácil a varias otras técnicas de segmentación/agrupación de optimización de energía.

    Imagen: x\in \{R,G,B\}^{N}

    Salida: Segmentación (también llamada opacidad) S\in R^{N} (segmentación suave).

    Para una segmentación dura

    S\in \{0{\text{ for background}},1{\text{ for foreground/object to be detected}}\}^{N}

    Función de energía: E(x,S,C,\lambda ) donde C es el parámetro de color y λ es el parámetro de coherencia.

    E(x,S,C,\lambda )=E_{{{\rm {color}}}}+E_{{{\rm {coherence}}}}

    Optimización: La segmentación se puede estimar como un mínimo global sobre S: {\arg \min }_{S}E(x,S,C,\lambda )

    Los cortes de gráficos estándar tienen como objetivo maximizar la eficiencia de la función de energía sobre la segmentación (valor S desconocido).

    Cortes en un gráfico iterado:

    En la primera fase, la optimización de K-medias se realiza en los parámetros de color.

    El algoritmo estándar para cortar gráficos se lleva a cabo en la segunda etapa.

    Estos dos procesos se llevan a cabo de manera recursiva hasta que se alcanza la convergencia.

    El uso de cortes de gráficos dinámicos permite que la técnica se vuelva a ejecutar significativamente más rápidamente una vez que se ha modificado el problema (por ejemplo, después de que un usuario haya agregado nuevas semillas).

    {\displaystyle \Pr(x\mid S)=K^{-E}}

    donde la energía E se compone de dos modelos diferentes ( E_{{{\rm {color}}}} y ): E_{{{\rm {coherence}}}}

    E_{{{\rm {color}}}} — término unario que describe la probabilidad de cada color.

    Este término puede representarse de diversas maneras, incluidas las que son locales (como los texones) o globales (como los histogramas, los GMM y la probabilidad de Adaboost), todas las cuales se detallan a continuación.

    Con el fin de generar histogramas para el objeto (primer plano) y las distribuciones de intensidad de fondo, utilizamos las intensidades de los píxeles

    ¿Disfrutas la vista previa?
    Página 1 de 1