Cortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora
Por Fouad Sabry
()
Información de este libro electrónico
¿Qué son los cortes de gráficos en visión por computadora?
Tal como se aplica en el campo de la visión por computadora, la optimización del corte de gráficos se puede emplear para resolver de manera eficiente una amplia variedad de problemas de visión por computadora de bajo nivel. problemas, como el suavizado de imágenes, el problema de la correspondencia estéreo, la segmentación de imágenes, la cosegmentación de objetos y muchos otros problemas de visión por computadora que pueden formularse en términos de minimización de energía. Muchos de estos problemas de minimización de energía se pueden aproximar resolviendo un problema de flujo máximo en un gráfico. En la mayoría de las formulaciones de este tipo de problemas en visión por computadora, la solución de energía mínima corresponde a la estimación máxima a posteriori de una solución. Aunque muchos algoritmos de visión por computadora implican cortar un gráfico, el término "cortes de gráfico" se aplica específicamente a aquellos modelos que emplean una optimización de flujo máximo/corte mínimo.
Cómo se beneficiará
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Cortes de gráficos en visión por computadora
Capítulo 2: Max-flow min -teorema de corte
Capítulo 3: Segmentación de imágenes
Capítulo 4: Corte (teoría de grafos)
Capítulo 5: Corte mínimo
Capítulo 6: Cuenca hidrográfica (procesamiento de imágenes)
Capítulo 7: GrabCut
Capítulo 8: Algoritmo de caminante aleatorio
Capítulo 9: Optimización del corte de gráficos
Capítulo 10: Video matting
(II) Respondiendo a las principales preguntas del público sobre cortes de gráficos de visión por computadora.
(III) Ejemplos del mundo real para el uso de cortes de gráficos de visión por computadora en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básicos. para cualquier tipo de cortes de gráficos de visión por computadora.
Lee más de Fouad Sabry
Relacionado con Cortes de gráficos de visión por computadora
Títulos en esta serie (100)
Histograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de contorno: Revelando el arte de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHashing geométrico: Algoritmos eficientes para el reconocimiento y la comparación de imágenes Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Editora de gráficos ráster: Transformando realidades visuales: dominio de los editores de gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesRepresentación de volumen: Explorando el realismo visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos rasterizados: Comprender los fundamentos de los gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAlgoritmo de dibujo lineal: Dominar técnicas para la representación de imágenes de precisión Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificacionesClasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz Calificación: 0 de 5 estrellas0 calificacionesGráfico de trama digital: Revelando el poder de los gráficos rasterizados digitales en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReconstrucción tridimensional multivista: Técnicas avanzadas de percepción espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos vectoriales: Potenciando la creación visual con algoritmos avanzados Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesMapeo de colores: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGeometría Computacional: Explorando conocimientos geométricos para la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEstimación de movimiento: Avances y aplicaciones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesIluminación global: Visión avanzada: conocimientos sobre la iluminación global Calificación: 0 de 5 estrellas0 calificacionesMétodo de ajuste de nivel: Avances en la visión por computadora, exploración del método de conjunto de niveles Calificación: 0 de 5 estrellas0 calificacionesGeometric modeling in computer: Aided geometric design Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de vértice: Explorando la intersección de los gráficos por computadora Vertex y la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSuperficie procesal: Explorando la generación y el análisis de texturas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de Texturas: Explorando la dimensionalidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesHistograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEliminación de líneas ocultas: Revelando lo invisible: secretos de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFlujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de polígono: Explorando la intersección de gráficos por computadora poligonales y visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de línea de exploración: Explorando el realismo visual a través de técnicas de renderizado Scanline Calificación: 0 de 5 estrellas0 calificacionesEspacio de escala: Explorando las dimensiones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGeneración de malla: Avances y aplicaciones en la generación de mallas de visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Chat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesArquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesR en profundidad: Programación, gráficos y estadística Calificación: 0 de 5 estrellas0 calificacionesFundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Inteligencia artificial: Casos prácticos con aprendizaje profundo Calificación: 4 de 5 estrellas4/5Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Resumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesCómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5¿Cómo ganar dinero con la inteligencia artificial? Calificación: 0 de 5 estrellas0 calificacionesLaravel: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la computación cuántica para ingenieros Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5Monetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Mecatrónica Calificación: 0 de 5 estrellas0 calificacionesGuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio Calificación: 0 de 5 estrellas0 calificacionesPHP: Programación web avanzada para profesionales Calificación: 0 de 5 estrellas0 calificacionesMetodología de la Programación Orientada a Objetos Calificación: 0 de 5 estrellas0 calificacionesProgramacion Orientada a Objetos y Estructura de Datos a Fondo Calificación: 0 de 5 estrellas0 calificacionesCómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: la cuarta revolución industrial Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5
Comentarios para Cortes de gráficos de visión por computadora
0 clasificaciones0 comentarios
Vista previa del libro
Cortes de gráficos de visión por computadora - Fouad Sabry
Capítulo 1: Cortes de grafos en visión artificial
La optimización del corte de grafos, cuando se aplica al tema de la visión por computadora, se puede utilizar para abordar una amplia gama de problemas de visión por computadora de bajo nivel (también conocidos como problemas de visión temprana) de una manera efectiva y eficiente (y por lo tanto, por el teorema de corte mínimo de flujo máximo, definir un corte mínimo del gráfico). La mayoría de los enfoques para formular problemas de este tipo en visión artificial coinciden en que la respuesta con la menor cantidad de gasto energético corresponde a la estimación a posteriori más alta de una solución. Aunque muchos algoritmos de visión artificial incluyen el corte de un gráfico (por ejemplo, cortes normalizados), la frase cortes de gráfico
se refiere particularmente a aquellos modelos que utilizan una optimización de flujo máximo/corte mínimo. Esto se debe a que muchos métodos de visión artificial implican cortar un grafo (otros algoritmos de corte de grafos pueden considerarse como algoritmos de partición de grafos).
Con este método, los problemas binarios
, como la eliminación de ruido de una imagen binaria, se pueden resolver con exactitud; los problemas en los que los píxeles se pueden etiquetar con más de dos etiquetas diferentes, como la correspondencia estéreo o la eliminación de ruido de una imagen en escala de grises, no se pueden resolver exactamente; Sin embargo, las soluciones que se producen suelen estar muy cerca del óptimo global.
En su estudio histórico, Greig, Porteous y Seheult de la Universidad de Durham fueron los primeros en aplicar la idea de los cortes de grafos al proceso de optimización de la visión por computadora. Los cortes de gráficos son una técnica de optimización. Allan Seheult y Bruce Porteous eran miembros del aclamado grupo de estadística de Durham de la época, que estaba dirigido por Julian Besag y Peter Green (estadístico), con la experta en optimización Margaret Greig notable por ser la primera mujer miembro del personal del Departamento de Ciencias Matemáticas de Durham.
En el contexto estadístico bayesiano de suavizado de imágenes ruidosas (o corruptas), mostraron cómo la estimación máxima a posteriori de una imagen binaria se puede obtener exactamente maximizando el flujo a través de una red de imágenes asociada, lo que implicó la introducción de una fuente y un sumidero. Esto les permitió demostrar cómo se puede obtener exactamente la estimación máxima a posteriori de una imagen binaria. Como resultado, se demostró que el problema puede resolverse con éxito. Antes de este hallazgo, se utilizaron enfoques de aproximación como el recocido simulado, que fue presentado por los hermanos Geman, para abordar problemas similares de suavizado de imágenes. Pero ahora que tenemos esta solución, podemos resolver estos problemas con mayor precisión.
Aunque el problema general k del color sigue sin resolverse para k>2, el enfoque de Greig, se espera que Porteous y Seheult tengan una amplia gama de aplicaciones en cuestiones generales de visión por computadora.
Es una práctica común utilizar los métodos Porteous y Seheult de manera iterativa en una serie de problemas binarios, lo que a menudo resulta en soluciones que están muy cerca de lo ideal.
En 2011, C.
Couprie y cols.
Se presentó un marco integral para la segmentación de imágenes, a menudo denominado Cuenca hidrográfica de energía
, que logró el mejor resultado posible para una función indicadora de valor real que va desde [0,1] en un gráfico, restringido por las semillas plantadas por los usuarios (o términos unarios) hasta 0 o 1, respectivamente, en el que la minimización de la función del indicador sobre el gráfico se optimiza con respecto a un exponente p .
Cuando p=1 , los cortes de grafos permiten la optimización de la cuenca hidrográfica de potencia, cuando p=0 la cuenca hidrográfica de potencia está optimizada por las rutas más cortas, p=2 se optimiza mediante el algoritmo de caminante aleatorio y p=\infty se optimiza mediante el algoritmo de cuenca hidrográfica (procesamiento de imágenes).
Siendo este el caso, es posible pensar en la cuenca hidrográfica como una extensión de los cortes de gráficos, que ofrece un enlace fácil a varias otras técnicas de segmentación/agrupación de optimización de energía.
Imagen: x\in \{R,G,B\}^{N}
Salida: Segmentación (también llamada opacidad) S\in R^{N} (segmentación suave).
Para una segmentación dura
S\in \{0{\text{ for background}},1{\text{ for foreground/object to be detected}}\}^{N}Función de energía: E(x,S,C,\lambda ) donde C es el parámetro de color y λ es el parámetro de coherencia.
E(x,S,C,\lambda )=E_{{{\rm {color}}}}+E_{{{\rm {coherence}}}}Optimización: La segmentación se puede estimar como un mínimo global sobre S: {\arg \min }_{S}E(x,S,C,\lambda )
Los cortes de gráficos estándar tienen como objetivo maximizar la eficiencia de la función de energía sobre la segmentación (valor S desconocido).
Cortes en un gráfico iterado:
En la primera fase, la optimización de K-medias se realiza en los parámetros de color.
El algoritmo estándar para cortar gráficos se lleva a cabo en la segunda etapa.
Estos dos procesos se llevan a cabo de manera recursiva hasta que se alcanza la convergencia.
El uso de cortes de gráficos dinámicos permite que la técnica se vuelva a ejecutar significativamente más rápidamente una vez que se ha modificado el problema (por ejemplo, después de que un usuario haya agregado nuevas semillas).
{\displaystyle \Pr(x\mid S)=K^{-E}}donde la energía E se compone de dos modelos diferentes ( E_{{{\rm {color}}}} y ): E_{{{\rm {coherence}}}}
E_{{{\rm {color}}}} — término unario que describe la probabilidad de cada color.
Este término puede representarse de diversas maneras, incluidas las que son locales (como los texones) o globales (como los histogramas, los GMM y la probabilidad de Adaboost), todas las cuales se detallan a continuación.
Con el fin de generar histogramas para el objeto (primer plano) y las distribuciones de intensidad de fondo, utilizamos las intensidades de los píxeles