Segmentación de imagen: Desbloqueo de información a través de Pixel Precision
Por Fouad Sabry
()
Información de este libro electrónico
¿Qué es la segmentación de imágenes?
En el procesamiento de imágenes digitales y la visión por computadora, la segmentación de imágenes es el proceso de dividir una imagen digital en múltiples segmentos de imagen, también conocidos como regiones o regiones de imagen. objetos de imagen. El objetivo de la segmentación es simplificar y/o cambiar la representación de una imagen en algo que sea más significativo y más fácil de analizar. La segmentación de imágenes se utiliza normalmente para localizar objetos y límites en imágenes. Más precisamente, la segmentación de imágenes es el proceso de asignar una etiqueta a cada píxel de una imagen de modo que los píxeles con la misma etiqueta compartan ciertas características.
Cómo se beneficiará
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Segmentación de imágenes
Capítulo 2: Detección de bordes
Capítulo 3: Transformación de características invariantes de escala
Capítulo 4: Umbral (procesamiento de imágenes)
Capítulo 5: Método de Otsu
Capítulo 6: Detección de esquinas
Capítulo 7: Recortes de gráficos en visión por computadora
Capítulo 8: Cambio medio
Capítulo 9: Segmentación de rango
Capítulo 10: Cuenca hidrográfica (procesamiento de imágenes)
(II) Respondiendo a las principales preguntas del público sobre la segmentación de imágenes.
(III) Ejemplos del mundo real para el uso de la segmentación de imágenes en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de Segmentación de Imágenes.
Lee más de Fouad Sabry
Relacionado con Segmentación de imagen
Títulos en esta serie (100)
Histograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de contorno: Revelando el arte de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHashing geométrico: Algoritmos eficientes para el reconocimiento y la comparación de imágenes Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Reconstrucción tridimensional multivista: Técnicas avanzadas de percepción espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesClasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesCortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEstimación de movimiento: Avances y aplicaciones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia activa: Liberando el poder de los modelos de apariencia activa en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de volumen: Explorando el realismo visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRed de sensores visuales: Explorando el poder de las redes de sensores visuales en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos rasterizados: Comprender los fundamentos de los gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos ráster: Transformando realidades visuales: dominio de los editores de gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de objetos: Avances, aplicaciones y algoritmos Calificación: 0 de 5 estrellas0 calificacionesFlujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAprendizaje de características geométricas: Desbloqueo de conocimientos visuales a través del aprendizaje de características geométricas Calificación: 0 de 5 estrellas0 calificacionesVisión de máquina: Información sobre el mundo de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráfico de trama digital: Revelando el poder de los gráficos rasterizados digitales en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesGráficos de trazado de rayos: Explorando la representación fotorrealista en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReconocimiento óptico de Braille: Potenciando la accesibilidad a través de la inteligencia visual Calificación: 0 de 5 estrellas0 calificacionesCara Propia: Explorando las profundidades del reconocimiento visual con Eigenface Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRecuperación de imágenes basada en contenido: Desbloqueo de bases de datos visuales Calificación: 0 de 5 estrellas0 calificacionesEstimación de la postura del cuerpo articulado: Desbloqueando el movimiento humano en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos vectoriales: Potenciando la creación visual con algoritmos avanzados Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de característica invariante de escala: Revelando el poder de la transformación de características invariantes de escala en visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Chat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesArquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesR en profundidad: Programación, gráficos y estadística Calificación: 0 de 5 estrellas0 calificacionesFundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Inteligencia artificial: Casos prácticos con aprendizaje profundo Calificación: 4 de 5 estrellas4/5Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Resumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesCómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5¿Cómo ganar dinero con la inteligencia artificial? Calificación: 0 de 5 estrellas0 calificacionesLaravel: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la computación cuántica para ingenieros Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5Monetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Mecatrónica Calificación: 0 de 5 estrellas0 calificacionesGuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio Calificación: 0 de 5 estrellas0 calificacionesPHP: Programación web avanzada para profesionales Calificación: 0 de 5 estrellas0 calificacionesMetodología de la Programación Orientada a Objetos Calificación: 0 de 5 estrellas0 calificacionesProgramacion Orientada a Objetos y Estructura de Datos a Fondo Calificación: 0 de 5 estrellas0 calificacionesCómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: la cuarta revolución industrial Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5
Comentarios para Segmentación de imagen
0 clasificaciones0 comentarios
Vista previa del libro
Segmentación de imagen - Fouad Sabry
Capítulo 1: Segmentación de imágenes
La segmentación de imágenes, también conocida como segmentación de regiones de imágenes u objetos, es una técnica utilizada en visión artificial y procesamiento de imágenes para dividir una imagen digital en partes más pequeñas y manejables (conjuntos de píxeles). El propósito de la segmentación es transformar la representación de una imagen en una que sea más digerible e informativa. La segmentación de una imagen es una técnica común para encontrar características como líneas, curvas y otros límites dentro de una imagen. La segmentación de imágenes, para ser más específicos, es el proceso de etiquetar cada píxel de una imagen para que los píxeles con la misma etiqueta compartan propiedades comunes.
Al segmentar una imagen, se obtiene una colección de subimágenes, o contornos, que juntas conforman la imagen original (consulte detección de bordes). Todos los píxeles de un área determinada comparten una similitud en al menos una propiedad calculada, como el tono, la saturación o la textura. Coloración diferencial entre regiones adyacentes para la(s) misma entidad(es).
La segmentación de imágenes tiene muchos usos en el mundo real, incluidos los siguientes:
Recuperación de imágenes basada en el contenido
Visión artificial
Técnicas de diagnóstico por imágenes, como la tomografía computarizada (TC) y la resonancia magnética nuclear (RMN) con representación de volumen.
Diagnosticar cáncer y otras patologías
Medir los volúmenes de tejido
Estudio de anatomía y diagnóstico
Planificación de la cirugía
Simulación de cirugía virtual
Sistemas de guiado en funcionamiento
Radioterapia
Detección de objetos
Detección de peatones
Detección de rostros
Detección de luz de freno
Reconocer cosas en imágenes espaciales (carreteras, bosques, cultivos, etc.)
Tareas de reconocimiento
Reconocimiento facial
Reconocimiento de huellas dactilares
Reconocimiento del iris
Sistemas de control de tráfico
Videovigilancia
Detección de acciones y cosegmentación en vídeos
Se han desarrollado numerosos algoritmos y métodos de propósito general para la segmentación de imágenes. Por lo general, estos métodos requieren conocimientos específicos del dominio para aplicarse de manera efectiva a los problemas de segmentación dentro de un dominio determinado.
Existen dos tipos de métodos de segmentación.
Técnicas convencionales en visión artificial
Técnicas basadas en IA
La segmentación semántica es un método que asigna una clase a todos y cada uno de los píxeles de un objeto. Segmentar una figura en sus partes constituyentes, como su gente y su fondo, daría como resultado dos objetos distintos.
La segmentación de instancias es un método que asigna cada píxel a la instancia de objeto correcta. Encuentra cada objeto individual en la imagen. La segmentación se utiliza, por ejemplo, cuando cada parte individual de una figura se trata como una entidad separada.
La segmentación semántica y la segmentación de instancias se unen en la segmentación panóptica. Al igual que la segmentación semántica, la segmentación panóptica determina la pertenencia a la clase del píxel. La segmentación panóptica, a diferencia de la segmentación semántica, puede diferenciar a los miembros de la misma clase.
El umbral es el método más simple de segmentación de imágenes. El nivel de clip (o valor de umbral) es la base de esta técnica para convertir una imagen en escala de grises en binaria.
Elegir el umbral adecuado es crucial para este enfoque (o valores cuando se seleccionan varios niveles). El método de máxima entropía, el método de umbral de histograma equilibrado, el método de Otsu (varianza máxima) y el método de agrupamiento de k-medias se utilizan ampliamente en los negocios.
Últimamente han surgido técnicas de umbral para las imágenes de tomografía computarizada (TC). La idea principal es que los umbrales se derivan de las radiografías en lugar de la imagen (reconstruida), como en el método de Otsu.
Para dividir una imagen en K grupos, el algoritmo K-means emplea técnicas iterativas. El procedimiento estándar es el siguiente:
Elija K nodos para un clúster de forma aleatoria o mediante una técnica heurística como K-means++.
Los píxeles deben asignarse a los clústeres en función de la distancia más corta a los centros de clústeres.
Vuelva a calcular los centros de clúster promediando los píxeles de clúster.
Para lograr la convergencia, se deben repetir los pasos 2 y 3 (es decir, no hay píxeles que cambien de grupo)
La distancia entre un solo píxel y el centro de un cúmulo se expresa como su distancia al cuadrado o absoluta. El color, el brillo, la textura y la posición de los píxeles individuales, o alguna combinación de los mismos, a menudo juegan un papel en el establecimiento de la distinción. El valor de K se puede elegir empírica, arbitraria o heurísticamente. Existe una garantía de convergencia para este algoritmo, pero es posible que no proporcione la mejor respuesta. La eficacia de la solución está determinada por el número de clústeres dados al principio y el parámetro K.
El algoritmo Mean Shift es un método para agrupar imágenes en subconjuntos cuyo número no se puede determinar de antemano. El hecho de que esto no requiera ningún conocimiento previo de dicho parámetro lo convierte en una solución general superior para una gama más amplia de problemas.
Para realizar la segmentación, el método basado en movimiento utiliza la información de movimiento de la imagen.
El concepto es sencillo: basta con comparar y contrastar dos imágenes. Si el objetivo de estudio está en movimiento, la diferencia será ese objetivo en sí mismo.
Kenney et al. [2] propusieron la segmentación interactiva como una mejora de esta idea. Para crear la señal de movimiento necesaria para la segmentación basada en el movimiento, se utiliza un robot para pinchar objetos.
Dov Katz [3, 4] y Oliver Brock [3, 4] propusieron el marco de percepción interactiva en el que se basa la segmentación interactiva.
La técnica de segmentación de movimiento rígido basada en el movimiento es otra opción.
De acuerdo con los principios de los enfoques basados en la compresión, la mejor manera de dividir los datos es en fragmentos manejables, siendo la longitud de codificación más pequeña la solución óptima. La segmentación busca patrones en una imagen, y esos patrones se pueden explotar para crear versiones comprimidas del original. La técnica caracteriza cada sección por su textura y contorno de límites. Para determinar la longitud de codificación de cada una de estas partes, utilizamos funciones de distribución de probabilidad como modelos:
El contorno suave de las regiones en las imágenes naturales se aprovecha mediante la codificación de límites. La codificación de Huffman utiliza esto antes de codificar el código de la cadena de diferencia de los contornos de una imagen. Cuanto más corta sea la longitud de codificación, más suave será el límite.
La compresión con pérdida se utiliza para codificar texturas de una manera análoga al principio MDL; Sin embargo, la longitud de los datos dados al modelo es aproximadamente igual al número de muestras multiplicado por la entropía del modelo. Se utiliza una distribución normal multivariante para modelar la textura en cada área, y la entropía de esta distribución se puede expresar de forma cerrada. La entropía estimada tiene límites superiores que son consistentes con la verdadera entropía de los datos, lo cual es una propiedad intrigante de este modelo. Esto se debe al hecho de que la entropía de una distribución normal es la más alta de cualquier distribución para una media y covarianza dadas. Debido a esto, el objetivo de minimización del algoritmo no puede exceder la longitud de codificación real.
El número de bits necesarios para codificar una imagen en función de una segmentación determinada se calcula mediante este esquema. Por lo tanto, el objetivo es identificar, entre todas las segmentaciones de imágenes posibles, la que resulte en la longitud de codificación más corta. Un enfoque sencillo de agrupación en clústeres aglomerados hará el truco aquí. La aspereza de la segmentación se establece mediante la distorsión de compresión con pérdida, y la mejor configuración puede cambiar de una imagen a otra. Este parámetro se puede estimar aproximadamente utilizando el contraste de textura de una imagen como guía. Se requiere una mayor sensibilidad y, por lo tanto, una menor cuantificación cuando, por ejemplo, las texturas de una imagen son similares, como en las imágenes de camuflaje.
En comparación con otras técnicas de segmentación de imágenes, los métodos basados en histogramas sobresalen debido al hecho de que, por lo general, solo necesitan una sola pasada a través de los píxeles. El método consiste en crear un histograma a partir de los píxeles de la imagen y, a continuación, utilizar los picos y valles del histograma para identificar los clústeres. La escala puede basarse en el tono o el brillo.
La aplicación recursiva del método de búsqueda de histogramas a los grupos de imágenes para dividirlos en grupos más pequeños es un refinamiento de esta técnica. Hasta que no se puedan formar nuevos clústeres, este proceso se repite con clústeres progresivamente más