Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Segmentación de imagen: Desbloqueo de información a través de Pixel Precision
Segmentación de imagen: Desbloqueo de información a través de Pixel Precision
Segmentación de imagen: Desbloqueo de información a través de Pixel Precision
Libro electrónico149 páginas1 hora

Segmentación de imagen: Desbloqueo de información a través de Pixel Precision

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

¿Qué es la segmentación de imágenes?


En el procesamiento de imágenes digitales y la visión por computadora, la segmentación de imágenes es el proceso de dividir una imagen digital en múltiples segmentos de imagen, también conocidos como regiones o regiones de imagen. objetos de imagen. El objetivo de la segmentación es simplificar y/o cambiar la representación de una imagen en algo que sea más significativo y más fácil de analizar. La segmentación de imágenes se utiliza normalmente para localizar objetos y límites en imágenes. Más precisamente, la segmentación de imágenes es el proceso de asignar una etiqueta a cada píxel de una imagen de modo que los píxeles con la misma etiqueta compartan ciertas características.


Cómo se beneficiará


(I) Insights y validaciones sobre los siguientes temas:


Capítulo 1: Segmentación de imágenes


Capítulo 2: Detección de bordes


Capítulo 3: Transformación de características invariantes de escala


Capítulo 4: Umbral (procesamiento de imágenes)


Capítulo 5: Método de Otsu


Capítulo 6: Detección de esquinas


Capítulo 7: Recortes de gráficos en visión por computadora


Capítulo 8: Cambio medio


Capítulo 9: Segmentación de rango


Capítulo 10: Cuenca hidrográfica (procesamiento de imágenes)


(II) Respondiendo a las principales preguntas del público sobre la segmentación de imágenes.


(III) Ejemplos del mundo real para el uso de la segmentación de imágenes en muchos campos.


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de Segmentación de Imágenes.


 


 

IdiomaEspañol
Fecha de lanzamiento11 may 2024
Segmentación de imagen: Desbloqueo de información a través de Pixel Precision

Lee más de Fouad Sabry

Relacionado con Segmentación de imagen

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Segmentación de imagen

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Segmentación de imagen - Fouad Sabry

    Capítulo 1: Segmentación de imágenes

    La segmentación de imágenes, también conocida como segmentación de regiones de imágenes u objetos, es una técnica utilizada en visión artificial y procesamiento de imágenes para dividir una imagen digital en partes más pequeñas y manejables (conjuntos de píxeles). El propósito de la segmentación es transformar la representación de una imagen en una que sea más digerible e informativa. La segmentación de una imagen es una técnica común para encontrar características como líneas, curvas y otros límites dentro de una imagen. La segmentación de imágenes, para ser más específicos, es el proceso de etiquetar cada píxel de una imagen para que los píxeles con la misma etiqueta compartan propiedades comunes.

    Al segmentar una imagen, se obtiene una colección de subimágenes, o contornos, que juntas conforman la imagen original (consulte detección de bordes). Todos los píxeles de un área determinada comparten una similitud en al menos una propiedad calculada, como el tono, la saturación o la textura. Coloración diferencial entre regiones adyacentes para la(s) misma entidad(es).

    La segmentación de imágenes tiene muchos usos en el mundo real, incluidos los siguientes:

    Recuperación de imágenes basada en el contenido

    Visión artificial

    Técnicas de diagnóstico por imágenes, como la tomografía computarizada (TC) y la resonancia magnética nuclear (RMN) con representación de volumen.

    Diagnosticar cáncer y otras patologías

    Medir los volúmenes de tejido

    Estudio de anatomía y diagnóstico

    Planificación de la cirugía

    Simulación de cirugía virtual

    Sistemas de guiado en funcionamiento

    Radioterapia

    Detección de objetos

    Detección de peatones

    Detección de rostros

    Detección de luz de freno

    Reconocer cosas en imágenes espaciales (carreteras, bosques, cultivos, etc.)

    Tareas de reconocimiento

    Reconocimiento facial

    Reconocimiento de huellas dactilares

    Reconocimiento del iris

    Sistemas de control de tráfico

    Videovigilancia

    Detección de acciones y cosegmentación en vídeos

    Se han desarrollado numerosos algoritmos y métodos de propósito general para la segmentación de imágenes. Por lo general, estos métodos requieren conocimientos específicos del dominio para aplicarse de manera efectiva a los problemas de segmentación dentro de un dominio determinado.

    Existen dos tipos de métodos de segmentación.

    Técnicas convencionales en visión artificial

    Técnicas basadas en IA

    La segmentación semántica es un método que asigna una clase a todos y cada uno de los píxeles de un objeto. Segmentar una figura en sus partes constituyentes, como su gente y su fondo, daría como resultado dos objetos distintos.

    La segmentación de instancias es un método que asigna cada píxel a la instancia de objeto correcta. Encuentra cada objeto individual en la imagen. La segmentación se utiliza, por ejemplo, cuando cada parte individual de una figura se trata como una entidad separada.

    La segmentación semántica y la segmentación de instancias se unen en la segmentación panóptica. Al igual que la segmentación semántica, la segmentación panóptica determina la pertenencia a la clase del píxel. La segmentación panóptica, a diferencia de la segmentación semántica, puede diferenciar a los miembros de la misma clase.

    El umbral es el método más simple de segmentación de imágenes. El nivel de clip (o valor de umbral) es la base de esta técnica para convertir una imagen en escala de grises en binaria.

    Elegir el umbral adecuado es crucial para este enfoque (o valores cuando se seleccionan varios niveles). El método de máxima entropía, el método de umbral de histograma equilibrado, el método de Otsu (varianza máxima) y el método de agrupamiento de k-medias se utilizan ampliamente en los negocios.

    Últimamente han surgido técnicas de umbral para las imágenes de tomografía computarizada (TC). La idea principal es que los umbrales se derivan de las radiografías en lugar de la imagen (reconstruida), como en el método de Otsu.

    Para dividir una imagen en K grupos, el algoritmo K-means emplea técnicas iterativas. El procedimiento estándar es el siguiente:

    Elija K nodos para un clúster de forma aleatoria o mediante una técnica heurística como K-means++.

    Los píxeles deben asignarse a los clústeres en función de la distancia más corta a los centros de clústeres.

    Vuelva a calcular los centros de clúster promediando los píxeles de clúster.

    Para lograr la convergencia, se deben repetir los pasos 2 y 3 (es decir, no hay píxeles que cambien de grupo)

    La distancia entre un solo píxel y el centro de un cúmulo se expresa como su distancia al cuadrado o absoluta. El color, el brillo, la textura y la posición de los píxeles individuales, o alguna combinación de los mismos, a menudo juegan un papel en el establecimiento de la distinción. El valor de K se puede elegir empírica, arbitraria o heurísticamente. Existe una garantía de convergencia para este algoritmo, pero es posible que no proporcione la mejor respuesta. La eficacia de la solución está determinada por el número de clústeres dados al principio y el parámetro K.

    El algoritmo Mean Shift es un método para agrupar imágenes en subconjuntos cuyo número no se puede determinar de antemano. El hecho de que esto no requiera ningún conocimiento previo de dicho parámetro lo convierte en una solución general superior para una gama más amplia de problemas.

    Para realizar la segmentación, el método basado en movimiento utiliza la información de movimiento de la imagen.

    El concepto es sencillo: basta con comparar y contrastar dos imágenes. Si el objetivo de estudio está en movimiento, la diferencia será ese objetivo en sí mismo.

    Kenney et al. [2] propusieron la segmentación interactiva como una mejora de esta idea. Para crear la señal de movimiento necesaria para la segmentación basada en el movimiento, se utiliza un robot para pinchar objetos.

    Dov Katz [3, 4] y Oliver Brock [3, 4] propusieron el marco de percepción interactiva en el que se basa la segmentación interactiva.

    La técnica de segmentación de movimiento rígido basada en el movimiento es otra opción.

    De acuerdo con los principios de los enfoques basados en la compresión, la mejor manera de dividir los datos es en fragmentos manejables, siendo la longitud de codificación más pequeña la solución óptima. La segmentación busca patrones en una imagen, y esos patrones se pueden explotar para crear versiones comprimidas del original. La técnica caracteriza cada sección por su textura y contorno de límites. Para determinar la longitud de codificación de cada una de estas partes, utilizamos funciones de distribución de probabilidad como modelos:

    El contorno suave de las regiones en las imágenes naturales se aprovecha mediante la codificación de límites. La codificación de Huffman utiliza esto antes de codificar el código de la cadena de diferencia de los contornos de una imagen. Cuanto más corta sea la longitud de codificación, más suave será el límite.

    La compresión con pérdida se utiliza para codificar texturas de una manera análoga al principio MDL; Sin embargo, la longitud de los datos dados al modelo es aproximadamente igual al número de muestras multiplicado por la entropía del modelo. Se utiliza una distribución normal multivariante para modelar la textura en cada área, y la entropía de esta distribución se puede expresar de forma cerrada. La entropía estimada tiene límites superiores que son consistentes con la verdadera entropía de los datos, lo cual es una propiedad intrigante de este modelo. Esto se debe al hecho de que la entropía de una distribución normal es la más alta de cualquier distribución para una media y covarianza dadas. Debido a esto, el objetivo de minimización del algoritmo no puede exceder la longitud de codificación real.

    El número de bits necesarios para codificar una imagen en función de una segmentación determinada se calcula mediante este esquema. Por lo tanto, el objetivo es identificar, entre todas las segmentaciones de imágenes posibles, la que resulte en la longitud de codificación más corta. Un enfoque sencillo de agrupación en clústeres aglomerados hará el truco aquí. La aspereza de la segmentación se establece mediante la distorsión de compresión con pérdida, y la mejor configuración puede cambiar de una imagen a otra. Este parámetro se puede estimar aproximadamente utilizando el contraste de textura de una imagen como guía. Se requiere una mayor sensibilidad y, por lo tanto, una menor cuantificación cuando, por ejemplo, las texturas de una imagen son similares, como en las imágenes de camuflaje.

    En comparación con otras técnicas de segmentación de imágenes, los métodos basados en histogramas sobresalen debido al hecho de que, por lo general, solo necesitan una sola pasada a través de los píxeles. El método consiste en crear un histograma a partir de los píxeles de la imagen y, a continuación, utilizar los picos y valles del histograma para identificar los clústeres. La escala puede basarse en el tono o el brillo.

    La aplicación recursiva del método de búsqueda de histogramas a los grupos de imágenes para dividirlos en grupos más pequeños es un refinamiento de esta técnica. Hasta que no se puedan formar nuevos clústeres, este proceso se repite con clústeres progresivamente más

    ¿Disfrutas la vista previa?
    Página 1 de 1