Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Clasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz
Clasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz
Clasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz
Libro electrónico155 páginas1 hora

Clasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

¿Qué es la clasificación de imágenes contextuales?


Un método de clasificación que se basa en la información contextual contenida en las imágenes se conoce como clasificación de imágenes contextuales. Este método entra en la categoría de reconocimiento de patrones en visión por computadora. Un enfoque "contextual" es aquel que se centra en la relación entre los píxeles que están muy próximos entre sí, lo que también se conoce como vecindad. La clasificación de las fotografías según la utilización de la información contextual es el objetivo de este enfoque.


Cómo se beneficiará


(I) Insights, y validaciones sobre los siguientes temas:


Capítulo 1: Clasificación contextual de imágenes


Capítulo 2: Reconocimiento de patrones


Capítulo 3: Proceso gaussiano


Capítulo 4: LPBoost


Capítulo 5: Aprendizaje de una sola vez (visión por computadora)


Capítulo 6: Máquina de vectores de soporte de mínimos cuadrados


Capítulo 7: Difracción de Fraunhofer ecuación


Capítulo 8: Simetría en mecánica cuántica


Capítulo 9: Modelado jerárquico bayesiano


Capítulo 10: Subproblemas de Paden-Kahan


( II) Responder las principales preguntas del público sobre la clasificación de imágenes contextuales.


(III) Ejemplos del mundo real para el uso de la clasificación de imágenes contextuales en muchos campos.


Quién es este libro para


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o información básica para cualquier tipo de Clasificación de Imágenes Contextuales.


 


 

IdiomaEspañol
Fecha de lanzamiento4 may 2024
Clasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz

Relacionado con Clasificación de imágenes contextuales

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Clasificación de imágenes contextuales

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Clasificación de imágenes contextuales - Fouad Sabry

    Capítulo 1: Clasificación contextual de imágenes

    La clasificación contextual de imágenes, un subcampo del reconocimiento de patrones en visión artificial, es una técnica de clasificación basada en la información contextual de las imágenes. El término contextual indica que este método enfatiza el vínculo entre los píxeles circundantes, a menudo conocidos como la vecindad. El objetivo de este método es clasificar las fotos utilizando información contextual.

    Al igual que en el procesamiento del lenguaje, una sola palabra puede tener varias interpretaciones a menos que se proporcione el contexto, y las únicas partes informativas son los patrones de las oraciones. Para las fotos, se aplica la misma idea. Determinar los patrones y sus significados apropiados.

    Como demuestra la siguiente imagen, si solo se muestra una pequeña sección de la imagen, es extremadamente difícil determinar lo que representa la imagen.

    Mouth

    Incluso si se examina otra área de la imagen, la imagen sigue siendo imposible de categorizar.

    Left eye

    Sin embargo, si mejoramos el contexto de la imagen, tiene más sentido reconocerla.

    Como demuestra la imagen en su totalidad a continuación, prácticamente todo el mundo puede clasificarlo con facilidad.

    Durante la operación de segmentación, los sistemas que no utilizan información contextual son sensibles al ruido y a los cambios, lo que da lugar a un gran número de regiones mal clasificadas, que suelen ser de tamaño pequeño (por ejemplo, un píxel).

    Este método es más resistente al ruido y a los grandes cambios que otros métodos, ya que tiene en cuenta la continuidad de los segmentos.

    A continuación se detallan varios métodos para esta estrategia.

    Este método es bastante exitoso contra ubicaciones que causan ruido menor. Y estas pequeñas zonas suelen estar compuestas por unos pocos o un solo píxel. Estas regiones reciben la etiqueta más probable. Sin embargo, esta estrategia tiene una desventaja. Las regiones pequeñas también pueden ser generadas por regiones correctas en lugar de ruido, en cuyo caso la estrategia en realidad empeora la clasificación. Este método se emplea ampliamente en aplicaciones de teledetección.

    Esto implica dos etapas de clasificación:

    Etiquete cada píxel y genere un nuevo vector de características para cada píxel.

    Utilice el vector de características actualizado y la información contextual para aplicar la etiqueta final.

    En lugar de usar píxeles individuales, los píxeles vecinos pueden combinarse en regiones homogéneas que se benefician de los datos contextuales. Y suministre estas áreas al clasificador.

    En raras ocasiones, los datos espectrales originales pueden complementarse con información contextual transportada por píxeles vecinos, o incluso sustituirse. Este tipo de técnicas de preprocesamiento se emplea comúnmente en el reconocimiento de imágenes texturizadas. Los métodos típicos incluyen valores medios, varianzas, descripción de texturas, etc.

    El clasificador asigna etiquetas a los píxeles mediante el nivel de gris y la vecindad de píxeles (información contextual). En este caso, los datos son una combinación de información espectral y geográfica.

    El clasificador de error mínimo de Bayes se utiliza para la clasificación contextual de datos de imagen (también conocido como clasificador Bayes ingenuo).

    Mostrar el píxel:

    Un píxel se denota como x_{0} .

    La vecindad de cada píxel x_{0} es un vector y se denota como {\displaystyle N(x_{0})} .

    Los valores del vector de vecindad se denotan como f(x_{i}) .

    Cada píxel se muestra mediante un vector.

    {\displaystyle \xi =\left(f(x_{0}),f(x_{1}),\ldots ,f(x_{k})\right)}{\displaystyle x_{i}\in N(x_{0});\quad i=1,\ldots ,k}

    Las etiquetas (clasificación) de píxeles en la vecindad {\displaystyle N(x_{0})} se presentan como un vector

    {\displaystyle \eta =\left(\theta _{0},\theta _{1},\ldots ,\theta _{k}\right)}{\displaystyle \theta _{i}\in \left\{\omega _{0},\omega _{1},\ldots ,\omega _{k}\right\}}

    \omega _{s} aquí denota la clase asignada.

    Un vector presenta las etiquetas de la vecindad {\displaystyle N(x_{0})} sin el píxel x_{0}

    {\displaystyle {\hat {\eta }}=\left(\theta _{1},\theta _{2},\ldots ,\theta _{k}\right)}

    El barrio: el tamaño del barrio.

    No hay restricción de tamaño, pero se considera que es relativamente pequeño para cada píxel x_{0} .

    Un tamaño razonable de vecindad sería 3 \times 3 de 4 u 8 de conectividad ( x_{0} está marcado en rojo y colocado en el centro).

    Comunidad de 4 conectividades, comunidad de 8 conectividades

    El cálculo:

    Aplique la clasificación de error mínimo en un píxel, x_{0} si la probabilidad de que una clase \omega _{r} presente el píxel x_{0} es la más alta entre todas, asígnela \omega _{r} como su clase.

    {\displaystyle \theta _{0}=\omega _{r}\quad {\text{ if }}\quad P(\omega _{r}\mid f(x_{0}))=\max _{s=1,2,\ldots ,R}P(\omega _{s}\mid f(x_{0}))}

    A continuación se muestra una descripción de la regla de clasificación contextual:, utiliza el vector de características x_{1} en lugar de x_{0} .

    {\displaystyle \theta _{0}=\omega _{r}\quad {\text{ if }}\quad P(\omega _{r}\mid \xi )=\max _{s=1,2,\ldots ,R}P(\omega _{s}\mid \xi )}

    Usa la fórmula de Bayes para calcular la probabilidad a posteriori {\displaystyle P(\omega _{s}\mid \xi )}

    {\displaystyle P(\omega _{s}\mid \xi )={\frac {p(\xi \mid \omega _{s})P(\omega _{s})}{p\left(\xi \right)}}}

    Igual al número de píxeles de una imagen, el número de vectores también es igual.

    Para el clasificador se utiliza un vector correspondiente a cada píxel x_{i} , y el vector se forma a partir de la vecindad del píxel.

    Los procedimientos fundamentales para la categorización contextual de imágenes:

    Calcule el vector de características \xi para cada píxel.

    Calcule los parámetros de la distribución de probabilidad {\displaystyle p(\xi \mid \omega _{s})} y {\displaystyle P(\omega _{s})}

    Calcule las probabilidades posteriores {\displaystyle P(\omega _{r}\mid \xi )} y todas las etiquetas \theta _{0} .

    Obtenga el resultado de la clasificación de imágenes.

    La coincidencia de plantillas es una aplicación de fuerza bruta de esta estrategia. El objetivo es establecer una serie de plantillas y, a continuación, buscar pequeños componentes de imagen que coincidan con una plantilla.

    Esta técnica es computacionalmente intensiva e ineficaz.

    Mantiene una lista completa de plantillas a lo largo de todo el proceso, y el número de combinaciones posibles es increíblemente alto.

    Para una m\times n imagen de píxeles, podría haber un máximo de {\displaystyle 2^{m\times n}} combinaciones, lo que da como resultado un cálculo intensivo.

    Se trata de una estrategia descendente comúnmente conocida como búsqueda en tablas o búsqueda en diccionarios.

    La cadena de Markov también es aplicable al reconocimiento de patrones. Los píxeles de una imagen se pueden identificar como un conjunto de variables aleatorias, y luego se puede usar la cadena de Markov de orden inferior para determinar su relación. El enfoque trata la imagen como una línea virtual y utiliza la probabilidad condicional.

    La curva de Hilbert cruza cada píxel sin volver a ninguno de ellos dos veces y mantiene una curva continua en toda la imagen. Es rápido y eficaz.

    La cadena de Markov de orden inferior y las curvas de llenado de espacio de Hilbert mencionadas anteriormente tratan la imagen como una estructura de líneas. Sin embargo, las mallas de Markov tendrán en cuenta la información bidimensional.

    El árbol de dependencias es un método para aproximar distribuciones de probabilidad a través de la dependencia del árbol.

    {Fin del capítulo 1}

    Capítulo 2: Reconocimiento de patrones

    El proceso de reconocimiento automático de patrones y regularidades dentro de los datos se conoce como reconocimiento de patrones. El análisis estadístico de datos, el procesamiento de señales, el análisis de imágenes, la recuperación de información, la bioinformática, la compresión de datos, los gráficos por computadora y el aprendizaje automático son solo algunos de los campos que pueden beneficiarse de su uso. Los campos de la estadística y la ingeniería son donde comenzó el reconocimiento de patrones; Algunos métodos contemporáneos de reconocimiento de patrones implican el uso del aprendizaje automático, que es posible gracias a la creciente disponibilidad de grandes cantidades de datos y a la capacidad de cálculo más abundante. Ambas actividades podrían considerarse como dos caras del mismo sector de aplicación, y ambas actividades han experimentado un crecimiento significativo en el transcurso de las últimas décadas.

    El entrenamiento para los sistemas de reconocimiento de patrones a menudo se lleva a cabo utilizando datos que se han clasificado como entrenamiento. Cuando no se dispone de datos etiquetados, se pueden utilizar técnicas alternativas para identificar patrones que antes no se conocían. Tanto la KDD como la minería de datos ponen un mayor énfasis en las técnicas de análisis no supervisadas y tienen una relación más profunda con las aplicaciones prácticas en la industria. La

    ¿Disfrutas la vista previa?
    Página 1 de 1