Aprendizaje de características geométricas: Desbloqueo de conocimientos visuales a través del aprendizaje de características geométricas
Por Fouad Sabry
()
Información de este libro electrónico
Qué es el aprendizaje de características geométricas
El aprendizaje de características geométricas es una técnica que combina el aprendizaje automático y la visión por computadora para resolver tareas visuales. El objetivo principal de este método es encontrar un conjunto de características representativas de forma geométrica para representar un objeto recopilando características geométricas de imágenes y aprendiéndolas utilizando métodos eficientes de aprendizaje automático. Los humanos resuelven tareas visuales y pueden dar una respuesta rápida al entorno extrayendo información perceptual de lo que ven. Los investigadores simulan la capacidad humana de reconocer objetos para resolver problemas de visión por computadora. Por ejemplo, M. Mata et al. (2002) aplicaron técnicas de aprendizaje de funciones a las tareas de navegación del robot móvil para evitar obstáculos. Utilizaron algoritmos genéticos para aprender características y reconocer objetos (figuras). Los métodos de aprendizaje de características geométricas no solo pueden resolver problemas de reconocimiento sino también predecir acciones posteriores mediante el análisis de un conjunto de imágenes sensoriales de entrada secuenciales, generalmente algunas características de extracción de imágenes. A través del aprendizaje se dan algunas hipótesis de la siguiente acción y de acuerdo a la probabilidad de cada hipótesis se da una acción más probable. Esta técnica es ampliamente utilizada en el área de la inteligencia artificial.
Cómo se beneficiará
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Aprendizaje de características geométricas
Capítulo 2: Reconocimiento de patrones
Capítulo 3: Transformada de Hough
Capítulo 4: Función de pérdida
Capítulo 5: ¿Expectativa? Algoritmo de maximización
Capítulo 6: Muestreo de rechazo
Capítulo 7: Procesamiento de matrices
Capítulo 8: Autocodificador
Capítulo 9: Aproximación estocástica
Capítulo 10: Detección de tablero de ajedrez
(II) Respondiendo a las principales preguntas del público sobre el aprendizaje de características geométricas.
(III) ) Ejemplos del mundo real para el uso del aprendizaje de características geométricas en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básicos para cualquier tipo de aprendizaje de características geométricas.
Lee más de Fouad Sabry
Tecnologías Emergentes En Tecnologías De La Información Y Las Comunicaciones [Spanish]
Relacionado con Aprendizaje de características geométricas
Títulos en esta serie (100)
Corrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTensor trifocal: Explorando la profundidad, el movimiento y la estructura en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesMapeo de colores: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Reconstrucción tridimensional multivista: Técnicas avanzadas de percepción espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesClasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz Calificación: 0 de 5 estrellas0 calificacionesDetección de objetos: Avances, aplicaciones y algoritmos Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesHashing geométrico: Algoritmos eficientes para el reconocimiento y la comparación de imágenes Calificación: 0 de 5 estrellas0 calificacionesTransformación de característica invariante de escala: Revelando el poder de la transformación de características invariantes de escala en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGeometría Computacional: Explorando conocimientos geométricos para la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEstimación de la postura del cuerpo articulado: Desbloqueando el movimiento humano en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión de máquina: Información sobre el mundo de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesSistema de reconocimiento facial: Liberando el poder de la inteligencia visual Calificación: 0 de 5 estrellas0 calificacionesCara Propia: Explorando las profundidades del reconocimiento visual con Eigenface Calificación: 0 de 5 estrellas0 calificacionesRed de sensores visuales: Explorando el poder de las redes de sensores visuales en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia activa: Liberando el poder de los modelos de apariencia activa en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSuperficie procesal: Explorando la generación y el análisis de texturas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRecuperación de imágenes basada en contenido: Desbloqueo de bases de datos visuales Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelado y renderizado basado en imágenes: Explorando el realismo visual: técnicas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDeterminación de superficies ocultas: Revelando los secretos de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMatemática aplicada a los negocios Calificación: 0 de 5 estrellas0 calificacionesCortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesResumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesMetodología de la programación Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Máquinas predictivas: La sencilla economía de la inteligencia artificial Calificación: 5 de 5 estrellas5/5ANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificacionesKlara y el Sol Calificación: 5 de 5 estrellas5/5Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5Chat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesOracle 12c PL/SQL: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5Historia y evolución de la Inteligencia Artificial Calificación: 3 de 5 estrellas3/5Cómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5¿Cómo piensan las máquinas?: Inteligencia artificial para humanos Calificación: 5 de 5 estrellas5/5Desarrollo y programación en entornos web Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la Ingeniería Industrial Calificación: 0 de 5 estrellas0 calificacionesPython fácil Calificación: 4 de 5 estrellas4/5Cómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesMáquinas como yo Calificación: 4 de 5 estrellas4/5Sobreviviendo a la IA Calificación: 3 de 5 estrellas3/5Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesEl imperio de los algoritmos: IA inclusiva, ética y al servicio de la humanidad Calificación: 0 de 5 estrellas0 calificacionesArquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5Diseño de algoritmos y su programación en C Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5
Comentarios para Aprendizaje de características geométricas
0 clasificaciones0 comentarios
Vista previa del libro
Aprendizaje de características geométricas - Fouad Sabry
Capítulo 1: Aprendizaje de características geométricas
El aprendizaje automático y la visión artificial se unen en un método llamado aprendizaje de características geométricas, que se utiliza para completar tareas visuales. Al extraer características geométricas de las fotos y aprenderlas con métodos efectivos de aprendizaje automático, este método busca establecer un conjunto de características representativas de la forma geométrica para describir un objeto. Al obtener información perceptual de lo que ven, los humanos pueden resolver problemas visuales y responder rápidamente a su entorno. Con el fin de abordar los problemas de la visión por computadora, los investigadores han comenzado a modelar estrategias de reconocimiento de objetos humanos. Para ayudar a los robots móviles a navegar de forma segura, investigadores como M. Mata et al. (2002) emplearon métodos de aprendizaje de características. Se utilizaron algoritmos genéticos para el aprendizaje de características y el reconocimiento de objetos (figuras). Al estudiar una secuencia de imágenes sensoriales de entrada, generalmente extrayendo características de ellas, los enfoques de aprendizaje de características geométricas pueden no solo manejar problemas de reconocimiento, sino también anticipar comportamientos futuros. El proceso de aprendizaje proporciona un conjunto de hipótesis sobre el siguiente paso, y luego clasifica las hipótesis en orden de probabilidad para determinar el curso de acción más probable. El campo de la inteligencia artificial hace un uso extensivo de este método.
Las imágenes incluyen características geométricas únicas que se pueden extraer mediante técnicas de aprendizaje de características geométricas. Los objetos pueden tener cualidades geométricas porque se construyen a partir de una serie de partes geométricas como puntos, líneas, curvas y superficies. Las técnicas de detección de características son capaces de identificar características como esquinas, bordes, manchas, crestas, puntos salientes y otras áreas prominentes de la textura de una imagen.
Características primitivas
Las esquinas de los objetos son un elemento de diseño simple pero crucial. Las cosas complejas, en particular, a menudo exhiben características de esquina contrastantes. La detección de esquinas es un método para aislar las cuatro esquinas de un objeto. Cho y Dunn definieron una esquina en un nuevo enfoque, basado en la separación y el ángulo de dos líneas paralelas. En este novedoso enfoque, las características se definen como la suma parametrizada de muchos subcomponentes.
Los bordes de una imagen son sus elementos estructurales distintivos en una sola dimensión. Denotan los límites entre las distintas áreas visuales. La detección de bordes es un método para localizar de forma rápida y precisa los contornos de un objeto.
El método de detección de blobs se utiliza para identificar blobs, que son regiones de las fotografías.
Desde una perspectiva aplicada, una cresta puede interpretarse como una curva simétrica unidimensional. Ver también: Método de detección de crestas.
para el enfoque del detector de prominencia Kadir-Brady en las características sobresalientes, la textura de la imagen
Características del compuesto
Composición geométrica
Varias entidades primitivas, como bordes, esquinas o manchas, se combinan para formar una única entidad de componente geométrico. A continuación mostramos cómo se puede utilizar el punto de referencia para calcular el vector necesario para extraer la característica geométrica en la posición x:
\textstyle \ x_{{i}}=x_{{i-1}}+\sigma _{{i-1}}d_{{i}}{\begin{bmatrix}\cos(\theta _{{i-1}}+\phi _{{i}})\\\sin(\theta _{{i-1}}+\phi _{{i}})\end{bmatrix}}\textstyle \ \theta _{{i}}=\theta _{{i-1}}+\Delta \theta _{{i}}\textstyle \ \sigma _{{i}}=\sigma _{{i-1}}\Delta \sigma _{{i}}Las ubicaciones de las entidades se indican con el símbolo x, \textstyle \theta significa la orientación, \textstyle \sigma significa la escala intrínseca.
Composición booleana
Dos entidades más, ya sean entidades primitivas u otras entidades compuestas, conforman una entidad compuesta booleana. Las características booleanas se pueden dividir en dos categorías: características conjuntivas cuyo valor es el producto de dos subcaracterísticas y características disyuntivas cuyo valor es el máximo de las dos subcaracterísticas.
Segen fue el primero en reflexionar sobre el concepto de un espacio de características
en el campo de la visión por computadora. Para representar las relaciones geométricas entre los rasgos regionales, utilizó un gráfico de varios niveles.
El reconocimiento de objetos en imágenes se puede enseñar con cualquier número de técnicas de aprendizaje disponibles. Es posible agregar nuevos tipos de objetos a su repertorio durante el proceso de aprendizaje.
Detección de esquinas
Ajuste de curvas
Detección de bordes
Extracción de estructuras globales
Histogramas de características
Detección de líneas
Etiquetado de piezas interconectadas
Textura de la imagen
Estimación de movimiento
1. Obtener una nueva imagen de entrenamiento I
.
2. Evaluar el resultado a la luz del algoritmo de reconocimiento. Las nuevas clases de objeto se reconocen si el resultado es positivo.
Algoritmo de reconocimiento
Encontrar las características que distinguen a una clase de otra es el objetivo principal de todo programa de reconocimiento.
Por lo tanto, use la siguiente ecuación para maximizar la característica \textstyle \ f_{{max}}
\textstyle \ I_{{max}}={\underset {f}{max}}{\underset {C}{max}}I(C,F_{{f}})\textstyle \ I(C,F_{{f}})=-{\underset {C}{\sum }}{\underset {F_{{f}}}{\sum }}BEL(F_{{f}},C)\log {\frac {BEL(C,F_{{f}})}{BEL(F_{{f}})BEL(C)}}Evaluación del valor de la característica de una imagen \textstyle \ f_{{max}} y, \textstyle \ f_{{f_{{max}}}} también, para adaptar un atributo a una región específica:
\textstyle \ f_{{f_{{(p)}}}}(I)={\underset {x\in I}{max}}f_{{f_{{(p)}}}}(x)Donde \textstyle f_{{f_{{(p)}}}}(x) se define como
\textstyle f_{{f_{{(p)}}}}(I)=max\left\{0,{\frac {f(p)^{T})f(x)}{\left\|f(p)\right\|\left\|f(x)\right\|}}\right\}evaluación
Hay cinco categorías de evaluación de los resultados del reconocimiento: correctos, incorrectos, ambiguos, confusos e ignorantes. Estas categorías ayudan a determinar si las clases se pueden reconocer después del reconocimiento de las entidades. Agregue una nueva imagen de entrenamiento una vez que la evaluación sea precisa. En el caso de que el reconocimiento no tenga éxito, se recomienda que los nodos característicos maximicen su poder de distingución, medido por la distancia de Kolmogorov-Smirnoff (KSD).
\textstyle KSD_{{a,b}}(X)={\underset {\alpha }{max}}\left|cdf(\alpha |a)-cdf(\alpha |b)\right|3.Algoritmo para adquirir características A continuación, se utiliza el enfoque de aprendizaje de características para probar la precisión del reconocimiento de la red bayesiana después de que se haya identificado la característica.
El objetivo principal de un método de aprendizaje de características es descubrir una característica novedosa a partir de una imagen de muestra con la que evaluar si las clases se han reconocido correctamente o no. Hay dos escenarios en los que pensar: Con la imagen de ejemplo, busque características novedosas de la clase verdadera y de la clase incorrecta. Se reconoce una clase y el procedimiento debe finalizar si se descubre una nueva característica de la clase verdadera y no se descubre la clase incorrecta. Elimine las entidades de la red bayesiana que se pueden utilizar para reconocer la clase falsa si se encuentran en la imagen de ejemplo pero no en la clase real.
El procedimiento de prueba se actualiza utilizando una red bayesiana.
D utilizó un concepto llamado probablemente más o menos correcto (PAC).
Este enfoque fue utilizado por Roth (2002) para crear una teoría de aprendizaje libre de distribución para la visión por computadora.
La creación de un método de aprendizaje eficiente en características fue crucial para el éxito de esta hipótesis.
El propósito de este algoritmo es reconocer un objeto en una imagen en función de sus características geométricas.
Los vectores de características se utilizan como entrada, y un 1 al final indica que la detección de objetos se ha realizado correctamente, mientras que un 0 indica un error.
La idea clave detrás de este método de aprendizaje es acumular características que puedan describir fielmente el elemento a través de una función, y luego poner esa función a prueba reconociendo un objeto en una imagen.
El algoritmo de aprendizaje tiene como objetivo predecir si el concepto objetivo aprendido \textstyle f_{{T}}(X) pertenece a una clase, donde X es el espacio de instancia y los parámetros se prueban para ver si son precisos.
Una vez que se han aprendido las características, se pueden utilizar para evaluar la eficacia de los algoritmos de aprendizaje. D. Roth utilizó dos algoritmos de aprendizaje:
1.El algoritmo de nodos dispersos en un árbol (SNoT)
SNoW-Tren
Paso inicial: poner en sus iniciales el conjunto de características \textstyle F_{{t}}=\phi que se vinculan al objetivo t para todos . \textstyle t\in T
T es un conjunto de objetivos de objeto cuyos elementos son \textstyle t_{{1}} \textstyle t_{{k}}
Establezca el peso inicial y la entidad de vínculo en el destino si el conjunto T contiene solo destinos que comparten un conjunto de entidades activas.
Evalúe los objetivos : compare los objetivos \textstyle {\underset {i\in e}{\sum }}w_{{i}}^{{t}} con \textstyle \theta _{{t}} , donde \textstyle w_{{i}}^{{t}} es el peso en una posición que conecta las características i con el objetivo t.
theta t es el umbral deseado, no t.
Ajuste la importancia en función de los resultados del análisis.
Hay dos casos: predicción positiva en un ejemplo negativo ( \textstyle {\underset {i\in e}{\sum }}w_{{i}}^{{t}}>\theta _{{t}} y los objetivos no están en la lista de características activas) y predicción negativa en un ejemplo positivo ( \textstyle {\underset {i\in e}{\sum }}w_{{i}}^{{t}}\leq \theta _{{t}} y los objetivos están en la lista de características activas).
Evaluación SNoW
Aplicar la misma función evaluativa descrita en la oración anterior a cada objetivo.
Predicción: Elija el nodo con los procesos de terminal más activos.
Sistema de soporte basado en vectores
El objetivo principal de SVM es encontrar un hiperplano para separar el conjunto de muestras \textstyle (x_{{i}},y_{{i}}) donde \textstyle x_{i} es un vector de entrada que es una selección de características \textstyle x\in R^{{N}} y \textstyle y_{{i}} es la etiqueta de \textstyle x_{i} .
El hiperplano tiene la siguiente forma:
\textstyle f(x)=sgn\left(\sum _{{i=1}}^{{l}}y_{{i}}\alpha _{{i}}\cdot k(x,x_{{i}})+b\right)=\left\{{\begin{matrix}1,positive\;inputs\\-1,negative\;inputs\end{matrix}}\right.\textstyle k(x,x_{{i}})=\phi (x)\cdot \phi (x_{{i}})