Histograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora
Por Fouad Sabry
()
Información de este libro electrónico
¿Qué es el histograma de gradientes orientados?
En los campos de la visión por computadora y el procesamiento de imágenes, el histograma de gradientes orientados (HOG) es un descriptor de características que se utiliza para este propósito. de detección de objetos. Esta técnica se utiliza para contar el número de casos de orientación de degradado que ocurren en regiones específicas de una imagen. Esta técnica es comparable a los histogramas de orientación de bordes, los descriptores de transformación de características invariantes de escala y los contextos de formas; sin embargo, difiere de esos métodos en que se calcula en una cuadrícula densa de celdas espaciadas uniformemente y emplea una normalización de contraste local superpuesta con el fin de lograr un mayor nivel de precisión.
Cómo lo harás beneficio
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Histograma de gradientes orientados
Capítulo 2: Detección de bordes
Capítulo 3: Transformación de características invariantes de escala
Capítulo 4: Funciones robustas aceleradas
Capítulo 5: GLOH
Capítulo 6: Patrones binarios locales
Capítulo 7: Orientado RÁPIDO y rotado BRIEF
Capítulo 8: Impulsar (aprendizaje automático)
Capítulo 9: Segmentación de imágenes
Capítulo 10: Detección de objetos
(II) Respondiendo a las principales preguntas del público sobre el histograma de gradientes orientados.
(III) Ejemplos del mundo real para el uso del histograma de gradientes orientados en muchos campos .
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de histograma de gradientes orientados.
Otros títulos de la serie Histograma de gradientes orientados ( 30 )
Homografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesTransformación lineal directa: Aplicaciones prácticas y técnicas en visión por computadora. Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesDetección de contorno: Revelando el arte de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificaciones
Relacionado con Histograma de gradientes orientados
Títulos en esta serie (100)
Homografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesTransformación lineal directa: Aplicaciones prácticas y técnicas en visión por computadora. Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesDetección de contorno: Revelando el arte de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Machine Learning y Deep Learning Calificación: 0 de 5 estrellas0 calificaciones¿Cómo piensan las máquinas?: Inteligencia artificial para humanos Calificación: 5 de 5 estrellas5/5Máquina de vectores de soporte: Mejorando los algoritmos de aprendizaje automático para la robótica inteligente Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesAprendizaje automático y profundo en Python Calificación: 0 de 5 estrellas0 calificacionesReconstrucción tridimensional multivista: Técnicas avanzadas de percepción espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEspacio de escala: Explorando las dimensiones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMinería de datos: Desbloqueo de conocimientos mediante inteligencia algorítmica y aprendizaje automático Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesFlujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesLos siete pilares de la sabiduría estadística Calificación: 5 de 5 estrellas5/5Procesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesFundamentos de minería de datos Calificación: 0 de 5 estrellas0 calificacionesDescifrando el código: Construyendo una base para la inteligencia Artificial Calificación: 0 de 5 estrellas0 calificacionesBig data: Conceptos, tecnologías y aplicaciones Calificación: 5 de 5 estrellas5/5Ciencia de datos: La serie de conocimientos esenciales de MIT Press Calificación: 5 de 5 estrellas5/5Reducción de dimensionalidad: Avances en el procesamiento de datos para sistemas inteligentes Calificación: 0 de 5 estrellas0 calificacionesTransformación de característica invariante de escala: Revelando el poder de la transformación de características invariantes de escala en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesChatGPT. Obtén el máximo rendimiento a la Inteligencía Artificial Generativa Calificación: 0 de 5 estrellas0 calificacionesVisión de máquina: Información sobre el mundo de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAprendizaje profundo: Avances en robótica mediante sistemas inteligentes Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCómo Sacar Mejores Calificaciones con Poco Esfuerzo: 2 Libros en 1 - Técnicas de Estudio para Flojos, Cómo Leer Super Rápido Calificación: 0 de 5 estrellas0 calificacionesCuadro delimitador mínimo: Revelando el poder de la optimización espacial en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesFunción de distribución acumulativa: Un enfoque matemático para el modelado probabilístico en robótica Calificación: 0 de 5 estrellas0 calificacionesInfografía y visualización para no diseñadores Calificación: 0 de 5 estrellas0 calificacionesMentes geniales. La vida y obra de 12 grandes informáticos Calificación: 4 de 5 estrellas4/5
Inteligencia (IA) y semántica para usted
Inteligencia artificial: Conversaciones ChatGPT Calificación: 0 de 5 estrellas0 calificacionesProgramación de Inteligencia Artificial. Curso Práctico Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Inteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesMáquinas predictivas: La sencilla economía de la inteligencia artificial Calificación: 4 de 5 estrellas4/5Inteligencia artificial Calificación: 2 de 5 estrellas2/5El poder de las imagenes, la palabra no tiene poder Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5Monetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Klara y el Sol Calificación: 5 de 5 estrellas5/5El imperio de los algoritmos: IA inclusiva, ética y al servicio de la humanidad Calificación: 0 de 5 estrellas0 calificacionesEl sueño de la Inteligencia Artificial: El proyecto de construir máquinas pensantes: una historia de la IA. Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: la cuarta revolución industrial Calificación: 0 de 5 estrellas0 calificacionesChatGPT. Obtén el máximo rendimiento a la Inteligencía Artificial Generativa Calificación: 0 de 5 estrellas0 calificacionesDibujo de ingeniería: Desbloquear la percepción visual en el dibujo de ingeniería Calificación: 5 de 5 estrellas5/5GuíaBurros: Guía de escritura creativa con Inteligencia Artificial Calificación: 0 de 5 estrellas0 calificacionesDominar Chatbot GPT: Una guía completa para desbloquear el poder de las conversaciones de IA para su negocio Calificación: 0 de 5 estrellas0 calificacionesProcesamient o de Lenguaje Natural con Python: COMPUTADORAS Calificación: 0 de 5 estrellas0 calificacionesLa ola que viene: Tecnología, poder y el gran dilema del siglo XXI Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5ChatGPT y OpenAI. Desarrollo y uso de herramientas de inteligencia artificial generativa Calificación: 0 de 5 estrellas0 calificacionesInternet no es lo que pensamos: Una historia, una filosofía, una advertencia Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Guía para seres pensantes Calificación: 0 de 5 estrellas0 calificacionesAmazon Echo y Alexa Calificación: 0 de 5 estrellas0 calificacionesMinería de datos: Desbloqueo de conocimientos mediante inteligencia algorítmica y aprendizaje automático Calificación: 0 de 5 estrellas0 calificacionesMotor paso a paso: Control de precisión para aplicaciones robóticas Calificación: 0 de 5 estrellas0 calificacionesReconocimiento de gestos: Desbloqueando el lenguaje del movimiento Calificación: 0 de 5 estrellas0 calificaciones
Comentarios para Histograma de gradientes orientados
0 clasificaciones0 comentarios
Vista previa del libro
Histograma de gradientes orientados - Fouad Sabry
Capítulo 1: Histograma de gradientes orientados
En la visión artificial y el procesamiento de imágenes, el histograma de gradientes orientados (HOG) es un descriptor de características que se utiliza para la detección de objetos. Este método utiliza la dirección de los degradados en regiones discretas de una imagen para contar sus apariciones. En comparación con los histogramas de orientación de bordes, los descriptores de transformación de características invariantes a escala y los contextos de forma, esta técnica es más precisa porque se calcula en una cuadrícula densa de celdas espaciadas uniformemente y hace uso de la normalización de contraste local superpuesta.
Las ideas de HOG fueron esbozadas por primera vez en 1986 por Robert K. McConnell de Wayland Research Inc. sin el apodo de HOG. Sin embargo, no fue hasta 2005, cuando los investigadores Navneet Dalal y Bill Triggs del Instituto Nacional de Investigación en Ciencias de la Computación y Automatización de Francia (INRIA) presentaron su trabajo adicional sobre los descriptores HOG en la Conferencia sobre Visión por Computadora y Reconocimiento de Patrones que fueron ampliamente adoptados (CVPR). Inicialmente se concentraron en la detección de peatones en fotos fijas, pero posteriormente ampliaron sus pruebas para incluir la detección de personas en video, así como la detección de una amplia gama de animales y vehículos comunes en fotografías fijas.
El descriptor de histograma de gradientes dirigidos se basa en la idea de que la apariencia y la forma de los objetos a nivel local dentro de una imagen se pueden representar mediante la distribución de gradientes de intensidad o direcciones de borde. Se crea un histograma de direcciones de gradiente para cada píxel de la imagen dividiéndolo en pequeñas secciones conectadas llamadas celdas. La combinación de estos histogramas en una sola métrica sirve como descripción. Los histogramas locales se pueden normalizar por contraste para aumentar la precisión calculando primero una medida de intensidad en una parte más grande de la imagen (un bloque) y luego usando este valor para normalizar todas las celdas dentro del bloque. El resultado de esta estandarización es una mayor resistencia a las manchas claras y oscuras.
Varios beneficios significativos diferencian a la descripción de HOG de sus competidores. Dado que solo afecta a las células cercanas, permanece inalterado por los cambios de escala o iluminación, con la excepción de la rotación. Solo en áreas geográficas más grandes veríamos este tipo de cambios. Además, Dalal y Triggs descubrieron que mientras los peatones mantengan sus cuerpos casi erguidos, su movimiento puede ser ignorado gracias al muestreo espacial grueso, el muestreo de orientación fina y la fuerte normalización fotométrica local. Es por eso que el descriptor HOG sobresale en la búsqueda de personas en imágenes.
En muchos detectores de características, la normalización de los valores de color y gamma es el paso inicial del cálculo en el preprocesamiento de imágenes. Sin embargo, en el cálculo del descriptor HOG, Dalal y Triggs argumentan que este paso es innecesario porque la normalización posterior del descriptor logra el mismo objetivo. Como resultado, el preprocesamiento de imágenes tiene un efecto insignificante en el rendimiento. En su lugar, el cálculo de los valores de gradiente es lo primero. La aplicación de la máscara derivada discreta de punto centrada de 1 dimensión en la dirección horizontal o vertical es la forma más típica. Para que esta técnica funcione, los datos de color o intensidad de la imagen deben filtrarse utilizando los siguientes núcleos:
{\displaystyle [-1,0,1]{\text{ and }}[-1,0,1]^{\top }.\,}Si bien Dalal y Triggs usaron máscaras más sofisticadas como la máscara Sobel 3x3 y las máscaras diagonales, descubrieron que eran menos efectivas para identificar a las personas en las fotos. También intentaron usar un suavizador gaussiano antes de aplicar la máscara derivada, pero descubrieron que ningún suavizado en realidad producía mejores resultados.
Los histogramas celulares se generan como la segunda etapa del proceso.
Cada píxel dentro de la celda utiliza los valores de degradado para emitir un voto ponderado para un bin en el histograma que se basa en la orientación.
Las celdas en sí pueden adoptar una configuración cuadrada o circular, y los canales del histograma abarcan un uniforme de 0 a 180 o de 0 a 360 grados, dependiendo de si el gradiente es sin signo
o con signo
.
Los mejores resultados en los ensayos de detección humana realizados por Dalal y Triggs se lograron cuando se combinaron gradientes sin signo con 9 canales de histograma, al tiempo que se señaló que los gradientes con signo mejoran en gran medida el reconocimiento de objetos para otras categorías, de la misma manera que lo hacen los automóviles y las motocicletas.
En términos de la importancia de cada voto, los píxeles pueden contribuir a la magnitud del gradiente, o a una escala o función del tamaño.
En las pruebas, los mejores resultados generalmente se logran centrándose solo en la magnitud del gradiente.
La raíz cuadrada o el cuadrado del tamaño del gradiente son dos medidas potenciales más del peso del voto, o una medida truncada de la misma.
Las intensidades del gradiente deben normalizarse localmente para tener en cuenta las variaciones en la iluminación y el contraste, lo que requiere agrupar las celdas en bloques más grandes y conectados geográficamente. Por último, el descriptor HOG es la suma vectorial de los componentes de los histogramas celulares normalizados para cada bloque. Cada celda a menudo contribuye a la descripción final de más de una manera debido a la naturaleza superpuesta de estos bloques. Las formas más comunes para los bloques son cuadradas o rectangulares para los bloques R-HOG y circulares para los bloques C-HOG. Los bloques R-HOG suelen ser cuadrículas cuadradas, donde el recuento de celdas, el recuento de píxeles y el recuento de canales del histograma son las características definitorias. Cuatro celdas de 8x8 píxeles por bloque (bloque de 16x16 píxeles) con 9 canales de histograma demostraron ser las mejores en el experimento de detección humana realizado por Dalal y Triggs. Además, descubrieron que el rendimiento puede mejorarse ligeramente mediante el uso de un marco espacial gaussiano dentro de cada bloque antes de contar los votos del histograma para proporcionar menos peso a los píxeles cerca de los bordes del bloque. Aunque los bloques R-HOG y los descriptores de transformación de características invariantes de escala (SIFT) pueden parecer similares a primera vista, se forman de manera diferente. Por lo general, los descriptores SIFT se calculan en puntos clave de imagen dispersos e invariantes a escala y se rotan para alinear la orientación, mientras que los bloques R-HOG se calculan en cuadrículas densas a una sola escala sin alineación de orientación. Además, a diferencia de los descriptores SIFT, que se utilizan solos, los bloques R-HOG se utilizan juntos para representar información de formas espaciales.
Hay dos tipos distintos de bloques circulares de HOG (C-HOG): los que tienen una sola celda central y los que tienen celdas divididas angularmente. Los cuatro factores que caracterizan a estos bloques C-HOG son el número de bins angulares y radiales, el radio del bins central y el factor de expansión para el radio de los bins radiales adicionales. Dalal y Triggs no descubrieron ninguna diferencia de rendimiento entre las dos variaciones primarias,
