Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Histograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora
Histograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora
Histograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora
Libro electrónico115 páginas1 hora

Histograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

¿Qué es el histograma de gradientes orientados?


En los campos de la visión por computadora y el procesamiento de imágenes, el histograma de gradientes orientados (HOG) es un descriptor de características que se utiliza para este propósito. de detección de objetos. Esta técnica se utiliza para contar el número de casos de orientación de degradado que ocurren en regiones específicas de una imagen. Esta técnica es comparable a los histogramas de orientación de bordes, los descriptores de transformación de características invariantes de escala y los contextos de formas; sin embargo, difiere de esos métodos en que se calcula en una cuadrícula densa de celdas espaciadas uniformemente y emplea una normalización de contraste local superpuesta con el fin de lograr un mayor nivel de precisión.


Cómo lo harás beneficio


(I) Insights y validaciones sobre los siguientes temas:


Capítulo 1: Histograma de gradientes orientados


Capítulo 2: Detección de bordes


Capítulo 3: Transformación de características invariantes de escala


Capítulo 4: Funciones robustas aceleradas


Capítulo 5: GLOH


Capítulo 6: Patrones binarios locales


Capítulo 7: Orientado RÁPIDO y rotado BRIEF


Capítulo 8: Impulsar (aprendizaje automático)


Capítulo 9: Segmentación de imágenes


Capítulo 10: Detección de objetos


(II) Respondiendo a las principales preguntas del público sobre el histograma de gradientes orientados.


(III) Ejemplos del mundo real para el uso del histograma de gradientes orientados en muchos campos .


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de histograma de gradientes orientados.


 


 

IdiomaEspañol
Fecha de lanzamiento30 abr 2024
Histograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora

Relacionado con Histograma de gradientes orientados

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Histograma de gradientes orientados

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Histograma de gradientes orientados - Fouad Sabry

    Capítulo 1: Histograma de gradientes orientados

    En la visión artificial y el procesamiento de imágenes, el histograma de gradientes orientados (HOG) es un descriptor de características que se utiliza para la detección de objetos. Este método utiliza la dirección de los degradados en regiones discretas de una imagen para contar sus apariciones. En comparación con los histogramas de orientación de bordes, los descriptores de transformación de características invariantes a escala y los contextos de forma, esta técnica es más precisa porque se calcula en una cuadrícula densa de celdas espaciadas uniformemente y hace uso de la normalización de contraste local superpuesta.

    Las ideas de HOG fueron esbozadas por primera vez en 1986 por Robert K. McConnell de Wayland Research Inc. sin el apodo de HOG. Sin embargo, no fue hasta 2005, cuando los investigadores Navneet Dalal y Bill Triggs del Instituto Nacional de Investigación en Ciencias de la Computación y Automatización de Francia (INRIA) presentaron su trabajo adicional sobre los descriptores HOG en la Conferencia sobre Visión por Computadora y Reconocimiento de Patrones que fueron ampliamente adoptados (CVPR). Inicialmente se concentraron en la detección de peatones en fotos fijas, pero posteriormente ampliaron sus pruebas para incluir la detección de personas en video, así como la detección de una amplia gama de animales y vehículos comunes en fotografías fijas.

    El descriptor de histograma de gradientes dirigidos se basa en la idea de que la apariencia y la forma de los objetos a nivel local dentro de una imagen se pueden representar mediante la distribución de gradientes de intensidad o direcciones de borde. Se crea un histograma de direcciones de gradiente para cada píxel de la imagen dividiéndolo en pequeñas secciones conectadas llamadas celdas. La combinación de estos histogramas en una sola métrica sirve como descripción. Los histogramas locales se pueden normalizar por contraste para aumentar la precisión calculando primero una medida de intensidad en una parte más grande de la imagen (un bloque) y luego usando este valor para normalizar todas las celdas dentro del bloque. El resultado de esta estandarización es una mayor resistencia a las manchas claras y oscuras.

    Varios beneficios significativos diferencian a la descripción de HOG de sus competidores. Dado que solo afecta a las células cercanas, permanece inalterado por los cambios de escala o iluminación, con la excepción de la rotación. Solo en áreas geográficas más grandes veríamos este tipo de cambios. Además, Dalal y Triggs descubrieron que mientras los peatones mantengan sus cuerpos casi erguidos, su movimiento puede ser ignorado gracias al muestreo espacial grueso, el muestreo de orientación fina y la fuerte normalización fotométrica local. Es por eso que el descriptor HOG sobresale en la búsqueda de personas en imágenes.

    En muchos detectores de características, la normalización de los valores de color y gamma es el paso inicial del cálculo en el preprocesamiento de imágenes. Sin embargo, en el cálculo del descriptor HOG, Dalal y Triggs argumentan que este paso es innecesario porque la normalización posterior del descriptor logra el mismo objetivo. Como resultado, el preprocesamiento de imágenes tiene un efecto insignificante en el rendimiento. En su lugar, el cálculo de los valores de gradiente es lo primero. La aplicación de la máscara derivada discreta de punto centrada de 1 dimensión en la dirección horizontal o vertical es la forma más típica. Para que esta técnica funcione, los datos de color o intensidad de la imagen deben filtrarse utilizando los siguientes núcleos:

    {\displaystyle [-1,0,1]{\text{ and }}[-1,0,1]^{\top }.\,}

    Si bien Dalal y Triggs usaron máscaras más sofisticadas como la máscara Sobel 3x3 y las máscaras diagonales, descubrieron que eran menos efectivas para identificar a las personas en las fotos. También intentaron usar un suavizador gaussiano antes de aplicar la máscara derivada, pero descubrieron que ningún suavizado en realidad producía mejores resultados.

    Los histogramas celulares se generan como la segunda etapa del proceso.

    Cada píxel dentro de la celda utiliza los valores de degradado para emitir un voto ponderado para un bin en el histograma que se basa en la orientación.

    Las celdas en sí pueden adoptar una configuración cuadrada o circular, y los canales del histograma abarcan un uniforme de 0 a 180 o de 0 a 360 grados, dependiendo de si el gradiente es sin signo o con signo.

    Los mejores resultados en los ensayos de detección humana realizados por Dalal y Triggs se lograron cuando se combinaron gradientes sin signo con 9 canales de histograma, al tiempo que se señaló que los gradientes con signo mejoran en gran medida el reconocimiento de objetos para otras categorías, de la misma manera que lo hacen los automóviles y las motocicletas.

    En términos de la importancia de cada voto, los píxeles pueden contribuir a la magnitud del gradiente, o a una escala o función del tamaño.

    En las pruebas, los mejores resultados generalmente se logran centrándose solo en la magnitud del gradiente.

    La raíz cuadrada o el cuadrado del tamaño del gradiente son dos medidas potenciales más del peso del voto, o una medida truncada de la misma.

    Las intensidades del gradiente deben normalizarse localmente para tener en cuenta las variaciones en la iluminación y el contraste, lo que requiere agrupar las celdas en bloques más grandes y conectados geográficamente. Por último, el descriptor HOG es la suma vectorial de los componentes de los histogramas celulares normalizados para cada bloque. Cada celda a menudo contribuye a la descripción final de más de una manera debido a la naturaleza superpuesta de estos bloques. Las formas más comunes para los bloques son cuadradas o rectangulares para los bloques R-HOG y circulares para los bloques C-HOG. Los bloques R-HOG suelen ser cuadrículas cuadradas, donde el recuento de celdas, el recuento de píxeles y el recuento de canales del histograma son las características definitorias. Cuatro celdas de 8x8 píxeles por bloque (bloque de 16x16 píxeles) con 9 canales de histograma demostraron ser las mejores en el experimento de detección humana realizado por Dalal y Triggs. Además, descubrieron que el rendimiento puede mejorarse ligeramente mediante el uso de un marco espacial gaussiano dentro de cada bloque antes de contar los votos del histograma para proporcionar menos peso a los píxeles cerca de los bordes del bloque. Aunque los bloques R-HOG y los descriptores de transformación de características invariantes de escala (SIFT) pueden parecer similares a primera vista, se forman de manera diferente. Por lo general, los descriptores SIFT se calculan en puntos clave de imagen dispersos e invariantes a escala y se rotan para alinear la orientación, mientras que los bloques R-HOG se calculan en cuadrículas densas a una sola escala sin alineación de orientación. Además, a diferencia de los descriptores SIFT, que se utilizan solos, los bloques R-HOG se utilizan juntos para representar información de formas espaciales.

    Hay dos tipos distintos de bloques circulares de HOG (C-HOG): los que tienen una sola celda central y los que tienen celdas divididas angularmente. Los cuatro factores que caracterizan a estos bloques C-HOG son el número de bins angulares y radiales, el radio del bins central y el factor de expansión para el radio de los bins radiales adicionales. Dalal y Triggs no descubrieron ninguna diferencia de rendimiento entre las dos variaciones primarias,

    ¿Disfrutas la vista previa?
    Página 1 de 1