Detección de objetos: Avances, aplicaciones y algoritmos
Por Fouad Sabry
()
Información de este libro electrónico
Qué es la detección de objetos
El campo de la tecnología informática conocido como detección de objetos está estrechamente asociado con la visión por computadora y el procesamiento de imágenes. Su objetivo principal es identificar instancias de objetos semánticos que pertenecen a una clase específica dentro de imágenes y videos digitales. En el campo de la detección de objetos, la detección de rostros y la detección de peatones son dos áreas que han recibido amplia atención. La detección de objetos es útil en una amplia variedad de aplicaciones de visión por computadora, incluida la recuperación de imágenes y la videovigilancia, entre otras.
Cómo se beneficiará
(I ) Información y validaciones sobre los siguientes temas:
Capítulo 1: Detección de objetos
Capítulo 2: Visión por computadora
Capítulo 3: Segmentación de imágenes
Capítulo 4: Coincidencia de plantillas
Capítulo 5: Reconocimiento óptico braille
Capítulo 6: Aprendizaje profundo
Capítulo 7: Red neuronal convolucional
Capítulo 8: DeepDream
Capítulo 9: Mapa de prominencia
Capítulo 10: Detección de objetos pequeños
(II) Respondiendo las principales preguntas del público sobre la detección de objetos .
(III) Ejemplos del mundo real para el uso de la detección de objetos en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o información básica para cualquier tipo de Detección de Objetos.
Relacionado con Detección de objetos
Títulos en esta serie (100)
Histograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesMétodo de ajuste de nivel: Avances en la visión por computadora, exploración del método de conjunto de niveles Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPerfil de color: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesLeast Squares: Técnicas de optimización para visión por computadora: métodos de mínimos cuadrados Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Red de sensores visuales: Explorando el poder de las redes de sensores visuales en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReconocimiento óptico de Braille: Potenciando la accesibilidad a través de la inteligencia visual Calificación: 0 de 5 estrellas0 calificacionesSistema de reconocimiento facial: Liberando el poder de la inteligencia visual Calificación: 0 de 5 estrellas0 calificacionesVisión de máquina: Información sobre el mundo de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRealidad aumentada: Explorando las fronteras de la visión por computadora en realidad aumentada Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesReconocimiento de iris: Perspectivas esclarecedoras sobre el reconocimiento del iris en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCámara inteligente: Revolucionando la percepción visual con la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos Calificación: 0 de 5 estrellas0 calificacionesRecuperación de imágenes: Liberando el poder de los datos visuales Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: La guía completa para principiantes del futuro de la IA Calificación: 1 de 5 estrellas1/5Recuperación de imágenes basada en contenido: Desbloqueo de bases de datos visuales Calificación: 0 de 5 estrellas0 calificacionesSoftware Afelio: Desbloqueando la visión: explorando las profundidades del software Aphelion Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Análisis de datos e innovación para principiantes Calificación: 4 de 5 estrellas4/5Estimación de la postura del cuerpo articulado: Desbloqueando el movimiento humano en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Cómo el aprendizaje automático, la robótica y la automatización han dado forma a nuestra sociedad Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia activa: Liberando el poder de los modelos de apariencia activa en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAnotación automática de imágenes: Mejorar la comprensión visual mediante el etiquetado automatizado Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Aprendizaje automático, aprendizaje profundo y procesos de automatización Calificación: 5 de 5 estrellas5/5La IA curso de Inteligencia Artificial de principiante a experto Calificación: 0 de 5 estrellas0 calificacionesAprendizaje de características geométricas: Desbloqueo de conocimientos visuales a través del aprendizaje de características geométricas Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de gráficos por computadora: Explorando el realismo visual: conocimientos sobre gráficos por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos de trazado de rayos: Explorando la representación fotorrealista en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProgramación en inteligencia artificial: "Nuevos Horizontes", #14 Calificación: 0 de 5 estrellas0 calificacionesIA Desmitificada: ciencia y tecnología, #1 Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Introducción a la Ingeniería Industrial Calificación: 0 de 5 estrellas0 calificacionesFundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesR en profundidad: Programación, gráficos y estadística Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Cómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesMecatrónica Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5Cómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificacionesResumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesAdministración básica de bases de datos con ORACLE 12c SQL: Prácticas y ejercicios Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Introducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesArquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Casos prácticos con aprendizaje profundo Calificación: 4 de 5 estrellas4/5Inteligencia artificial: la cuarta revolución industrial Calificación: 0 de 5 estrellas0 calificacionesAprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesLaravel: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesMetodología de la Programación Orientada a Objetos Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5PHP: Programación web avanzada para profesionales Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la computación cuántica para ingenieros Calificación: 0 de 5 estrellas0 calificacionesMonetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5Oracle 12c PL/SQL: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesMáquinas filosóficas Calificación: 4 de 5 estrellas4/5Cómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificaciones
Comentarios para Detección de objetos
0 clasificaciones0 comentarios
Vista previa del libro
Detección de objetos - Fouad Sabry
Capítulo 1: Detección de objetos
La detección de objetos es un subcampo de la visión artificial y el procesamiento de imágenes que busca identificar sujetos reconocibles en imágenes y videos digitales en función de sus características. El reconocimiento facial y el conteo de personas son dos ejemplos de subcampos de detección de objetos bien estudiados. Las aplicaciones de la detección de objetos en la visión artificial van desde la recuperación de imágenes hasta la vigilancia.
Las aplicaciones comunes en el campo de la visión por computadora incluyen la anotación de imágenes, la detección de rostros, el reconocimiento de rostros y la cosegmentación de objetos en videos. También se utiliza para rastrear cosas como la pelota en un partido de fútbol, el bate de cricket en un partido de cricket o una persona en un videojuego.
La tarea de detección de objetos suele ser mucho más difícil debido a que las imágenes de prueba se muestrean a partir de una distribución de datos diferente. Dado que las etiquetas no requieren ninguna intervención humana, la detección de objetos entre dominios se utiliza en muchos contextos diferentes, incluida la conducción autónoma.
Las clases de objetos pueden distinguirse entre sí por características compartidas; Por ejemplo, todos los círculos comparten la propiedad de ser esféricos. Las características únicas se utilizan para determinar la clase de un objeto. En el caso de los círculos, por ejemplo, buscamos objetos que estén a un cierto radio de un punto dado. La misma lógica se aplica a la búsqueda de cuadrados, que requiere objetos con esquinas perpendiculares y lados de igual longitud. Los rasgos faciales como los ojos, la nariz y los labios, así como los no anatómicos como el color de la piel y la distancia entre los ojos, se utilizan de manera similar para la identificación del rostro.
Los métodos de detección de objetos se pueden clasificar como basados en redes neuronales o no neuronales. Para clasificar los datos sin recurrir a las redes neuronales, es necesario definir primero las características con uno de los siguientes enfoques. Sin embargo, las técnicas neuronales, normalmente basadas en redes neuronales convolucionales, pueden realizar la detección de objetos de extremo a extremo sin necesidad de la definición de características (CNN).
El uso de métodos no neuronales:
Reconocimiento de objetos mediante el marco Viola-Jones con funciones de Haar
Transformación para entidades invariantes de escala (SIFT)
Características del histograma de gradiente orientado (HOG)
Métodos basados en redes neuronales:
Propuestas por región (R-CNN,)
Un detector multicaja (SSD) individual
Cuando lo ves, lo sabes (YOLO)
Una red neuronal con ajuste fino de una sola vez para identificar objetos (RefineDet)
Retina-Net
Redes convolucionales deformables
{Fin del capítulo 1}
Capítulo 2: Visión artificial
El estudio de cómo las computadoras pueden obtener conocimiento de alto nivel a partir de imágenes o videos digitales es el foco del área científica multidisciplinaria de la visión por computadora. Desde el punto de vista tecnológico, investiga e intenta automatizar actividades que están dentro de las capacidades del sistema visual humano.
Las tareas asociadas con la visión por computadora incluyen técnicas para obtener, procesar, analizar y comprender imágenes digitales, así como la extracción de datos de alta dimensión del entorno físico para crear información numérica o simbólica, como juicios.
La visión por computadora es un subcampo de las ciencias de la computación que investiga los fundamentos teóricos de los sistemas artificiales diseñados para obtener información de imágenes. Los datos visuales pueden presentarse en una variedad de formatos, incluidas secuencias de video, imágenes obtenidas de varias cámaras, datos multidimensionales obtenidos de un escáner 3D o equipo de escaneo médico, etc. El objetivo del campo técnico conocido como visión por computador es implementar las ideas y modelos que ha desarrollado en el proceso de construcción de sistemas de visión por computador.
Los campos de la reconstrucción de escenas, la detección de objetos, la detección de eventos, el seguimiento de vídeo, el reconocimiento de objetos, la estimación de poses en 3D, el aprendizaje, la indexación, la estimación de movimiento, el servoing visual, el modelado de escenas en 3D y la restauración de imágenes son subdominios de la visión por ordenador. Otros subdominios de la visión artificial incluyen el modelado de escenas en 3D.
La visión por computadora es un estudio multidisciplinario que examina cómo se pueden programar las computadoras para extraer conocimiento de alto nivel de imágenes o películas digitales. Esta área se centra en cómo se puede enseñar a las computadoras a comprender lo que se les muestra. Desde el punto de vista de la ingeniería, el objetivo es encontrar formas de automatizar operaciones que ya pueden ser realizadas por el sistema visual humano. La visión por computadora es un campo de estudio en el campo de la tecnología de la información que se centra en la aplicación de teorías y modelos existentes al proceso de construcción de sistemas de visión por computadora.
A finales de la década de 1960, las universidades que estaban a la vanguardia de la inteligencia artificial fueron las primeras en experimentar con la visión por computadora. Su propósito era funcionar de una manera similar a la del sistema visual humano, con el objetivo final de imbuir a los robots de un comportamiento inteligente. En la década de 1990, varias de las áreas de estudio que se habían estudiado antes se volvieron más activas que las demás. El estudio de las reconstrucciones tridimensionales proyectivas condujo a una comprensión más profunda de cómo calibrar una cámara. Con la introducción de técnicas de optimización para la calibración de la cámara, quedó claro que un número significativo de los conceptos habían sido investigados previamente por la disciplina de la teoría del ajuste de haces de la fotogrametría. Esto salió a la luz como resultado de este desarrollo. Esto dio lugar al desarrollo de técnicas para realizar reconstrucciones tridimensionales dispersas de escenas utilizando varias fotografías. Tanto el problema de la correspondencia estéreo densa como el desarrollo de otros enfoques estéreo multivista vieron cierto grado de avance. Al mismo tiempo, se utilizaron muchas variantes de corte gráfico para abordar el problema de la segmentación de imágenes. Esta década fue especialmente significativa, ya que fue la primera vez que se utilizaron en la práctica métodos de aprendizaje estadístico para la tarea de reconocer rostros en fotografías (ver Eigenface). Las áreas de gráficos por computadora y visión por computadora se han entrelazado más en los últimos años, lo que ha llevado a un gran aumento en la cantidad de colaboración que ha tenido lugar entre los dos. Esto presentaba las primeras formas de renderizado de campo de luz, unión de imágenes panorámicas, transformación de imágenes, interpolación de vistas y renderizado basado en imágenes. El área de la visión artificial ha cobrado una nueva vida gracias al desarrollo de algoritmos basados en el aprendizaje profundo. La precisión de los algoritmos de aprendizaje profundo en numerosos conjuntos de datos de visión artificial de referencia para tareas que van desde la clasificación hasta el flujo óptico ha superado a la de los enfoques anteriores. Estas tareas incluyen la segmentación de imágenes y el flujo óptico.
La visión artificial de estado sólido está fuertemente relacionada con otras disciplinas, incluida la física. La gran mayoría de los sistemas de visión artificial se basan en sensores de imagen, que son dispositivos capaces de detectar la radiación electromagnética. Esta radiación se manifiesta comúnmente como luz visible o infrarroja. En el desarrollo de los sensores se utilizó la física cuántica. La disciplina científica de la física proporciona una explicación para el método a través del cual la luz interactúa con las superficies. El comportamiento de la óptica, que es un componente fundamental de la mayoría de los sistemas de imagen, puede explicarse por la física. Con el fin de ofrecer un conocimiento completo del proceso por el cual se forma una imagen, los sensores de imagen sofisticados necesitan el uso de la mecánica cuántica. La visión por computadora también se puede utilizar para resolver una variedad de problemas de medición que surgen en física, como los que involucran el movimiento de fluidos.
La disciplina científica de la neurobiología, más especialmente la investigación del sistema visual biológico. Los ojos, las neuronas y las regiones cerebrales que se dedican al procesamiento de estímulos visuales tanto en humanos como en diversos animales han sido objeto de una cantidad sustancial de investigación en el transcurso del último siglo. Como consecuencia de esto, ha surgido una descripción simple pero intrincada de la forma en que funcionan los sistemas de visión reales
para completar varias tareas relacionadas con la visión. Como consecuencia de estos hallazgos, ha surgido un subcampo de la visión por computadora en el que los sistemas artificiales están destinados a imitar el procesamiento y el comportamiento de los sistemas biológicos, con diversos grados de semejanza biológica. Muchos de los enfoques basados en el aprendizaje que se han creado dentro de la visión por computadora tienen sus raíces en la biología. Algunos ejemplos de estos métodos basados en el aprendizaje incluyen el análisis y la categorización de imágenes y características basados en redes neuronales y aprendizaje profundo.
Algunas ramas de la investigación de la visión por computadora son muy similares al estudio de la visión biológica. Muchas ramas de la investigación de la IA también son muy similares al estudio de la conciencia humana y la aplicación de conocimientos adquiridos previamente para interpretar, integrar y utilizar la información visual. El estudio y modelado de los mecanismos fisiológicos que subyacen a la percepción visual en humanos y otros animales es competencia de la disciplina académica de la visión biológica. Por otro lado, la visión artificial es el estudio y descripción de los procesos que se implementan en el software y hardware que subyacen a los sistemas de visión artificial. La colaboración interdisciplinaria entre las ciencias de la visión biológica y la visión por ordenador ha demostrado ser beneficiosa para ambas áreas.
El procesamiento de señales es