Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Detección de objetos: Avances, aplicaciones y algoritmos
Detección de objetos: Avances, aplicaciones y algoritmos
Detección de objetos: Avances, aplicaciones y algoritmos
Libro electrónico146 páginas1 hora

Detección de objetos: Avances, aplicaciones y algoritmos

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

Qué es la detección de objetos


El campo de la tecnología informática conocido como detección de objetos está estrechamente asociado con la visión por computadora y el procesamiento de imágenes. Su objetivo principal es identificar instancias de objetos semánticos que pertenecen a una clase específica dentro de imágenes y videos digitales. En el campo de la detección de objetos, la detección de rostros y la detección de peatones son dos áreas que han recibido amplia atención. La detección de objetos es útil en una amplia variedad de aplicaciones de visión por computadora, incluida la recuperación de imágenes y la videovigilancia, entre otras.


Cómo se beneficiará


(I ) Información y validaciones sobre los siguientes temas:


Capítulo 1: Detección de objetos


Capítulo 2: Visión por computadora


Capítulo 3: Segmentación de imágenes


Capítulo 4: Coincidencia de plantillas


Capítulo 5: Reconocimiento óptico braille


Capítulo 6: Aprendizaje profundo


Capítulo 7: Red neuronal convolucional


Capítulo 8: DeepDream


Capítulo 9: Mapa de prominencia


Capítulo 10: Detección de objetos pequeños


(II) Respondiendo las principales preguntas del público sobre la detección de objetos .


(III) Ejemplos del mundo real para el uso de la detección de objetos en muchos campos.


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o información básica para cualquier tipo de Detección de Objetos.


 


 

IdiomaEspañol
Fecha de lanzamiento4 may 2024
Detección de objetos: Avances, aplicaciones y algoritmos

Relacionado con Detección de objetos

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Detección de objetos

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Detección de objetos - Fouad Sabry

    Capítulo 1: Detección de objetos

    La detección de objetos es un subcampo de la visión artificial y el procesamiento de imágenes que busca identificar sujetos reconocibles en imágenes y videos digitales en función de sus características. El reconocimiento facial y el conteo de personas son dos ejemplos de subcampos de detección de objetos bien estudiados. Las aplicaciones de la detección de objetos en la visión artificial van desde la recuperación de imágenes hasta la vigilancia.

    Las aplicaciones comunes en el campo de la visión por computadora incluyen la anotación de imágenes, la detección de rostros, el reconocimiento de rostros y la cosegmentación de objetos en videos. También se utiliza para rastrear cosas como la pelota en un partido de fútbol, el bate de cricket en un partido de cricket o una persona en un videojuego.

    La tarea de detección de objetos suele ser mucho más difícil debido a que las imágenes de prueba se muestrean a partir de una distribución de datos diferente. Dado que las etiquetas no requieren ninguna intervención humana, la detección de objetos entre dominios se utiliza en muchos contextos diferentes, incluida la conducción autónoma.

    Las clases de objetos pueden distinguirse entre sí por características compartidas; Por ejemplo, todos los círculos comparten la propiedad de ser esféricos. Las características únicas se utilizan para determinar la clase de un objeto. En el caso de los círculos, por ejemplo, buscamos objetos que estén a un cierto radio de un punto dado. La misma lógica se aplica a la búsqueda de cuadrados, que requiere objetos con esquinas perpendiculares y lados de igual longitud. Los rasgos faciales como los ojos, la nariz y los labios, así como los no anatómicos como el color de la piel y la distancia entre los ojos, se utilizan de manera similar para la identificación del rostro.

    Los métodos de detección de objetos se pueden clasificar como basados en redes neuronales o no neuronales. Para clasificar los datos sin recurrir a las redes neuronales, es necesario definir primero las características con uno de los siguientes enfoques. Sin embargo, las técnicas neuronales, normalmente basadas en redes neuronales convolucionales, pueden realizar la detección de objetos de extremo a extremo sin necesidad de la definición de características (CNN).

    El uso de métodos no neuronales:

    Reconocimiento de objetos mediante el marco Viola-Jones con funciones de Haar

    Transformación para entidades invariantes de escala (SIFT)

    Características del histograma de gradiente orientado (HOG)

    Métodos basados en redes neuronales:

    Propuestas por región (R-CNN,)

    Un detector multicaja (SSD) individual

    Cuando lo ves, lo sabes (YOLO)

    Una red neuronal con ajuste fino de una sola vez para identificar objetos (RefineDet)

    Retina-Net

    Redes convolucionales deformables

    {Fin del capítulo 1}

    Capítulo 2: Visión artificial

    El estudio de cómo las computadoras pueden obtener conocimiento de alto nivel a partir de imágenes o videos digitales es el foco del área científica multidisciplinaria de la visión por computadora. Desde el punto de vista tecnológico, investiga e intenta automatizar actividades que están dentro de las capacidades del sistema visual humano.

    Las tareas asociadas con la visión por computadora incluyen técnicas para obtener, procesar, analizar y comprender imágenes digitales, así como la extracción de datos de alta dimensión del entorno físico para crear información numérica o simbólica, como juicios.

    La visión por computadora es un subcampo de las ciencias de la computación que investiga los fundamentos teóricos de los sistemas artificiales diseñados para obtener información de imágenes. Los datos visuales pueden presentarse en una variedad de formatos, incluidas secuencias de video, imágenes obtenidas de varias cámaras, datos multidimensionales obtenidos de un escáner 3D o equipo de escaneo médico, etc. El objetivo del campo técnico conocido como visión por computador es implementar las ideas y modelos que ha desarrollado en el proceso de construcción de sistemas de visión por computador.

    Los campos de la reconstrucción de escenas, la detección de objetos, la detección de eventos, el seguimiento de vídeo, el reconocimiento de objetos, la estimación de poses en 3D, el aprendizaje, la indexación, la estimación de movimiento, el servoing visual, el modelado de escenas en 3D y la restauración de imágenes son subdominios de la visión por ordenador. Otros subdominios de la visión artificial incluyen el modelado de escenas en 3D.

    La visión por computadora es un estudio multidisciplinario que examina cómo se pueden programar las computadoras para extraer conocimiento de alto nivel de imágenes o películas digitales. Esta área se centra en cómo se puede enseñar a las computadoras a comprender lo que se les muestra. Desde el punto de vista de la ingeniería, el objetivo es encontrar formas de automatizar operaciones que ya pueden ser realizadas por el sistema visual humano. La visión por computadora es un campo de estudio en el campo de la tecnología de la información que se centra en la aplicación de teorías y modelos existentes al proceso de construcción de sistemas de visión por computadora.

    A finales de la década de 1960, las universidades que estaban a la vanguardia de la inteligencia artificial fueron las primeras en experimentar con la visión por computadora. Su propósito era funcionar de una manera similar a la del sistema visual humano, con el objetivo final de imbuir a los robots de un comportamiento inteligente. En la década de 1990, varias de las áreas de estudio que se habían estudiado antes se volvieron más activas que las demás. El estudio de las reconstrucciones tridimensionales proyectivas condujo a una comprensión más profunda de cómo calibrar una cámara. Con la introducción de técnicas de optimización para la calibración de la cámara, quedó claro que un número significativo de los conceptos habían sido investigados previamente por la disciplina de la teoría del ajuste de haces de la fotogrametría. Esto salió a la luz como resultado de este desarrollo. Esto dio lugar al desarrollo de técnicas para realizar reconstrucciones tridimensionales dispersas de escenas utilizando varias fotografías. Tanto el problema de la correspondencia estéreo densa como el desarrollo de otros enfoques estéreo multivista vieron cierto grado de avance. Al mismo tiempo, se utilizaron muchas variantes de corte gráfico para abordar el problema de la segmentación de imágenes. Esta década fue especialmente significativa, ya que fue la primera vez que se utilizaron en la práctica métodos de aprendizaje estadístico para la tarea de reconocer rostros en fotografías (ver Eigenface). Las áreas de gráficos por computadora y visión por computadora se han entrelazado más en los últimos años, lo que ha llevado a un gran aumento en la cantidad de colaboración que ha tenido lugar entre los dos. Esto presentaba las primeras formas de renderizado de campo de luz, unión de imágenes panorámicas, transformación de imágenes, interpolación de vistas y renderizado basado en imágenes. El área de la visión artificial ha cobrado una nueva vida gracias al desarrollo de algoritmos basados en el aprendizaje profundo. La precisión de los algoritmos de aprendizaje profundo en numerosos conjuntos de datos de visión artificial de referencia para tareas que van desde la clasificación hasta el flujo óptico ha superado a la de los enfoques anteriores. Estas tareas incluyen la segmentación de imágenes y el flujo óptico.

    La visión artificial de estado sólido está fuertemente relacionada con otras disciplinas, incluida la física. La gran mayoría de los sistemas de visión artificial se basan en sensores de imagen, que son dispositivos capaces de detectar la radiación electromagnética. Esta radiación se manifiesta comúnmente como luz visible o infrarroja. En el desarrollo de los sensores se utilizó la física cuántica. La disciplina científica de la física proporciona una explicación para el método a través del cual la luz interactúa con las superficies. El comportamiento de la óptica, que es un componente fundamental de la mayoría de los sistemas de imagen, puede explicarse por la física. Con el fin de ofrecer un conocimiento completo del proceso por el cual se forma una imagen, los sensores de imagen sofisticados necesitan el uso de la mecánica cuántica. La visión por computadora también se puede utilizar para resolver una variedad de problemas de medición que surgen en física, como los que involucran el movimiento de fluidos.

    La disciplina científica de la neurobiología, más especialmente la investigación del sistema visual biológico. Los ojos, las neuronas y las regiones cerebrales que se dedican al procesamiento de estímulos visuales tanto en humanos como en diversos animales han sido objeto de una cantidad sustancial de investigación en el transcurso del último siglo. Como consecuencia de esto, ha surgido una descripción simple pero intrincada de la forma en que funcionan los sistemas de visión reales para completar varias tareas relacionadas con la visión. Como consecuencia de estos hallazgos, ha surgido un subcampo de la visión por computadora en el que los sistemas artificiales están destinados a imitar el procesamiento y el comportamiento de los sistemas biológicos, con diversos grados de semejanza biológica. Muchos de los enfoques basados en el aprendizaje que se han creado dentro de la visión por computadora tienen sus raíces en la biología. Algunos ejemplos de estos métodos basados en el aprendizaje incluyen el análisis y la categorización de imágenes y características basados en redes neuronales y aprendizaje profundo.

    Algunas ramas de la investigación de la visión por computadora son muy similares al estudio de la visión biológica. Muchas ramas de la investigación de la IA también son muy similares al estudio de la conciencia humana y la aplicación de conocimientos adquiridos previamente para interpretar, integrar y utilizar la información visual. El estudio y modelado de los mecanismos fisiológicos que subyacen a la percepción visual en humanos y otros animales es competencia de la disciplina académica de la visión biológica. Por otro lado, la visión artificial es el estudio y descripción de los procesos que se implementan en el software y hardware que subyacen a los sistemas de visión artificial. La colaboración interdisciplinaria entre las ciencias de la visión biológica y la visión por ordenador ha demostrado ser beneficiosa para ambas áreas.

    El procesamiento de señales es

    ¿Disfrutas la vista previa?
    Página 1 de 1