Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Reconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos
Reconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos
Reconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos
Libro electrónico190 páginas2 horas

Reconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

Qué es el reconocimiento automático de objetivos


La capacidad de un algoritmo o dispositivo para reconocer objetivos u otros objetos basándose en datos adquiridos de sensores se conoce como reconocimiento automático de objetivos, un abreviatura de estas capacidades.


Cómo se beneficiará


(I) Información y validaciones sobre los siguientes temas:


Capítulo 1: Reconocimiento automático de objetivos


Capítulo 2: Visión por computadora


Capítulo 3: Radar


Capítulo 4: Radar Doppler


Capítulo 5: Radar de apertura sintética


Capítulo 6: Radar de imágenes


Capítulo 7: Formación de haces


Capítulo 8: Radar Doppler de pulso


Capítulo 9 : Radar pasivo


Capítulo 10: Radar de apertura sintética inversa


(II) Respondiendo a las principales preguntas del público sobre el reconocimiento automático de objetivos.


(III) Mundo real ejemplos del uso del reconocimiento automático de objetivos en muchos campos.


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o información básica para cualquier tipo de Reconocimiento Automático de Objetivos.


 


 

IdiomaEspañol
Fecha de lanzamiento4 may 2024
Reconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos

Lee más de Fouad Sabry

Relacionado con Reconocimiento automático de objetivos

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Reconocimiento automático de objetivos

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Reconocimiento automático de objetivos - Fouad Sabry

    Capítulo 1: Reconocimiento automático de objetivos

    El término reconocimiento automático de objetivos (ATR) se refiere a la capacidad de un algoritmo o dispositivo para identificar un objetivo u otro objeto a partir de los datos de los sensores.

    En los primeros días del radar, los operadores tenían que escuchar las representaciones de audio de las señales recibidas y usar su entrenamiento para determinar qué tipo de objetivo se estaba iluminando. A pesar de los logros de estos expertos humanos, se han desarrollado y se están desarrollando métodos automatizados para mejorar la precisión y la velocidad de la clasificación. Los animales, los seres humanos y la vegetación desordenada son solo algunos de los objetivos biológicos que se pueden identificar con la tecnología ATR. Las áreas de aplicación van desde el reconocimiento de objetos en el campo hasta la reducción del ruido de las aves en el radar meteorológico Doppler.

    Los posibles usos militares incluyen un identificador fácil de implementar como un transpondedor IFF, así como sistemas más complejos como vehículos aéreos no tripulados y misiles de crucero. Los usos potenciales de ATR en el ámbito doméstico están atrayendo cada vez más atención. Una variedad de aplicaciones, desde vehículos automatizados hasta sistemas de seguridad que pueden detectar objetos o personas en una vía del metro, hasta seguridad fronteriza, se han beneficiado de los estudios ATR.

    Casi desde que existe el radar, se han reconocido objetivos. Los operadores de radar utilizarían la representación audible de la señal reflejada para identificar bombarderos y cazas enemigos (ver Radar en la Segunda Guerra Mundial).

    Durante mucho tiempo, los operadores escuchaban la señal de banda base para identificar objetivos. Los operadores de radar capacitados pueden usar esta señal para determinar el tipo de vehículo que se utiliza para iluminar el objetivo, el tamaño del objetivo y posiblemente incluso la presencia de objetivos biológicos. Pero hay muchas restricciones en este método. Existe una alta probabilidad de error debido al componente de decisión humana, la necesidad de que el operador esté capacitado para saber cómo sonará cada objetivo y la posibilidad de que el objetivo ya no sea audible si viaja a altas velocidades. Sin embargo, este concepto de representación auditiva de la señal sentó las bases para la clasificación automatizada de objetivos. Las características de la señal de banda base que se han utilizado en otras aplicaciones de audio, como el reconocimiento de voz, se han incorporado a una serie de esquemas de clasificación que se han desarrollado.

    El alcance de un objeto se puede calcular utilizando el radar cronometrando el tiempo que tarda la señal en regresar desde el objetivo que ilumina la señal. El efecto Doppler describe la modificación de la frecuencia causada por el movimiento de dicho objeto. Un cambio de frecuencia puede ser causado por la vibración o rotación de un objeto, además del movimiento de traslación de todo el objeto. Si esto ocurre, la señal con desplazamiento Doppler se modulará. El efecto micro-Doppler se refiere al efecto Doppler adicional responsable de la modulación de la señal. Con el fin de crear algoritmos para ATR, esta modulación puede tener una firma reconocible. Cuando el objetivo se mueve, el efecto micro-Doppler provocará una señal que varía en el tiempo y la frecuencia.

    Dado que la transformada de Fourier no tiene en cuenta el tiempo, el análisis de esta señal con una transformada de Fourier es insuficiente. La transformada de Fourier de corta duración es el enfoque más sencillo para obtener una función de frecuencia-tiempo (STFT). Los dominios de frecuencia y tiempo se pueden representar simultáneamente utilizando métodos más robustos como la transformada de Gabor o la función de distribución de Wigner (WVD). Sin embargo, la resolución de frecuencia y la resolución de tiempo siempre se verán comprometidas en estos enfoques.

    Una vez extraídos estos datos espectrales, se pueden comparar con una base de datos que contiene información sobre los objetivos que el sistema identificará para determinar cuál es realmente el objetivo iluminado. Con el fin de determinar qué objetivo de la biblioteca se ajusta mejor al modelo construido utilizando la señal recibida, se utiliza un método de estimación estadística como la máxima verosimilitud (ML), el voto mayoritario (MV) o el máximo a posteriori (MAP).

    Los sistemas automatizados de reconocimiento de objetivos que utilizan funciones de audio del reconocimiento de voz para determinar la identidad de un objetivo han sido objeto de investigación. Algunos ejemplos de estos coeficientes son:

    Coeficientes LPC o códigos predictivos lineales

    Coeficientes de predicción lineal y codificación en el espectro cepstral

    Coeficientes cepstrales basados en frecuencias mel (MFCC).

    Estos coeficientes se derivan de una señal de banda base procesada y, a continuación, se utiliza un método estadístico para determinar qué objetivo de la base de datos es más similar a los coeficientes derivados. El sistema y el caso de uso deben tenerse en cuenta a la hora de decidir qué características y esquema de decisión implementar.

    Las características de la clasificación de objetivos no se limitan a los coeficientes motivados por el habla humana. El ATR se puede lograr utilizando numerosos conjuntos de características y varios métodos de detección.

    El desarrollo de una base de datos de entrenamiento es necesario para automatizar la detección de objetivos. Normalmente, el algoritmo ATR se alimenta de datos experimentales recogidos después de que se haya determinado el objetivo.

    El diagrama de flujo representa un tipo de algoritmo de detección. Esta técnica toma M bloques de datos, los modela utilizando un modelo de mezcla gaussiana y, a continuación, utiliza las características extraídas (como los coeficientes LPC o MFCC) para sacar conclusiones (GMM). Después de ajustar los datos a un modelo, se calculan las probabilidades condicionales para cada objetivo del conjunto de entrenamiento. Aquí, tenemos M bloques de datos para examinar. Esto generará M probabilidades individuales, una para cada destino de la base de datos. Usando estas probabilidades, se hace una determinación de máxima verosimilitud en cuanto a cuál es realmente el objetivo. Se ha demostrado que esta técnica puede determinar de forma fiable la presencia de hasta tres personas, así como distinguir entre tipos de vehículos (vehículos con ruedas frente a vehículos con orugas, por ejemplo).

    Un enfoque basado en CNN para el reconocimiento de objetivos

    El reconocimiento de objetivos mediante una red neuronal convolucional (CNN) puede superar a los enfoques más tradicionales. Después de entrenar con imágenes sintéticas, ha demostrado ser útil para reconocer objetivos (como tanques de batalla) en imágenes infrarrojas de escenas reales. El grado de realismo de las imágenes sintéticas es muy importante a la hora de reconocer escenas reales del conjunto de pruebas debido a las limitaciones del conjunto de entrenamiento.

    Siete capas de convolución, tres capas de agrupación máxima y una capa Softmax sirven como columna vertebral de la arquitectura general de la red CNN. Después de la segunda, cuarta y quinta capas de convolución se encuentran las capas de agrupación máxima. Antes del resultado final, se aplica una media global de pooling. Leaky ReLU se utiliza como función de activación no lineal en todas las capas de convolución.

    {Fin del capítulo 1}

    Capítulo 2: Visión artificial

    El estudio de cómo las computadoras pueden obtener conocimiento de alto nivel a partir de imágenes o videos digitales es el foco del área científica multidisciplinaria de la visión por computadora. Desde el punto de vista tecnológico, investiga e intenta automatizar actividades que están dentro de las capacidades del sistema visual humano.

    Las tareas asociadas con la visión por computadora incluyen técnicas para obtener, procesar, analizar y comprender imágenes digitales, así como la extracción de datos de alta dimensión del entorno físico para crear información numérica o simbólica, como juicios.

    La visión por computadora es un subcampo de las ciencias de la computación que investiga los fundamentos teóricos de los sistemas artificiales diseñados para obtener información de imágenes. Los datos visuales pueden presentarse en una variedad de formatos, incluidas secuencias de video, imágenes obtenidas de varias cámaras, datos multidimensionales obtenidos de un escáner 3D o equipo de escaneo médico, etc. El objetivo del campo técnico conocido como visión por computador es implementar las ideas y modelos que ha desarrollado en el proceso de construcción de sistemas de visión por computador.

    Los campos de la reconstrucción de escenas, la detección de objetos, la detección de eventos, el seguimiento de vídeo, el reconocimiento de objetos, la estimación de poses en 3D, el aprendizaje, la indexación, la estimación de movimiento, el servoing visual, el modelado de escenas en 3D y la restauración de imágenes son subdominios de la visión por ordenador. Otros subdominios de la visión artificial incluyen el modelado de escenas en 3D.

    La visión por computadora es un estudio multidisciplinario que examina cómo se pueden programar las computadoras para extraer conocimiento de alto nivel de imágenes o películas digitales. Esta área se centra en cómo se puede enseñar a las computadoras a comprender lo que se les muestra. Desde el punto de vista de la ingeniería, el objetivo es encontrar formas de automatizar operaciones que ya pueden ser realizadas por el sistema visual humano. La visión por computadora es un campo de estudio en el campo de la tecnología de la información que se centra en la aplicación de teorías y modelos existentes al proceso de construcción de sistemas de visión por computadora.

    A finales de la década de 1960, las universidades que estaban a la vanguardia de la inteligencia artificial fueron las primeras en experimentar con la visión por computadora. Su propósito era funcionar de una manera similar a la del sistema visual humano, con el objetivo final de imbuir a los robots de un comportamiento inteligente. En la década de 1990, varias de las áreas de estudio que se habían estudiado antes se volvieron más activas que las demás. El estudio de las reconstrucciones tridimensionales proyectivas condujo a una comprensión más profunda de cómo calibrar una cámara. Con la introducción de técnicas de optimización para la calibración de la cámara, quedó claro que un número significativo de los conceptos habían sido investigados previamente por la disciplina de la teoría del ajuste de haces de la fotogrametría. Esto salió a la luz como resultado de este desarrollo. Esto dio lugar al desarrollo de técnicas para realizar reconstrucciones tridimensionales dispersas de escenas utilizando varias fotografías. Tanto el problema de la correspondencia estéreo densa como el desarrollo de otros enfoques estéreo multivista vieron cierto grado de avance. Al mismo tiempo, se utilizaron muchas variantes de corte gráfico para abordar el problema de la segmentación de imágenes. Esta década fue especialmente significativa, ya que fue la primera vez que se utilizaron en la práctica métodos de aprendizaje estadístico para la tarea de reconocer rostros en fotografías (ver Eigenface). Las áreas de gráficos por computadora y visión por computadora se han entrelazado más en los últimos años, lo que ha llevado a un gran aumento en la cantidad de colaboración que ha tenido lugar entre los dos. Esto presentaba las primeras formas de renderizado de campo de luz, unión de imágenes panorámicas, transformación de imágenes, interpolación de vistas y renderizado basado en imágenes. El área de la visión artificial ha cobrado una nueva vida gracias al desarrollo de algoritmos basados en el aprendizaje profundo. La precisión de los algoritmos de aprendizaje profundo en numerosos conjuntos de datos de visión artificial de referencia para tareas que van desde la clasificación hasta el flujo óptico ha superado a la de los enfoques anteriores. Estas tareas incluyen la segmentación de imágenes y el flujo óptico.

    La visión artificial de estado sólido está fuertemente relacionada con otras disciplinas, incluida la física. La gran mayoría de los sistemas de visión artificial se basan en sensores de imagen, que son dispositivos capaces de detectar la radiación electromagnética. Esta radiación se manifiesta comúnmente como luz visible o infrarroja. En el desarrollo de los sensores se utilizó la física cuántica. La disciplina científica de la física proporciona una explicación para el método a través del cual la luz interactúa con las superficies. El comportamiento de la óptica, que es un componente fundamental de la mayoría de los sistemas de imagen, puede explicarse por la física. Con el fin de ofrecer un conocimiento completo del proceso por el cual se forma una imagen, los sensores de imagen sofisticados necesitan el uso de la mecánica cuántica. La visión por computadora también se puede utilizar para resolver una variedad de problemas de medición que surgen en física, como los que involucran el movimiento de fluidos.

    La disciplina científica de la neurobiología, más especialmente la investigación del sistema visual biológico. Los ojos, las neuronas y las regiones cerebrales que se dedican al procesamiento de estímulos visuales tanto en humanos como en diversos animales han sido objeto de una cantidad sustancial de investigación en el transcurso del último siglo. Como consecuencia de esto, ha surgido una descripción simple pero intrincada de la forma en que funcionan los sistemas de visión reales para completar varias tareas relacionadas con la visión. Como consecuencia de estos hallazgos, ha surgido un subcampo de la visión por computadora en el que los sistemas artificiales están destinados a imitar el procesamiento y el comportamiento de los sistemas biológicos, con diversos grados de semejanza biológica. Muchos de los enfoques basados en el aprendizaje

    ¿Disfrutas la vista previa?
    Página 1 de 1