Estimación de movimiento: Avances y aplicaciones en visión por computadora
Por Fouad Sabry
()
Información de este libro electrónico
Qué es la estimación de movimiento
En visión por computadora y procesamiento de imágenes, la estimación de movimiento es el proceso de determinar vectores de movimiento que describen la transformación de una imagen 2D a otra; generalmente de fotogramas adyacentes en una secuencia de vídeo. Es un problema mal planteado ya que el movimiento ocurre en tres dimensiones (3D), pero las imágenes son una proyección de la escena 3D en un plano 2D. Los vectores de movimiento pueden referirse a la imagen completa o a partes específicas, como bloques rectangulares, parches de formas arbitrarias o incluso por píxel. Los vectores de movimiento pueden representarse mediante un modelo traslacional o muchos otros modelos que pueden aproximarse al movimiento de una cámara de video real, como rotación y traslación en las tres dimensiones y zoom.
Cómo lo harás beneficio
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Estimación_de_movimiento
Capítulo 2: Compensación_de_movimiento
Capítulo 3: Algoritmo_de_coincidencia de bloques
Capítulo 4: H.261
Capítulo 5: H.262/MPEG-2_Part_2
Capítulo 6: Codificación_de_vídeo_avanzada
Capítulo 7: Compensación_de_movimiento_global
Capítulo 8: Coincidencia_de_bloques_y_filtrado_3D
Capítulo 9: Tipos_de_imagen_de_compresión_de_vídeo
Capítulo 10: Superresolución_de_vídeo
(II) Respondiendo a las principales preguntas del público sobre la estimación de movimiento.
(III) Ejemplos del mundo real para el uso de la estimación de movimiento en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de estimación de movimiento.
Lee más de Fouad Sabry
Relacionado con Estimación de movimiento
Títulos en esta serie (100)
Histograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de contorno: Revelando el arte de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHashing geométrico: Algoritmos eficientes para el reconocimiento y la comparación de imágenes Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Flujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesReconstrucción tridimensional multivista: Técnicas avanzadas de percepción espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia activa: Liberando el poder de los modelos de apariencia activa en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCampo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado Calificación: 0 de 5 estrellas0 calificacionesIluminación global: Visión avanzada: conocimientos sobre la iluminación global Calificación: 0 de 5 estrellas0 calificacionesMosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos Calificación: 0 de 5 estrellas0 calificacionesModelado y renderizado basado en imágenes: Explorando el realismo visual: técnicas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesRepresentación de volumen: Explorando el realismo visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos de trazado de rayos: Explorando la representación fotorrealista en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificacionesRepresentación de gráficos por computadora: Explorando el realismo visual: conocimientos sobre gráficos por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesClasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz Calificación: 0 de 5 estrellas0 calificacionesSuperficie procesal: Explorando la generación y el análisis de texturas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos ráster: Transformando realidades visuales: dominio de los editores de gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de colores: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesGráficos rasterizados: Comprender los fundamentos de los gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión de máquina: Información sobre el mundo de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de polígono: Explorando la intersección de gráficos por computadora poligonales y visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráfico de trama digital: Revelando el poder de los gráficos rasterizados digitales en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos vectoriales: Potenciando la creación visual con algoritmos avanzados Calificación: 0 de 5 estrellas0 calificacionesEstimación de la postura del cuerpo articulado: Desbloqueando el movimiento humano en la visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Chat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesArquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesR en profundidad: Programación, gráficos y estadística Calificación: 0 de 5 estrellas0 calificacionesFundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Inteligencia artificial: Casos prácticos con aprendizaje profundo Calificación: 4 de 5 estrellas4/5Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Resumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesCómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5¿Cómo ganar dinero con la inteligencia artificial? Calificación: 0 de 5 estrellas0 calificacionesLaravel: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la computación cuántica para ingenieros Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5Monetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Mecatrónica Calificación: 0 de 5 estrellas0 calificacionesGuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio Calificación: 0 de 5 estrellas0 calificacionesPHP: Programación web avanzada para profesionales Calificación: 0 de 5 estrellas0 calificacionesMetodología de la Programación Orientada a Objetos Calificación: 0 de 5 estrellas0 calificacionesProgramacion Orientada a Objetos y Estructura de Datos a Fondo Calificación: 0 de 5 estrellas0 calificacionesCómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: la cuarta revolución industrial Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5
Comentarios para Estimación de movimiento
0 clasificaciones0 comentarios
Vista previa del libro
Estimación de movimiento - Fouad Sabry
Capítulo 1: Estimación de movimiento
La estimación de la cantidad de movimiento entre dos imágenes 2D, normalmente a partir de fotogramas sucesivos en una secuencia de vídeo, se conoce como estimación de movimiento. El movimiento se produce en tres dimensiones, pero las imágenes son proyecciones de la escena tridimensional en un plano bidimensional, lo que hace que este sea un problema mal planteado. La estimación de movimiento se puede realizar en toda la imagen (estimación de movimiento global) o en regiones más pequeñas o píxeles individuales. El modelo de traslación es solo uno de los muchos que se pueden usar para representar los vectores de movimiento, que pueden incluir cosas como la rotación, la traslación en las tres dimensiones y el acercamiento y alejamiento.
La estimación de movimiento y el flujo óptico a menudo se usan indistintamente, pero significan lo mismo. El registro de imágenes y la correspondencia estereoscópica también se relacionan de esta manera. En realidad, cada una de estas expresiones describe un método para localizar entidades coincidentes en fotografías o fotogramas de vídeo sucesivos. Los puntos en dos fotografías (fotogramas) de la misma escena o elemento del mundo real son típicamente
el mismo punto en el espacio y el tiempo. La métrica de coincidencia, una medida de la similitud de dos puntos de imagen, debe definirse antes de que pueda comenzar la estimación de movimiento. No hay una respuesta universalmente correcta aquí; Más bien, la métrica de coincidencia óptima dependerá del propósito del movimiento estimado y del enfoque de optimización empleado durante la fase de estimación.
Basándose en la ubicación del mismo macrobloque o de uno comparable en una imagen diferente, conocida como imagen de referencia, se crea un vector de movimiento para representar el macrobloque en cuestión en la imagen original.
De acuerdo con el estándar H.264/MPEG-4 AVC, el vector de movimiento se define como:
Las coordenadas de la imagen decodificada se desplazan con respecto a las coordenadas de la imagen de referencia a través de un vector bidimensional llamado vector de movimiento, que se utiliza para la predicción intermedia.
Se pueden utilizar tanto los enfoques basados en píxeles («directos») como los basados en características («indirectos») para localizar vectores de movimiento («indirectos»). Se escribieron dos artículos, uno de cada lado de una controversia bien conocida, en un esfuerzo por llegar a una resolución.
Algoritmo para hacer coincidir bloques
Técnicas basadas en la correlación de fases y en el dominio de la frecuencia
Algoritmos recursivos de píxeles
Flujo óptico
Las técnicas indirectas emplean características como la detección de esquinas para encontrar coincidencias en fotogramas adyacentes, normalmente mediante la aplicación de una función estadística en una región pequeña o grande. El objetivo de la función estadística es filtrar las coincidencias de movimiento erróneas.
RANSAC es un ejemplo de una función estadística útil.
Se puede argumentar que la definición de los criterios de coincidencia es un paso necesario en prácticamente cualquier enfoque. La única distinción real es entre comparar primero cada píxel (como con el cuadrado de la diferencia) y luego resumir sobre una región de imagen local (como con los enfoques basados en características) o viceversa (bloquear el movimiento base y el movimiento basado en filtros). Un nuevo método de coincidencia de criterios funciona resumiendo primero una región de imagen local en cada ubicación de píxel (utilizando alguna transformación de características como la transformada laplaciana) y, a continuación, comparando los dos conjuntos de resúmenes. Si bien algunos criterios de coincidencia pueden eliminar pares de elementos de datos que realmente no pertenecen juntos mientras tienen una puntuación de coincidencia alta, otros criterios de coincidencia no pueden.
En la visión artificial y el procesamiento de imágenes, la estimación del movimiento afín se utiliza para calcular una aproximación aproximada del movimiento relativo de dos imágenes o fotogramas. Supone que el movimiento se puede representar mediante una transformación lineal seguida de una traslación y rotación (transformación afín).
La compensación de movimiento es el proceso de utilizar los vectores de movimiento de una imagen para generar una nueva transformación.
La estimación y compensación de movimiento son componentes esenciales de la compresión de vídeo porque permiten el uso de redundancia temporal. Casi todos los estándares de codificación de vídeo, incluido el HEVC más actual, utilizan la estimación y compensación de movimiento basada en bloques.
Reconstruir la geometría 3D de una escena a partir de imágenes de cámara en movimiento es de lo que se trata la localización y el mapeo simultáneos.
{Fin del capítulo 1}
Capítulo 2: Compensación de movimiento
Al predecir el siguiente fotograma de un vídeo en función de los fotogramas anteriores y posteriores, la compensación de movimiento es una técnica algorítmica que se utiliza para tener en cuenta el movimiento de la cámara y/o del objeto. Se utiliza para crear archivos MPEG-2 y otros formatos de compresión de vídeo mediante la codificación de datos de vídeo. Con la transformación de una imagen de referencia a la imagen actual, la compensación de movimiento proporciona una descripción de la imagen. El período temporal de la imagen a la que se hace referencia no está limitado. La eficiencia de compresión mejora cuando se pueden sintetizar nuevas imágenes a partir de las antiguas con alta precisión.
En los estándares de codificación de vídeo, la compensación de movimiento y la transformada discreta de coseno son las dos técnicas de compresión de vídeo (DCT) más importantes. La codificación híbrida de compensación de movimiento en bloque (BMC) o DCT con compensación de movimiento (MC-DCT) se usa comúnmente en la mayoría de los estándares de codificación de video, como los formatos H.26x y MPEG (MC DCT).
La corrección de movimiento aprovecha el hecho de que la cámara o un objeto en la posición cambiante del fotograma suele ser la única diferencia entre los fotogramas sucesivos de una película. Esto significa que es muy probable que los datos utilizados para representar un fotograma de un clip de vídeo sean idénticos a los datos utilizados para representar el fotograma siguiente.
Cuando se utiliza la compensación de movimiento, una secuencia de vídeo tendrá unos pocos fotogramas completos (de referencia) y los fotogramas restantes solo contendrán los datos necesarios para convertir uno en el siguiente.
A continuación se muestra una descripción gráfica simplificada de cómo funciona la compensación de movimiento. Se tomaron dos fotogramas consecutivos de la película Elephants Dream. Debido a que incluye menos información, la diferencia inferior (con compensación de movimiento) entre dos fotogramas se comprime mucho mejor que las otras imágenes. Por lo tanto, los datos necesarios para codificar una trama compensada serán significativamente menores que los necesarios para codificar una trama diferente. Esto también significa que también es posible codificar la información utilizando una imagen diferente a un costo de menor eficiencia de compresión, pero ahorrando complejidad de codificación sin codificación compensada por movimiento; De hecho, la codificación con compensación de movimiento (junto con la estimación de movimiento, la compensación de movimiento) ocupa más del 90 por ciento de la complejidad de la codificación.
Las imágenes en MPEG se anticipan hacia atrás desde los fotogramas anteriores (fotogramas P) o hacia delante desde