Campo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado
Por Fouad Sabry
()
Información de este libro electrónico
Qué es el campo de movimiento
En visión por computadora, el campo de movimiento es una representación ideal del movimiento en un espacio tridimensional (3D) tal como se proyecta en la imagen de una cámara. . Dado un modelo de cámara simplificado, cada punto en la imagen es la proyección de algún punto de la escena 3D pero la posición de la proyección de un punto fijo en el espacio puede variar con el tiempo. El campo de movimiento puede definirse formalmente como la derivada temporal de la posición de la imagen de todos los puntos de la imagen, dado que corresponden a puntos 3D fijos. Esto significa que el campo de movimiento se puede representar como una función que asigna las coordenadas de la imagen a un vector bidimensional. El campo de movimiento es una descripción ideal del movimiento 3D proyectado en el sentido de que puede definirse formalmente, pero en la práctica normalmente sólo es posible determinar una aproximación del campo de movimiento a partir de los datos de la imagen.
Cómo se beneficiará
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Campo de movimiento
Capítulo 2 : Regla de la cadena
Capítulo 3: Curl (Matemáticas)
Capítulo 4: Sistema de coordenadas polares
Capítulo 5: Teorema de Green
Capítulo 6: Elemento lineal
Capítulo 7: Matriz de cámara
Capítulo 8: Modelo de cámara estenopeica
Capítulo 9: Derivación de las ecuaciones de Navier-Stokes
Capítulo 10: Mecánica Lagrangiana Relativista
(II) Respondiendo a las principales preguntas del público sobre el campo de movimiento.
(III) Ejemplos del mundo real para el uso del campo de movimiento en muchos campos .
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de campo de movimiento.
Lee más de Fouad Sabry
Relacionado con Campo de movimiento
Títulos en esta serie (100)
Histograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de contorno: Revelando el arte de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHashing geométrico: Algoritmos eficientes para el reconocimiento y la comparación de imágenes Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Transformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesMétodo de ajuste de nivel: Avances en la visión por computadora, exploración del método de conjunto de niveles Calificación: 0 de 5 estrellas0 calificacionesFlujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesModelo de cámara estenopeica: Comprender la perspectiva a través de la óptica computacional Calificación: 0 de 5 estrellas0 calificacionesMomentos de velocidad: Capturando la dinámica: conocimientos sobre la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEstimación de movimiento: Avances y aplicaciones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSuperficie procesal: Explorando la generación y el análisis de texturas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación lineal directa: Aplicaciones prácticas y técnicas en visión por computadora. Calificación: 0 de 5 estrellas0 calificacionesCorrelación cruzada: Desbloqueo de patrones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEspacio de escala: Explorando las dimensiones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificacionesModelado y renderizado basado en imágenes: Explorando el realismo visual: técnicas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora bidimensionales: Explorando el ámbito visual: gráficos por computadora bidimensionales en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReconstrucción tridimensional multivista: Técnicas avanzadas de percepción espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de radiosidad: Avances en la visualización a través de la radiosidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos de trazado de rayos: Explorando la representación fotorrealista en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesInterpolación bilineal: Mejora de la resolución y claridad de la imagen mediante interpolación bilineal Calificación: 0 de 5 estrellas0 calificacionesDetección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia activa: Liberando el poder de los modelos de apariencia activa en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de reflexión de Phong: Comprender las interacciones de la luz en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTensor trifocal: Explorando la profundidad, el movimiento y la estructura en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de vértice: Explorando la intersección de los gráficos por computadora Vertex y la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGeometría descriptiva: Desbloqueando el ámbito visual: explorando la geometría descriptiva en visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Chat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesArquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesR en profundidad: Programación, gráficos y estadística Calificación: 0 de 5 estrellas0 calificacionesFundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Inteligencia artificial: Casos prácticos con aprendizaje profundo Calificación: 4 de 5 estrellas4/5Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Resumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesCómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5¿Cómo ganar dinero con la inteligencia artificial? Calificación: 0 de 5 estrellas0 calificacionesLaravel: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la computación cuántica para ingenieros Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5Monetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Mecatrónica Calificación: 0 de 5 estrellas0 calificacionesGuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio Calificación: 0 de 5 estrellas0 calificacionesPHP: Programación web avanzada para profesionales Calificación: 0 de 5 estrellas0 calificacionesMetodología de la Programación Orientada a Objetos Calificación: 0 de 5 estrellas0 calificacionesProgramacion Orientada a Objetos y Estructura de Datos a Fondo Calificación: 0 de 5 estrellas0 calificacionesCómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: la cuarta revolución industrial Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5
Comentarios para Campo de movimiento
0 clasificaciones0 comentarios
Vista previa del libro
Campo de movimiento - Fouad Sabry
Capítulo 1: Campo de movimiento
El campo de movimiento es la proyección perfecta del movimiento 3D sobre la imagen de una cámara, y se utiliza ampliamente en la visión por ordenador.
Suponiendo un modelo de cámara mínimamente complejo, cada punto (y_{{1}},y_{{2}}) de la imagen es la proyección de algún punto en la escena 3D, pero la posición de la proyección de un punto fijo en el espacio puede variar con el tiempo.
Dado que todos los puntos de la imagen corresponden a coordenadas 3D fijas, el campo de movimiento se puede definir formalmente como la derivada temporal de la posición de la imagen de todos los puntos de la imagen.
El campo de movimiento se puede expresar como una función que transforma las coordenadas de la imagen en un vector bidimensional.
Formalmente hablando, el campo de movimiento es la descripción perfecta del movimiento 3D proyectado, pero en la práctica, generalmente solo es posible estimar el campo de movimiento a partir de los datos de la imagen.
Un modelo de cámara asigna cada punto (x_{{1}},x_{{2}},x_{{3}}) en el espacio 3D a un punto de imagen 2D (y_{{1}},y_{{2}}) de acuerdo con algunas funciones de mapeo {\displaystyle m_{1},m_{2}} :
{\displaystyle {\begin{pmatrix}y_{1}\\y_{2}\end{pmatrix}}={\begin{pmatrix}m_{1}(x_{1},x_{2},x_{3})\\m_{2}(x_{1},x_{2},x_{3})\end{pmatrix}}}Para una escena dinámica, en la que los objetos se mueven entre sí, en la que los objetos se deforman y en la que la propia cámara está en movimiento con respecto a la escena, se asigna un punto fijo en el espacio 3D a diferentes lugares de la imagen. El resultado de diferenciar en el tiempo la expresión anterior es
{\displaystyle {\begin{pmatrix}{\frac {dy_{1}}{dt}}\\[2mm]{\frac {dy_{2}}{dt}}\end{pmatrix}}={\begin{pmatrix}{\frac {dm_{1}(x_{1},x_{2},x_{3})}{dt}}\\[2mm]{\frac {dm_{2}(x_{1},x_{2},x_{3})}{dt}}\end{pmatrix}}={\begin{pmatrix}{\frac {dm_{1}}{dx_{1}}}&{\frac {dm_{1}}{dx_{2}}}&{\frac {dm_{1}}{dx_{3}}}\\[2mm]{\frac {dm_{2}}{dx_{1}}}&{\frac {dm_{2}}{dx_{2}}}&{\frac {dm_{2}}{dx_{3}}}\end{pmatrix}}\,{\begin{pmatrix}{\frac {dx_{1}}{dt}}\\[2mm]{\frac {dx_{2}}{dt}}\\[2mm]{\frac {dx_{3}}{dt}}\end{pmatrix}}}Aquí
{\displaystyle \mathbf {u} ={\begin{pmatrix}{\frac {dy_{1}}{dt}}\\[2mm]{\frac {dy_{2}}{dt}}\end{pmatrix}}}es el campo de movimiento y el vector u depende tanto de la posición de la imagen como del (y_{{1}},y_{{2}}) tiempo t.
Semejantemente {\displaystyle \mathbf {x'} ={\begin{pmatrix}{\frac {dx_{1}}{dt}}\\[2mm]{\frac {dx_{2}}{dt}}\\[2mm]{\frac {dx_{3}}{dt}}\end{pmatrix}}}
representa el movimiento del punto 3D en relación con el campo de movimiento, y
{\displaystyle \mathbf {u} =\mathbf {M} \,\mathbf {x} '}donde {\mathbf {M}} es la matriz dependiente de la posición de la imagen 2\times 3
{\displaystyle \mathbf {M} ={\begin{pmatrix}{\frac {dm_{1}}{dx_{1}}}&{\frac {dm_{1}}{dx_{2}}}&{\frac {dm_{1}}{dx_{3}}}\\[2mm]{\frac {dm_{2}}{dx_{1}}}&{\frac {dm_{2}}{dx_{2}}}&{\frac {dm_{2}}{dx_{3}}}\end{pmatrix}}}De acuerdo con esta conexión, el campo de movimiento, en una ubicación fija en la imagen, es invariante a los movimientos 3D que se encuentran en el espacio nulo de {\mathbf {M}} .
Por ejemplo, una cámara estenopeica perderá todos los componentes de movimiento del espacio 3D que estén perpendiculares al punto focal de la cámara.
El campo de movimiento \mathbf {v} se define como:
{\displaystyle \mathbf {v} =f{\frac {Z\mathbf {V} -V_{z}\mathbf {P} }{Z^{2}}}}Dónde
{\displaystyle \mathbf {V} =-\mathbf {T} -\mathbf {\omega } \times \mathbf {P} } .
Dónde
\mathbf {P} es un punto de la escena donde Z es la distancia a ese punto de la escena.
\mathbf {V} es el movimiento relativo entre la cámara y la escena, \mathbf {T} es el componente de traslación del movimiento, y
\mathbf {\omega } es la velocidad angular del movimiento.
Como se explicó anteriormente, el campo de movimiento es una creación teórica basada en la suposición de que se puede determinar la dirección del movimiento de cada píxel de una imagen. Sin embargo, en realidad, las mediciones de los datos de la imagen sólo pueden servir como una aproximación del campo de movimiento subyacente. El problema es que, en la mayoría de las circunstancias, la movilidad de cada punto de la imagen es única y debe evaluarse localmente mediante algún tipo de operación de vecindad en los datos de la imagen. Por lo tanto, para algunos tipos de vecindades, se debe utilizar una aproximación, generalmente conocida como flujo óptico, en lugar del campo de movimiento verdadero. Una vecindad con una intensidad constante, por ejemplo, puede corresponder a un campo de movimiento que no es cero, pero el flujo óptico en dicha región sería cero porque no se podría medir ningún movimiento local de la imagen. De manera similar, el flujo óptico solo puede registrar el componente normal de un campo de movimiento, incluso si una vecindad que es intrínsecamente unidimensional (como una arista o una línea) puede corresponder a cualquier campo de movimiento. El ruido de la imagen, la oclusión 3D y el aliasing temporal son factores que surgen naturalmente en cualquier técnica de medición de flujo óptico y conducen a discrepancias entre los campos de movimiento medidos y reales.
En resumen, el campo de movimiento es una aproximación del flujo óptico porque es imposible medir el campo de movimiento con precisión para todas las ubicaciones de la imagen. El flujo óptico se puede calcular de varias maneras diferentes, cada una de las cuales tiene en cuenta un conjunto único de criterios para determinar la precisión de una estimación óptica.
{Fin del capítulo 1}
Capítulo 2: Regla de la cadena
En cálculo, la regla de la cadena es una expresión matemática que se puede utilizar para definir la derivada de la combinación de dos funciones diferenciables, f y g, en términos de las derivadas de f y g.
Más precisamente, si {\displaystyle h=f\circ g} la función es tal que {\displaystyle h(x)=f(g(x))} para cada x, si este es el caso, la regla de la cadena es, usando la notación de Lagrange, {\displaystyle h'(x)=f'(g(x))g'(x).}
o, equivalentemente,
{\displaystyle h'=(f\circ g)'=(f'\circ g)\cdot g'.}La regla de la cadena también puede enunciarse utilizando la notación utilizada por Leibniz. Si una variable, z, depende de otra variable, y, y ambas variables dependen de una tercera variable, x (es decir, y y z son variables dependientes), entonces z también depende de x mediante el uso de la variable y como intermediario. En este caso en particular, la regla de la cadena se establece como
{\displaystyle {\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}},}y
{\displaystyle \left.{\frac {dz}{dx}}\right|_{x}=\left.{\frac {dz}{dy}}\right|_{y(x)}\cdot \left.{\frac {dy}{dx}}\right|_{x},}con el fin de indicar en qué puntos es necesario evaluar los valores de las derivadas.
Cuando se trata de integración, la regla de reemplazo es la que corresponde a la regla de la cadena.
Intuitivamente, la regla de la cadena establece que si uno conoce la tasa de cambio instantánea de z con respecto a y y la de y con respecto a x, entonces puede calcular la tasa de cambio instantánea de z con respecto a x como el producto de las dos tasas de cambio. Si uno conoce la tasa instantánea de cambio de z en relación con x, entonces es capaz de calcular la tasa instantánea de cambio de z en relación con x.
En palabras de George F.
Si un vehículo puede moverse dos veces más rápido que una bicicleta, y una bicicleta puede viajar cuatro veces más rápido que una persona caminando, entonces Simmons dice esto: entonces el automóvil viaja 2 × 4 = 8 veces más rápido que el hombre".
A continuación se describe la conexión entre esta ilustración en particular y la regla de la cadena:
Sean z, y y x las posiciones (variables) del coche, la bicicleta y el tipo que caminaba, respectivamente.
La tasa de cambio de las posiciones relativas del automóvil y la bicicleta es {\textstyle {\frac {dz}{dy}}=2.} De manera similar, {\textstyle {\frac {dy}{dx}}=4.} el ritmo al que cambian las ubicaciones relativas del automóvil y del hombre que camina es
{\displaystyle {\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}}=2\cdot 4=8.}La tasa de cambio en la posición es igual a la relación de las velocidades, y la velocidad se calcula