Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Campo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado
Campo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado
Campo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado
Libro electrónico143 páginas1 hora

Campo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

Qué es el campo de movimiento


En visión por computadora, el campo de movimiento es una representación ideal del movimiento en un espacio tridimensional (3D) tal como se proyecta en la imagen de una cámara. . Dado un modelo de cámara simplificado, cada punto  en la imagen es la proyección de algún punto de la escena 3D pero la posición de la proyección de un punto fijo en el espacio puede variar con el tiempo. El campo de movimiento puede definirse formalmente como la derivada temporal de la posición de la imagen de todos los puntos de la imagen, dado que corresponden a puntos 3D fijos. Esto significa que el campo de movimiento se puede representar como una función que asigna las coordenadas de la imagen a un vector bidimensional. El campo de movimiento es una descripción ideal del movimiento 3D proyectado en el sentido de que puede definirse formalmente, pero en la práctica normalmente sólo es posible determinar una aproximación del campo de movimiento a partir de los datos de la imagen.


Cómo se beneficiará


(I) Insights y validaciones sobre los siguientes temas:


Capítulo 1: Campo de movimiento


Capítulo 2 : Regla de la cadena


Capítulo 3: Curl (Matemáticas)


Capítulo 4: Sistema de coordenadas polares


Capítulo 5: Teorema de Green


Capítulo 6: Elemento lineal


Capítulo 7: Matriz de cámara


Capítulo 8: Modelo de cámara estenopeica


Capítulo 9: Derivación de las ecuaciones de Navier-Stokes


Capítulo 10: Mecánica Lagrangiana Relativista


(II) Respondiendo a las principales preguntas del público sobre el campo de movimiento.


(III) Ejemplos del mundo real para el uso del campo de movimiento en muchos campos .


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de campo de movimiento.


 


 

IdiomaEspañol
Fecha de lanzamiento12 may 2024
Campo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado

Lee más de Fouad Sabry

Relacionado con Campo de movimiento

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Campo de movimiento

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Campo de movimiento - Fouad Sabry

    Capítulo 1: Campo de movimiento

    El campo de movimiento es la proyección perfecta del movimiento 3D sobre la imagen de una cámara, y se utiliza ampliamente en la visión por ordenador.

    Suponiendo un modelo de cámara mínimamente complejo, cada punto (y_{{1}},y_{{2}}) de la imagen es la proyección de algún punto en la escena 3D, pero la posición de la proyección de un punto fijo en el espacio puede variar con el tiempo.

    Dado que todos los puntos de la imagen corresponden a coordenadas 3D fijas, el campo de movimiento se puede definir formalmente como la derivada temporal de la posición de la imagen de todos los puntos de la imagen.

    El campo de movimiento se puede expresar como una función que transforma las coordenadas de la imagen en un vector bidimensional.

    Formalmente hablando, el campo de movimiento es la descripción perfecta del movimiento 3D proyectado, pero en la práctica, generalmente solo es posible estimar el campo de movimiento a partir de los datos de la imagen.

    Un modelo de cámara asigna cada punto (x_{{1}},x_{{2}},x_{{3}}) en el espacio 3D a un punto de imagen 2D (y_{{1}},y_{{2}}) de acuerdo con algunas funciones de mapeo {\displaystyle m_{1},m_{2}} :

    {\displaystyle {\begin{pmatrix}y_{1}\\y_{2}\end{pmatrix}}={\begin{pmatrix}m_{1}(x_{1},x_{2},x_{3})\\m_{2}(x_{1},x_{2},x_{3})\end{pmatrix}}}

    Para una escena dinámica, en la que los objetos se mueven entre sí, en la que los objetos se deforman y en la que la propia cámara está en movimiento con respecto a la escena, se asigna un punto fijo en el espacio 3D a diferentes lugares de la imagen. El resultado de diferenciar en el tiempo la expresión anterior es

    {\displaystyle {\begin{pmatrix}{\frac {dy_{1}}{dt}}\\[2mm]{\frac {dy_{2}}{dt}}\end{pmatrix}}={\begin{pmatrix}{\frac {dm_{1}(x_{1},x_{2},x_{3})}{dt}}\\[2mm]{\frac {dm_{2}(x_{1},x_{2},x_{3})}{dt}}\end{pmatrix}}={\begin{pmatrix}{\frac {dm_{1}}{dx_{1}}}&{\frac {dm_{1}}{dx_{2}}}&{\frac {dm_{1}}{dx_{3}}}\\[2mm]{\frac {dm_{2}}{dx_{1}}}&{\frac {dm_{2}}{dx_{2}}}&{\frac {dm_{2}}{dx_{3}}}\end{pmatrix}}\,{\begin{pmatrix}{\frac {dx_{1}}{dt}}\\[2mm]{\frac {dx_{2}}{dt}}\\[2mm]{\frac {dx_{3}}{dt}}\end{pmatrix}}}

    Aquí

    {\displaystyle \mathbf {u} ={\begin{pmatrix}{\frac {dy_{1}}{dt}}\\[2mm]{\frac {dy_{2}}{dt}}\end{pmatrix}}}

    es el campo de movimiento y el vector u depende tanto de la posición de la imagen como del (y_{{1}},y_{{2}}) tiempo t.

    Semejantemente {\displaystyle \mathbf {x'} ={\begin{pmatrix}{\frac {dx_{1}}{dt}}\\[2mm]{\frac {dx_{2}}{dt}}\\[2mm]{\frac {dx_{3}}{dt}}\end{pmatrix}}}

    representa el movimiento del punto 3D en relación con el campo de movimiento, y

    {\displaystyle \mathbf {u} =\mathbf {M} \,\mathbf {x} '}

    donde {\mathbf {M}} es la matriz dependiente de la posición de la imagen 2\times 3

    {\displaystyle \mathbf {M} ={\begin{pmatrix}{\frac {dm_{1}}{dx_{1}}}&{\frac {dm_{1}}{dx_{2}}}&{\frac {dm_{1}}{dx_{3}}}\\[2mm]{\frac {dm_{2}}{dx_{1}}}&{\frac {dm_{2}}{dx_{2}}}&{\frac {dm_{2}}{dx_{3}}}\end{pmatrix}}}

    De acuerdo con esta conexión, el campo de movimiento, en una ubicación fija en la imagen, es invariante a los movimientos 3D que se encuentran en el espacio nulo de {\mathbf {M}} .

    Por ejemplo, una cámara estenopeica perderá todos los componentes de movimiento del espacio 3D que estén perpendiculares al punto focal de la cámara.

    El campo de movimiento \mathbf {v} se define como:

    {\displaystyle \mathbf {v} =f{\frac {Z\mathbf {V} -V_{z}\mathbf {P} }{Z^{2}}}}

    Dónde

    {\displaystyle \mathbf {V} =-\mathbf {T} -\mathbf {\omega } \times \mathbf {P} } .

    Dónde

    \mathbf {P} es un punto de la escena donde Z es la distancia a ese punto de la escena.

    \mathbf {V} es el movimiento relativo entre la cámara y la escena, \mathbf {T} es el componente de traslación del movimiento, y

    \mathbf {\omega } es la velocidad angular del movimiento.

    Como se explicó anteriormente, el campo de movimiento es una creación teórica basada en la suposición de que se puede determinar la dirección del movimiento de cada píxel de una imagen. Sin embargo, en realidad, las mediciones de los datos de la imagen sólo pueden servir como una aproximación del campo de movimiento subyacente. El problema es que, en la mayoría de las circunstancias, la movilidad de cada punto de la imagen es única y debe evaluarse localmente mediante algún tipo de operación de vecindad en los datos de la imagen. Por lo tanto, para algunos tipos de vecindades, se debe utilizar una aproximación, generalmente conocida como flujo óptico, en lugar del campo de movimiento verdadero. Una vecindad con una intensidad constante, por ejemplo, puede corresponder a un campo de movimiento que no es cero, pero el flujo óptico en dicha región sería cero porque no se podría medir ningún movimiento local de la imagen. De manera similar, el flujo óptico solo puede registrar el componente normal de un campo de movimiento, incluso si una vecindad que es intrínsecamente unidimensional (como una arista o una línea) puede corresponder a cualquier campo de movimiento. El ruido de la imagen, la oclusión 3D y el aliasing temporal son factores que surgen naturalmente en cualquier técnica de medición de flujo óptico y conducen a discrepancias entre los campos de movimiento medidos y reales.

    En resumen, el campo de movimiento es una aproximación del flujo óptico porque es imposible medir el campo de movimiento con precisión para todas las ubicaciones de la imagen. El flujo óptico se puede calcular de varias maneras diferentes, cada una de las cuales tiene en cuenta un conjunto único de criterios para determinar la precisión de una estimación óptica.

    {Fin del capítulo 1}

    Capítulo 2: Regla de la cadena

    En cálculo, la regla de la cadena es una expresión matemática que se puede utilizar para definir la derivada de la combinación de dos funciones diferenciables, f y g, en términos de las derivadas de f y g.

    Más precisamente, si {\displaystyle h=f\circ g} la función es tal que {\displaystyle h(x)=f(g(x))} para cada x, si este es el caso, la regla de la cadena es, usando la notación de Lagrange, {\displaystyle h'(x)=f'(g(x))g'(x).}

    o, equivalentemente,

    {\displaystyle h'=(f\circ g)'=(f'\circ g)\cdot g'.}

    La regla de la cadena también puede enunciarse utilizando la notación utilizada por Leibniz. Si una variable, z, depende de otra variable, y, y ambas variables dependen de una tercera variable, x (es decir, y y z son variables dependientes), entonces z también depende de x mediante el uso de la variable y como intermediario. En este caso en particular, la regla de la cadena se establece como

    {\displaystyle {\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}},}

    y

    {\displaystyle \left.{\frac {dz}{dx}}\right|_{x}=\left.{\frac {dz}{dy}}\right|_{y(x)}\cdot \left.{\frac {dy}{dx}}\right|_{x},}

    con el fin de indicar en qué puntos es necesario evaluar los valores de las derivadas.

    Cuando se trata de integración, la regla de reemplazo es la que corresponde a la regla de la cadena.

    Intuitivamente, la regla de la cadena establece que si uno conoce la tasa de cambio instantánea de z con respecto a y y la de y con respecto a x, entonces puede calcular la tasa de cambio instantánea de z con respecto a x como el producto de las dos tasas de cambio. Si uno conoce la tasa instantánea de cambio de z en relación con x, entonces es capaz de calcular la tasa instantánea de cambio de z en relación con x.

    En palabras de George F.

    Si un vehículo puede moverse dos veces más rápido que una bicicleta, y una bicicleta puede viajar cuatro veces más rápido que una persona caminando, entonces Simmons dice esto: entonces el automóvil viaja 2 × 4 = 8 veces más rápido que el hombre".

    A continuación se describe la conexión entre esta ilustración en particular y la regla de la cadena:

    Sean z, y y x las posiciones (variables) del coche, la bicicleta y el tipo que caminaba, respectivamente.

    La tasa de cambio de las posiciones relativas del automóvil y la bicicleta es {\textstyle {\frac {dz}{dy}}=2.} De manera similar, {\textstyle {\frac {dy}{dx}}=4.} el ritmo al que cambian las ubicaciones relativas del automóvil y del hombre que camina es

    {\displaystyle {\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}}=2\cdot 4=8.}

    La tasa de cambio en la posición es igual a la relación de las velocidades, y la velocidad se calcula

    ¿Disfrutas la vista previa?
    Página 1 de 1