Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Matriz fundamental de visión por computadora: Por favor, sugiera un subtítulo para un libro con el título 'Matriz fundamental de visión por computadora' dentro del ámbito de 'Visión por computadora'. El subtítulo sugerido no debe tener ':'.
Matriz fundamental de visión por computadora: Por favor, sugiera un subtítulo para un libro con el título 'Matriz fundamental de visión por computadora' dentro del ámbito de 'Visión por computadora'. El subtítulo sugerido no debe tener ':'.
Matriz fundamental de visión por computadora: Por favor, sugiera un subtítulo para un libro con el título 'Matriz fundamental de visión por computadora' dentro del ámbito de 'Visión por computadora'. El subtítulo sugerido no debe tener ':'.
Libro electrónico112 páginas1 hora

Matriz fundamental de visión por computadora: Por favor, sugiera un subtítulo para un libro con el título 'Matriz fundamental de visión por computadora' dentro del ámbito de 'Visión por computadora'. El subtítulo sugerido no debe tener ':'.

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

¿Qué es la matriz fundamental de visión por computadora?


En el campo de la visión por computadora, la matriz fundamental es una noción esencial que se utiliza en visión estéreo y trabajos que involucran estructura a partir de movimiento. . Cuando se capturan dos fotografías desde diferentes perspectivas, se representa la relación geométrica que existe entre los puntos que se corresponden entre sí. Mediante el uso de la Matriz Fundamental, es posible determinar las líneas epipolares, que son necesarias para la coincidencia estéreo y la reproducción en tres dimensiones.


Cómo se beneficiará


(I) Información y validaciones sobre los siguientes temas:


Capítulo 1: Matriz fundamental (visión por computadora)


Capítulo 2: Transformación de características invariantes de escala


Capítulo 3: Resección de cámara


Capítulo 4: Problema de correspondencia


Capítulo 5: Geometría epipolar


Capítulo 6: Matriz esencial


Capítulo 7: Rectificación de imágenes


Capítulo 8: Matriz de cámara


Capítulo 9: Modelo de cámara estenopeica


Capítulo 10: Algoritmo de ocho puntos


(II) Respondiendo a las principales preguntas del público sobre la matriz fundamental de la visión por computadora.


(III) Ejemplos del mundo real para el uso de la matriz fundamental de la visión por computadora en muchos campos.


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básicos para cualquier tipo de matriz fundamental de visión por computadora.


 


 

IdiomaEspañol
Fecha de lanzamiento30 abr 2024
Matriz fundamental de visión por computadora: Por favor, sugiera un subtítulo para un libro con el título 'Matriz fundamental de visión por computadora' dentro del ámbito de 'Visión por computadora'. El subtítulo sugerido no debe tener ':'.

Lee más de Fouad Sabry

Autores relacionados

Relacionado con Matriz fundamental de visión por computadora

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Matriz fundamental de visión por computadora

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Matriz fundamental de visión por computadora - Fouad Sabry

    Capítulo 1: Matriz fundamental (visión artificial)

    La visión por computadora es el estudio de cómo ven las máquinas, la matriz fundamental \mathbf {F} es una matriz 3×3 que relaciona los puntos correspondientes en imágenes estereoscópicas.

    Por ejemplo, en el campo de la geometría epipolar, con un conjunto estandarizado de coordenadas de imagen, x y x′, puntos en un par estéreo que se relacionan entre sí, Fx describe una línea (una línea epipolar) en la que debe estar el punto correspondiente x′ en la otra imagen.

    Es decir, para todos los conjuntos de coordenadas paralelas

    {\mathbf {x}}'^{{\top }}{\mathbf {Fx}}=0.

    La matriz fundamental se puede aproximar con al menos siete correspondencias puntuales, ya que tiene rango 2 y se determina solo hasta la escala. Sus siete parámetros son todo lo que se puede determinar geométricamente sobre las cámaras utilizando únicamente correspondencias punto a punto.

    QT Luong utilizó por primera vez la frase matriz básica en su tesis doctoral seminal. También se conoce como el tensor bifocal en algunos contextos. Es una forma bilineal que conecta puntos en diferentes sistemas de coordenadas, lo que la convierte en un tensor de dos puntos.

    En 1992, Olivier Faugeras y Richard Hartley publicaron de forma independiente la relación anterior que establece la matriz fundamental.

    A pesar de que H.

    Requisitos similares son cumplidos por la matriz esencial de Christopher Longuet-Higgins, Las cámaras calibradas utilizan la matriz esencial, que es un objeto métrico, mientras que los conceptos más amplios y fundamentales de la geometría proyectiva se describen mediante la matriz fundamental.

    Esto se capta matemáticamente mediante la relación entre una matriz fundamental \mathbf {F} y su correspondiente matriz esencial \mathbf {E} , que es

    {\displaystyle \mathbf {E} =({\mathbf {K} '})^{\top }\;\mathbf {F} \;\mathbf {K} }

    \mathbf {K} y {\mathbf {K}}' siendo las matrices de calibración intrínsecas de las dos imágenes involucradas.

    La matriz fundamental es una restricción sobre dónde se pueden proyectar los puntos de una escena en dos imágenes diferentes de la misma escena. Para facilitar la búsqueda y permitir la detección de correspondencias falsas, la proyección de un punto de escena en una de las imágenes hace que el punto correspondiente de la otra imagen se limite a una línea. La restricción epipolar, la restricción de coincidencia, la restricción de coincidencia discreta y la relación de incidencia son nombres para lo mismo: la relación entre pares de puntos que están representados por la matriz fundamental.

    Se puede utilizar un conjunto de correspondencias puntuales para calcular la matriz básica. Además, las matrices de cámara creadas directamente a partir de esta matriz básica se pueden utilizar para triangular entre estos respectivos puntos de imagen y sus posiciones mundiales asociadas. Estos puntos del mundo conforman una escena que es, en cierto sentido, una proyección del mundo real.

    Digamos que la correspondencia del punto de la imagen {\mathbf {x}}\leftrightarrow {\mathbf {x'}} se deriva del punto del mundo {\textbf {X}} bajo las matrices de la cámara \left({\textbf {P}},{\textbf {P}}'\right) como

    {\begin{aligned}{\mathbf {x}}&={\textbf {P}}{\textbf {X}}\\{\mathbf {x'}}&={\textbf {P}}'{\textbf {X}}\end{aligned}}

    Digamos que transformamos el espacio por una matriz de homografía general {\textbf {H}}_{{4\times 4}} tal que {\textbf {X}}_{0}={\textbf {H}}{\textbf {X}} .

    Después de eso, las cámaras se transforman en

    {\begin{aligned}{\textbf {P}}_{0}&={\textbf {P}}{\textbf {H}}^{{-1}}\\{\textbf {P}}_{0}'&={\textbf {P}}'{\textbf {H}}^{{-1}}\end{aligned}}{\textbf {P}}_{0}{\textbf {X}}_{0}={\textbf {P}}{\textbf {H}}^{{-1}}{\textbf {H}}{\textbf {X}}={\textbf {P}}{\textbf {X}}={\mathbf {x}}

    y de la misma manera con {\textbf {P}}_{0}' todavía nos dan los mismos puntos de imagen.

    También es posible utilizar el requisito de coplanaridad para obtener la matriz básica.

    La geometría epipolar se representa como imágenes estereoscópicas en la matriz fundamental. Las líneas rectas representan la geometría epipolar en las vistas de cámara en perspectiva. Por el contrario, la imagen de una fotografía satelital se produce a medida que el sensor se mueve a través de su órbita (sensor de barrido). Como resultado, la línea epipolar toma la forma de una curva epipolar y los centros de proyección de una escena de imagen determinada se dispersan. Sin embargo, la matriz básica se puede utilizar para corregir fotos de satélite en ciertos casos, como cuando se trabaja con mosaicos de imágenes pequeñas.

    La matriz primaria es una matriz de rango 2. Su centro es lo que lo convierte en un epipolo.

    {Fin del capítulo 1}

    Capítulo 2: Transformación de características invariantes de escala

    David Lowe desarrolló la transformación de características invariantes de escala (SIFT) en 1999 como un algoritmo de visión por computadora para localizar, caracterizar y hacer coincidir características locales en imágenes. El reconocimiento de objetos, el mapeo y la navegación robóticos, la unión de imágenes, el modelado tridimensional, el reconocimiento de gestos, el seguimiento de video, la identificación individual de la vida silvestre y el emparejamiento son solo algunos de los muchos usos posibles de esta tecnología.

    Los puntos clave SIFT de objetos se extraen primero de un conjunto de imágenes de entrenamiento.

    Es posible crear una descripción de características de cualquier objeto en una imagen aislando los puntos clave sobre ese objeto. Al intentar localizar un objeto en una imagen de prueba con muchos otros objetos, se puede usar esta descripción porque se extrajo de una imagen de entrenamiento. Las características extraídas de la imagen de entrenamiento deben ser discernibles a pesar de las variaciones en la escala de la imagen, el ruido y la iluminación si se quiere lograr un reconocimiento confiable. Estas manchas suelen residir en los bordes de la imagen u otras áreas con alto contraste.

    Además, estas características deben mantener las mismas posiciones relativas de una imagen a la siguiente, como lo hicieron en la escena original. Si solo se usaran las cuatro esquinas de una puerta como características, el reconocimiento tendría éxito si la puerta estaba abierta o cerrada. Sin embargo, si también se utilizaran puntos en el marco, el reconocimiento fallaría en cualquiera de los casos. Del mismo modo, si hay algún cambio en la geometría interna de un objeto articulado o flexible entre dos imágenes del conjunto que se está procesando, es probable que las entidades ubicadas en ese objeto ya no funcionen. Si bien estas variaciones locales pueden tener un impacto significativo en el error promedio de todos los errores de coincidencia de características, SIFT, en la práctica, detecta y utiliza un número mucho mayor de características de las imágenes, lo que

    ¿Disfrutas la vista previa?
    Página 1 de 1