Geometría epipolar: Desbloqueo de la percepción de profundidad en la visión por computadora
Por Fouad Sabry
()
Información de este libro electrónico
Qué es la geometría epipolar
La geometría epipolar es la geometría de la visión estéreo. Cuando dos cámaras ven una escena 3D desde dos posiciones distintas, hay una serie de relaciones geométricas entre los puntos 3D y sus proyecciones sobre las imágenes 2D que generan restricciones entre los puntos de la imagen. Estas relaciones se derivan de la suposición de que las cámaras pueden aproximarse mediante el modelo de cámara estenopeica.
Cómo se beneficiará
(I) Insights, y validaciones sobre los siguientes temas:
Capítulo 1: Geometría epipolar
Capítulo 2: Aberración óptica
Capítulo 3: Distancia focal
Capítulo 4: Lente de la cámara
Capítulo 5: Proyección 3D
Capítulo 6: Punto de fuga
Capítulo 7: Distorsión (óptica)
Capítulo 8: Proyección paralela
Capítulo 9: Colinealidad
Capítulo 10: Matriz fundamental (visión por computadora)
(II) Respondiendo las principales preguntas del público sobre geometría epipolar .
(III) Ejemplos del mundo real sobre el uso de la geometría epipolar en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o información básica para cualquier tipo de Geometría Epipolar.
Lee más de Fouad Sabry
Ciencias Económicas [Spanish]
Relacionado con Geometría epipolar
Títulos en esta serie (100)
Visión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesModelo de cámara estenopeica: Comprender la perspectiva a través de la óptica computacional Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesDetección de contorno: Revelando el arte de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesImágenes multiespectrales: Liberando el espectro: avances en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGeometría epipolar: Desbloqueo de la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Modelo de cámara estenopeica: Comprender la perspectiva a través de la óptica computacional Calificación: 0 de 5 estrellas0 calificacionesPerspectiva cilíndrica: Perspectiva cilíndrica: exploración de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProyección tridimensional: Liberando la profundidad de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPerspectiva inversa: Reimaginar la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos de trazado de rayos: Explorando la representación fotorrealista en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProyección axonométrica: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPerspectiva curvilínea: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de reflexión de Phong: Comprender las interacciones de la luz en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de radiosidad: Avances en la visualización a través de la radiosidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProyección isométrica: Explorando la percepción espacial en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEstimación de la postura del cuerpo articulado: Desbloqueando el movimiento humano en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la Óptica Calificación: 0 de 5 estrellas0 calificacionesFlujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCampo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado Calificación: 0 de 5 estrellas0 calificacionesPunto de Fuga: Explorando los límites de la visión: conocimientos de la informática Calificación: 0 de 5 estrellas0 calificacionesSombreado: Explorando el sombreado de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGeometría descriptiva: Desbloqueando el ámbito visual: explorando la geometría descriptiva en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTratado de las secciones cónicas: la parábola Calificación: 0 de 5 estrellas0 calificacionesSuperficie procesal: Explorando la generación y el análisis de texturas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReconstrucción tridimensional multivista: Técnicas avanzadas de percepción espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de vértice: Explorando la intersección de los gráficos por computadora Vertex y la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProyección ortográfica: Explorando la proyección ortográfica en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVóxel: Explorando las profundidades de la visión por computadora con tecnología Voxel Calificación: 0 de 5 estrellas0 calificacionesPhong Sombreado: Explorando la profundidad de la representación visual: sombreado Phong en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVolumen límite: Explorando la representación espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesInterpolación bilineal: Mejora de la resolución y claridad de la imagen mediante interpolación bilineal Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Cómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5Dominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Metodología de la programación Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesResumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesMáquinas predictivas: La sencilla economía de la inteligencia artificial Calificación: 5 de 5 estrellas5/5Klara y el Sol Calificación: 5 de 5 estrellas5/5Chat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Cómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesEscritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5El poder de las imagenes, la palabra no tiene poder Calificación: 0 de 5 estrellas0 calificacionesCalidad en el desarrollo de software Calificación: 0 de 5 estrellas0 calificacionesANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificacionesGuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio Calificación: 0 de 5 estrellas0 calificacionesSobreviviendo a la IA Calificación: 3 de 5 estrellas3/5Mecatrónica Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la Ingeniería Industrial Calificación: 0 de 5 estrellas0 calificacionesMonetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Cómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5Historia y evolución de la Inteligencia Artificial Calificación: 3 de 5 estrellas3/5Business Intelligence: Técnicas herramientas y aplicaciones Calificación: 0 de 5 estrellas0 calificacionesBig data: La revolución de los datos masivos Calificación: 4 de 5 estrellas4/5UML: Modelado de Software para Profesionales Calificación: 0 de 5 estrellas0 calificaciones
Comentarios para Geometría epipolar
0 clasificaciones0 comentarios
Vista previa del libro
Geometría epipolar - Fouad Sabry
Capítulo 1: Geometría epipolar
La geometría epipolar es la geometría que subyace a la percepción tridimensional. Hay una variedad de vínculos geométricos entre los puntos 3D y sus proyecciones en las imágenes 2D que conducen a limitaciones entre los puntos de la imagen cuando dos cámaras observan una escena 3D desde dos lugares diferentes. Estas conexiones se forman a partir de la idea de que las cámaras pueden ser representadas por una cámara estenopeica.
En el siguiente diagrama se muestran dos cámaras estenopeicas, ambas enfocadas en el punto X.
Usando cámaras reales, el plano de enfoque se encuentra detrás del plano de la imagen, crea una imagen que es simétrica con respecto al punto focal de la lente.
Aquí, sin embargo, imaginando un plano de imagen frente al punto focal de la cámara (p. ej.
centro óptico de la lente para crear una imagen que no esté distorsionada por la imagen especular.
OL y OR representan los centros de simetría de las lentes de las dos cámaras.
Los puntos focales de ambas cámaras se indican con el símbolo X.
Los puntos xL y xR son las proyecciones del punto X en los planos de la imagen.
El mundo 3D es capturado por cada cámara como una imagen 2D. El modelo de cámara estenopeica describe perfectamente esta transformación de tres dimensiones a dos, lo que se conoce como proyección en perspectiva. Es una práctica común representar este proceso de proyección utilizando rayos que salen de la cámara y enfocan en su centro. Cada rayo representa un punto de la imagen.
Dado que las lentes de las cámaras tienen diferentes centros ópticos, hay un solo punto en el plano de la imagen de la otra cámara en el que se proyecta cada punto focal.
Estos dos vértices de la imagen, denotados por eL y eR, son epipolos, a menudo conocidos como puntos epipolares.
Ambos epipolos eL y eR en sus respectivos planos de imagen y ambos centros ópticos OL y OR se encuentran en una sola línea 3D.
La línea OL-X es vista por la cámara izquierda como un punto porque está directamente en línea con el centro óptico de la lente de esa cámara.
Sin embargo, esta línea se percibe como una línea en el plano de imagen de la cámara correcta.
Esa línea (eR-xR) en la cámara derecha se llama línea epipolar.
Simétricamente, la línea OR-X es vista por la cámara derecha como un punto y es vista como la línea epipolar eL-xLpor la cámara izquierda.
La ubicación del punto X en el espacio tridimensional determina la línea epipolar, es decir,
a medida que X se desplaza, ambas imágenes tendrán una serie de líneas epipolares dibujadas en ellas.
Dado que la línea 3D OL-X pasa a través del centro óptico de la lente OL, la línea epipolar correspondiente en la imagen de la derecha debe pasar a través del eR del epipolo (y en consecuencia para las líneas epipolares en la imagen de la izquierda).
El punto epipolar es el origen de todas las líneas epipolares de una imagen determinada.
De hecho, dado que el punto epipolar se puede ubicar en cualquier lugar del espacio, cualquier línea que pase a través de él se considera una línea epipolar.
Como una imagen contrastante, piense en la evidencia X, OL Y OR que forman un plano llamado plano epipolar.
Las líneas epipolares son las líneas formadas donde el plano epipolar se encuentra con el plano de imagen de cada cámara.
No importa dónde esté X, cada plano epipolar y línea epipolar debe pasar por el epipolo.
Dos descubrimientos cruciales se derivan del conocimiento de las posiciones relativas de las dos cámaras:
Supongamos que se conoce el punto de proyección xL, y se conoce la línea epipolar eR-xR y que el punto X se proyecta en la imagen de la derecha, en un punto xR que debe estar en esta línea epipolar en particular.
Esto requiere que, a lo largo de una línea epipolar conocida, para cada punto de una imagen, el punto correspondiente debe mostrarse en la otra imagen.
Esto proporciona una restricción epipolar: la proyección de X en el plano derecho de la cámara xR debe estar contenida en la línea epipolar eR-xR.
Cada X, por ejemplo.
X1, X2, X3 en la línea OL-XL verificará esa restricción.
Esto nos permite determinar si dos puntos son el mismo punto 3D.
La matriz fundamental o esencial que conecta las dos cámaras también puede caracterizar las restricciones epipolares.
Si se conocen los puntos xL y xR , también se conocen sus rayos de proyección.
Las líneas de proyección deben cruzarse en X si los dos puntos de la imagen representan el mismo punto 3D.
Dado que conocemos las ubicaciones de estos dos puntos de referencia en la imagen, podemos usarlos para determinar X, el uso de triángulos o la triangulación.
Si los planos de imagen de las dos cámaras son paralelos entre sí, la geometría epipolar se simplifica.
Aquí, sin embargo, las líneas epipolares también coinciden (eL-XL = eR-XR).
Además, las líneas epipolares son paralelas a la línea OL-OR entre los centros de proyección, y los ejes horizontales de las dos imágenes se pueden alinear en la práctica.
Es decir, por cada punto en una sola imagen, solo necesita escanear horizontalmente para ubicar su contraparte en la imagen opuesta.
Si las cámaras no se pueden configurar de esta manera, las coordenadas de imagen de las cámaras se pueden modificar para que parezca que todas apuntan hacia el mismo plano.
La corrección de imagen se refiere a este procedimiento.
Las cámaras de barrido utilizan una colección de CCD unidimensionales para crear una tira de imagen continua, o alfombra de imagen
, en lugar del CCD bidimensional de la cámara de marco tradicional. La forma epipolar de este sensor es muy diferente a la de los proyectores estenopeicos tradicionales. Para empezar, la línea epipolar del sensor de barrido está curvada como una hipérbola en lugar de ser recta. En segundo lugar, no existe tal cosa como un par de curvas epipolares.
{Fin del capítulo 1}
Capítulo 2: Aberración óptica
La aberración es una característica de los sistemas ópticos, como las lentes, que permite que la luz se disperse a través de una determinada región del espacio en lugar de enfocarse en un solo punto. Este fenómeno es conocido en el campo de la óptica.
1: Imagen con una lente con aberración cromática.
Además, una lente que tiene una menor aberración cromática
Los sistemas ópticos de formación de imágenes que están sujetos a aberraciones darán como resultado la producción de imágenes que no son nítidas. Los fabricantes de instrumentos ópticos están obligados a realizar ajustes en sus sistemas ópticos para compensar la aberración.
Las técnicas de óptica geométrica se pueden utilizar para hacer un análisis de aberración. Algunas de las características generales de los rayos reflejados y refractados se discuten en los artículos dedicados a la reflexión, la refracción y la cáustica.
Reflejo de un espejo esférico.
Los rayos reflejados (verde) que no se dirigen hacia el punto focal son producidos por rayos incidentes (rojo) que se dirigen lejos del centro del espejo.
F.
Debido a la aberración esférica, este es el caso.
Una lente ideal permitiría que la luz de cualquier punto de un objeto pasara a través de él y convergiera en un solo punto en el plano de la imagen (o, más generalmente, en la superficie de la imagen). Este sería el caso si la lente fuera perfecta. Las lentes reales, por otro lado, no concentran con precisión la luz en un solo punto, incluso cuando están construidas a la perfección. Las aberraciones de la lente son el término utilizado para describir estas desviaciones del rendimiento idealizado de la lente.
Las dos categorías de aberraciones se conocen como aberraciones monocromáticas y aberraciones cromáticas. Cuando la luz se refleja o refracta, pueden desarrollarse aberraciones monocromáticas. Estas aberraciones son creadas por la geometría de la lente o el espejo, y pueden ocurrir en cualquiera de estos dos procesos. El nombre proviene del hecho de que son visibles incluso cuando se emplea luz monocromática.
Las aberraciones cromáticas son provocadas por la dispersión, que es el cambio en el índice de refracción de una lente que se produce independientemente de la longitud de onda. Es debido a la dispersión que las distintas longitudes de onda de la luz llegan a enfocarse en diferentes puntos en lugares específicos. El uso de luz monocromática no da lugar a la aparición de aberración cromática porque.
En cuanto a las aberraciones monocromáticas, las más comunes son:
Desenfoque
Aberración esférica
Coma
Astigmatismo
Curvatura de campo
Distorsión de la imagen
A pesar del hecho de que el desenfoque es teóricamente el orden más bajo de las aberraciones ópticas, no se considera típicamente una aberración de la lente. Esto se debe a que se puede rectificar desplazando la lente (o el plano de la imagen) para acercar el plano de la imagen al enfoque óptico de la lente.
Estas aberraciones no son los únicos factores que pueden hacer que el punto focal se desplace; Los efectos de pistón e inclinación son otros ejemplos de estos efectos. Cuando un frente de