Reconstrucción tridimensional multivista: Técnicas avanzadas de percepción espacial en visión por computadora
Por Fouad Sabry
()
Información de este libro electrónico
Qué es la reconstrucción tridimensional multivista
La reconstrucción 3D a partir de múltiples imágenes es la creación de modelos tridimensionales a partir de un conjunto de imágenes. Es el proceso inverso a la obtención de imágenes 2D a partir de escenas 3D.
Cómo te beneficiarás
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Reconstrucción 3D a partir de múltiples imágenes
Capítulo 2: Matriz fundamental (Visión por computadora)
Capítulo 3: Triangulación (Visión por computadora)
Capítulo 4: Perspectiva y punto
Capítulo 5: Unión de imágenes
Capítulo 6: Modelo de contorno activo
Capítulo 7: Ajuste del paquete
Capítulo 8: Transformación de características invariantes de escala
Capítulo 9: Reconocimiento de objetos 3D
Capítulo 10: Calibración automática de la cámara
(II) Respondiendo a las principales preguntas del público sobre la reconstrucción tridimensional de múltiples vistas.
(III) Ejemplos del mundo real para el uso de la reconstrucción tridimensional de múltiples vistas en muchos campos.
¿Quién? El libro es para
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básicos para cualquier tipo de reconstrucción tridimensional multivista.
Lee más de Fouad Sabry
Relacionado con Reconstrucción tridimensional multivista
Títulos en esta serie (100)
Visión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesMapeo de colores: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesTransformación lineal directa: Aplicaciones prácticas y técnicas en visión por computadora. Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesPerfil de color: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Segmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesSuperficie procesal: Explorando la generación y el análisis de texturas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelado y renderizado basado en imágenes: Explorando el realismo visual: técnicas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificacionesGráficos de trazado de rayos: Explorando la representación fotorrealista en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEstimación de movimiento: Avances y aplicaciones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de polígono: Explorando la intersección de gráficos por computadora poligonales y visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de cámara estenopeica: Comprender la perspectiva a través de la óptica computacional Calificación: 0 de 5 estrellas0 calificacionesIluminación global: Visión avanzada: conocimientos sobre la iluminación global Calificación: 0 de 5 estrellas0 calificacionesDeterminación de superficies ocultas: Revelando los secretos de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesClasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz Calificación: 0 de 5 estrellas0 calificacionesEliminación de líneas ocultas: Revelando lo invisible: secretos de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de volumen: Explorando el realismo visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesAlgoritmo de dibujo lineal: Dominar técnicas para la representación de imágenes de precisión Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de vértice: Explorando la intersección de los gráficos por computadora Vertex y la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de gráficos por computadora: Explorando el realismo visual: conocimientos sobre gráficos por computadora Calificación: 0 de 5 estrellas0 calificacionesAprendizaje de características geométricas: Desbloqueo de conocimientos visuales a través del aprendizaje de características geométricas Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos ráster: Transformando realidades visuales: dominio de los editores de gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVóxel: Explorando las profundidades de la visión por computadora con tecnología Voxel Calificación: 0 de 5 estrellas0 calificacionesGeometría Computacional: Explorando conocimientos geométricos para la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos rasterizados: Comprender los fundamentos de los gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCampo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado Calificación: 0 de 5 estrellas0 calificacionesDistancia Niebla: Explorando la frontera visual: información sobre la niebla a distancia de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos Calificación: 0 de 5 estrellas0 calificacionesRepresentación de línea de exploración: Explorando el realismo visual a través de técnicas de renderizado Scanline Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Dominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesResumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesMetodología de la programación Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Calidad en el desarrollo de software Calificación: 0 de 5 estrellas0 calificacionesMáquinas predictivas: La sencilla economía de la inteligencia artificial Calificación: 5 de 5 estrellas5/5Cómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificacionesSobreviviendo a la IA Calificación: 3 de 5 estrellas3/5Inteligencia Artificial Calificación: 4 de 5 estrellas4/5El mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5Klara y el Sol Calificación: 5 de 5 estrellas5/5GuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio Calificación: 0 de 5 estrellas0 calificacionesEl poder de las imagenes, la palabra no tiene poder Calificación: 0 de 5 estrellas0 calificacionesEscritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesMecatrónica Calificación: 0 de 5 estrellas0 calificacionesMáquinas como yo Calificación: 4 de 5 estrellas4/5Monetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Introducción a la Ingeniería Industrial Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5Business Intelligence: Técnicas herramientas y aplicaciones Calificación: 0 de 5 estrellas0 calificacionesEl imperio de los algoritmos: IA inclusiva, ética y al servicio de la humanidad Calificación: 0 de 5 estrellas0 calificacionesCómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificaciones
Comentarios para Reconstrucción tridimensional multivista
0 clasificaciones0 comentarios
Vista previa del libro
Reconstrucción tridimensional multivista - Fouad Sabry
Capítulo 1: Reconstrucción 3D a partir de múltiples imágenes
El proceso de construcción de un modelo 3D a partir de una colección de fotos en 2D se conoce como reconstrucción en 3D. Es la técnica mediante la cual las escenas 3D se convierten en imágenes 2D.
Las imágenes son esencialmente proyecciones de escenas tridimensionales en un plano bidimensional, donde se pierde la información de profundidad. Para un punto de imagen determinado, el punto 3D coincidente debe estar a lo largo de la línea de visión del espectador. No se puede saber qué punto de esta línea corresponde al punto de la imagen basándose en una sola imagen. Si tenemos acceso a dos fotos, podemos determinar las coordenadas 3D de un punto encontrando la ubicación donde se conectan los dos rayos de proyección. La triangulación describe este método. Las relaciones entre diferentes puntos de vista son cruciales, ya que proporcionan el conocimiento de que los pares de puntos se correlacionan entre sí porque debe haber alguna estructura subyacente entre ellos, y que esta estructura está a su vez relacionada con las poses y la calibración de la cámara.
En las últimas décadas se ha producido un cambio de enfoque que se ha alejado de los gráficos 2D y se ha acercado al contenido 3D para gráficos por ordenador, realidad virtual y comunicación. Muchos de los métodos actuales para crear modelos 3D se basan en hardware caro y especializado (como equipos estéreo) que no es necesario para la mayoría de las aplicaciones existentes. La necesidad de llenar este vacío impulsa la adopción de tecnologías de imagen digital (como una cámara). Tomasi y Kanade propusieron una técnica que se utilizaba en la época. Para obtener datos 3D de las secuencias de vídeo, utilizaron un método de factorización afín. Sin embargo, un defecto importante de este enfoque es que se basa en la proyección ortográfica.
Hay una secuencia específica de operaciones que se deben realizar para transformar una colección de fotos 2D en un modelo 3D:
Hay parámetros internos y externos involucrados en la calibración de la cámara, sin los cuales ninguna configuración algorítmica puede producir resultados precisos. La calibración y la determinación de la profundidad están separadas por una línea continua, ya que la calibración es necesaria para la mayoría de las determinaciones de profundidad.
La parte más difícil de este método es estimar la profundidad, la tercera dimensión que siempre está ausente en una imagen dada. El desafío clave es el problema de correspondencia, que implica ubicar entidades coincidentes en dos imágenes de modo que se puedan triangular sus coordenadas 3D.
Una vez que tenga muchos mapas de profundidad, puede fusionarlos mediante el registro para obtener una malla final mediante cálculos de profundidad y proyecciones de cámara. Con el fin de proporcionar varias perspectivas, se utilizará la calibración de la cámara para determinar cuál de las numerosas mallas generadas por los mapas de profundidad se puede combinar para formar una más grande.
Aunque es posible una malla 3D terminada en la etapa de aplicación de material, es más común desear agregar el color de las fotos de origen en este punto. Segmentar el modelo por material, como cualidades especulares y difusas, es otra opción. Esto se puede lograr de varias maneras, desde proyectar aleatoriamente las imágenes en la malla hasta mezclar las texturas para obtener una súper resolución.
Dado un grupo de puntos 3D visualizados por N cámaras con matrices \{P^{i}\}_{{i=1\ldots N}} , se definen m_{j}^{i}\simeq P^{i}w_{j} como las coordenadas homogéneas de la proyección del j^{th} punto sobre la i^{th} cámara.
El problema de reconstrucción se puede cambiar a: dado el grupo de coordenadas de píxeles \{m_{j}^{i}\} , encuentre el conjunto correspondiente de matrices de cámara \{P^{i}\} y la estructura de la escena \{w_{j}\} tal que
m_{j}^{i}\simeq P^{i}w_{j} (1)
Generalmente, sin más límites, una reconstrucción proyectiva es con lo que terminaremos.
Si \{P^{i}\} y \{w_{j}\} satisface (1), \{P^{i}T\} y \{T^{{-1}}w_{j}\} satisfará (1) con 4 × 4 matrices no singulares T cualesquiera.
Sin ningún conocimiento previo, una reconstrucción proyectiva puede ser calculada únicamente por la correspondencia de puntos.
El paso inicial de la autocalibración, también conocida como autocalibración, es la recuperación del movimiento y los parámetros de la cámara a través de la rigidez. Entonces los cálculos estructurales se vuelven simples. Aquí hay dos enfoques para poner este plan en acción:
Las propiedades internas de la cámara se pueden calcular con un mínimo de tres desplazamientos utilizando un conjunto de ecuaciones polinómicas desarrolladas por Kruppa, La matriz K=AA^{{\top }} es desconocida en las ecuaciones de Kruppa, Matriz de los coeficientes de Kruppa.
Es sencillo calcular los parámetros intrínsecos utilizando K y la técnica de factorización de Cholesky:
K={\begin{bmatrix}k_{1}&k_{2}&k_{3}\\k_{2}&k_{4}&k_{5}\\k_{3}&k_{5}&1\\\end{bmatrix}}Una nueva versión más simple fue presentada recientemente por Hartley.
F Que se escriba como F=DUV^{\top } , donde
Después de esto, se reformulan las ecuaciones de Kruppa (la derivación se puede encontrar en )
La clave de esta estrategia es el estricto cumplimiento de las restricciones.
Crear un modelo de precios, que tenga en cuenta las matrices básicas como argumentos y los parámetros intrínsecos como entrada.
{\displaystyle {F}_{ij}} se define como la matriz fundamental, {A}_{i} y {A}_{j} como matrices de parámetros intrínsecos.
Recientemente se han propuesto nuevos enfoques basados en la idea de estratificación. Actualice esta reconstrucción proyectiva a una reconstrucción euclidiana utilizando todas las restricciones disponibles, a partir de una estructura proyectiva que se pueda calcular utilizando solo correspondencias. Esto permite que el problema se divida en partes manejables, cada una de las cuales se puede examinar en un nivel diferente (proyectivo, afín o euclidiano) dependiendo del número de restricciones disponibles.
Normalmente, pensamos en el mundo como un espacio euclidiano tridimensional. Toda la estructura euclidiana del espacio 3D no se puede utilizar en todas las situaciones. La geometría proyectiva es la más simple, seguida de la geometría afín (una capa intermedia) y luego la geometría euclidiana (la más compleja). Una serie de transformaciones proyectivas (una homografía) se encuentra en el estrato proyectivo, una serie afín de transformaciones se encuentra en el estrato afín y una serie euclidiana de transformaciones se encuentra en el estrato euclidiano.
Digamos que tenemos dos o más cámaras de perspectiva mirando la misma escena, y conocemos las correspondencias entre las ubicaciones visibles en cada imagen.
Sin embargo, en la práctica, el problema de la coincidencia es crucial para la visión por computadora, pero también muy difícil de resolver.
Aquí, suponemos que n los puntos 3D