Reconstrucción tridimensional multivista: Técnicas avanzadas de percepción espacial en visión por computadora
Por Fouad Sabry
()
Información de este libro electrónico
Qué es la reconstrucción tridimensional multivista
La reconstrucción 3D a partir de múltiples imágenes es la creación de modelos tridimensionales a partir de un conjunto de imágenes. Es el proceso inverso a la obtención de imágenes 2D a partir de escenas 3D.
Cómo te beneficiarás
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Reconstrucción 3D a partir de múltiples imágenes
Capítulo 2: Matriz fundamental (Visión por computadora)
Capítulo 3: Triangulación (Visión por computadora)
Capítulo 4: Perspectiva y punto
Capítulo 5: Unión de imágenes
Capítulo 6: Modelo de contorno activo
Capítulo 7: Ajuste del paquete
Capítulo 8: Transformación de características invariantes de escala
Capítulo 9: Reconocimiento de objetos 3D
Capítulo 10: Calibración automática de la cámara
(II) Respondiendo a las principales preguntas del público sobre la reconstrucción tridimensional de múltiples vistas.
(III) Ejemplos del mundo real para el uso de la reconstrucción tridimensional de múltiples vistas en muchos campos.
¿Quién? El libro es para
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básicos para cualquier tipo de reconstrucción tridimensional multivista.
Otros títulos de la serie Reconstrucción tridimensional multivista ( 30 )
Homografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesTransformación lineal directa: Aplicaciones prácticas y técnicas en visión por computadora. Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesDetección de contorno: Revelando el arte de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificaciones
Relacionado con Reconstrucción tridimensional multivista
Títulos en esta serie (100)
Homografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesTransformación lineal directa: Aplicaciones prácticas y técnicas en visión por computadora. Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesDetección de contorno: Revelando el arte de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Espacio de escala: Explorando las dimensiones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de característica invariante de escala: Revelando el poder de la transformación de características invariantes de escala en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEstimación de la postura del cuerpo articulado: Desbloqueando el movimiento humano en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesFlujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSoftware Afelio: Desbloqueando la visión: explorando las profundidades del software Aphelion Calificación: 0 de 5 estrellas0 calificacionesPERCEPCIÓN VISUAL - Aplicada a la robótica Calificación: 0 de 5 estrellas0 calificacionesMapeo Móvil: Desbloquear la inteligencia espacial con visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión de máquina: Información sobre el mundo de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos de computadora: Explorando la intersección de gráficos por computadora y visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesMapa de altura: Explorando la representación del terreno a través de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos Calificación: 0 de 5 estrellas0 calificacionesModelado tridimensional de estructuras anatómicas heterogéneas Calificación: 0 de 5 estrellas0 calificacionesHistograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEliminación de líneas ocultas: Revelando lo invisible: secretos de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesDeterminación de superficies ocultas: Revelando los secretos de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProyección ortográfica: Explorando la proyección ortográfica en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelado Geométrico: Explorando el modelado geométrico en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelamiento y simulación de sistemas con Simulink: Aplicaciones en ingeniería estructural Calificación: 4 de 5 estrellas4/5Algoritmo de dibujo lineal: Dominar técnicas para la representación de imágenes de precisión Calificación: 0 de 5 estrellas0 calificacionesPartición del espacio binario: Explorando la partición del espacio binario: fundamentos y aplicaciones en visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Inteligencia artificial: Conversaciones ChatGPT Calificación: 0 de 5 estrellas0 calificacionesProgramación de Inteligencia Artificial. Curso Práctico Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Inteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesMáquinas predictivas: La sencilla economía de la inteligencia artificial Calificación: 4 de 5 estrellas4/5Inteligencia artificial Calificación: 2 de 5 estrellas2/5El poder de las imagenes, la palabra no tiene poder Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5Monetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Klara y el Sol Calificación: 5 de 5 estrellas5/5El imperio de los algoritmos: IA inclusiva, ética y al servicio de la humanidad Calificación: 0 de 5 estrellas0 calificacionesEl sueño de la Inteligencia Artificial: El proyecto de construir máquinas pensantes: una historia de la IA. Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: la cuarta revolución industrial Calificación: 0 de 5 estrellas0 calificacionesChatGPT. Obtén el máximo rendimiento a la Inteligencía Artificial Generativa Calificación: 0 de 5 estrellas0 calificacionesDibujo de ingeniería: Desbloquear la percepción visual en el dibujo de ingeniería Calificación: 5 de 5 estrellas5/5GuíaBurros: Guía de escritura creativa con Inteligencia Artificial Calificación: 0 de 5 estrellas0 calificacionesDominar Chatbot GPT: Una guía completa para desbloquear el poder de las conversaciones de IA para su negocio Calificación: 0 de 5 estrellas0 calificacionesProcesamient o de Lenguaje Natural con Python: COMPUTADORAS Calificación: 0 de 5 estrellas0 calificacionesLa ola que viene: Tecnología, poder y el gran dilema del siglo XXI Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5ChatGPT y OpenAI. Desarrollo y uso de herramientas de inteligencia artificial generativa Calificación: 0 de 5 estrellas0 calificacionesInternet no es lo que pensamos: Una historia, una filosofía, una advertencia Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Guía para seres pensantes Calificación: 0 de 5 estrellas0 calificacionesAmazon Echo y Alexa Calificación: 0 de 5 estrellas0 calificacionesMinería de datos: Desbloqueo de conocimientos mediante inteligencia algorítmica y aprendizaje automático Calificación: 0 de 5 estrellas0 calificacionesMotor paso a paso: Control de precisión para aplicaciones robóticas Calificación: 0 de 5 estrellas0 calificacionesReconocimiento de gestos: Desbloqueando el lenguaje del movimiento Calificación: 0 de 5 estrellas0 calificaciones
Comentarios para Reconstrucción tridimensional multivista
0 clasificaciones0 comentarios
Vista previa del libro
Reconstrucción tridimensional multivista - Fouad Sabry
Capítulo 1: Reconstrucción 3D a partir de múltiples imágenes
El proceso de construcción de un modelo 3D a partir de una colección de fotos en 2D se conoce como reconstrucción en 3D. Es la técnica mediante la cual las escenas 3D se convierten en imágenes 2D.
Las imágenes son esencialmente proyecciones de escenas tridimensionales en un plano bidimensional, donde se pierde la información de profundidad. Para un punto de imagen determinado, el punto 3D coincidente debe estar a lo largo de la línea de visión del espectador. No se puede saber qué punto de esta línea corresponde al punto de la imagen basándose en una sola imagen. Si tenemos acceso a dos fotos, podemos determinar las coordenadas 3D de un punto encontrando la ubicación donde se conectan los dos rayos de proyección. La triangulación describe este método. Las relaciones entre diferentes puntos de vista son cruciales, ya que proporcionan el conocimiento de que los pares de puntos se correlacionan entre sí porque debe haber alguna estructura subyacente entre ellos, y que esta estructura está a su vez relacionada con las poses y la calibración de la cámara.
En las últimas décadas se ha producido un cambio de enfoque que se ha alejado de los gráficos 2D y se ha acercado al contenido 3D para gráficos por ordenador, realidad virtual y comunicación. Muchos de los métodos actuales para crear modelos 3D se basan en hardware caro y especializado (como equipos estéreo) que no es necesario para la mayoría de las aplicaciones existentes. La necesidad de llenar este vacío impulsa la adopción de tecnologías de imagen digital (como una cámara). Tomasi y Kanade propusieron una técnica que se utilizaba en la época. Para obtener datos 3D de las secuencias de vídeo, utilizaron un método de factorización afín. Sin embargo, un defecto importante de este enfoque es que se basa en la proyección ortográfica.
Hay una secuencia específica de operaciones que se deben realizar para transformar una colección de fotos 2D en un modelo 3D:
Hay parámetros internos y externos involucrados en la calibración de la cámara, sin los cuales ninguna configuración algorítmica puede producir resultados precisos. La calibración y la determinación de la profundidad están separadas por una línea continua, ya que la calibración es necesaria para la mayoría de las determinaciones de profundidad.
La parte más difícil de este método es estimar la profundidad, la tercera dimensión que siempre está ausente en una imagen dada. El desafío clave es el problema de correspondencia, que implica ubicar entidades coincidentes en dos imágenes de modo que se puedan triangular sus coordenadas 3D.
Una vez que tenga muchos mapas de profundidad, puede fusionarlos mediante el registro para obtener una malla final mediante cálculos de profundidad y proyecciones de cámara. Con el fin de proporcionar varias perspectivas, se utilizará la calibración de la cámara para determinar cuál de las numerosas mallas generadas por los mapas de profundidad se puede combinar para formar una más grande.
Aunque es posible una malla 3D terminada en la etapa de aplicación de material, es más común desear agregar el color de las fotos de origen en este punto. Segmentar el modelo por material, como cualidades especulares y difusas, es otra opción. Esto se puede lograr de varias maneras, desde proyectar aleatoriamente las imágenes en la malla hasta mezclar las texturas para obtener una súper resolución.
Dado un grupo de puntos 3D visualizados por N cámaras con matrices \{P^{i}\}_{{i=1\ldots N}} , se definen m_{j}^{i}\simeq P^{i}w_{j} como las coordenadas homogéneas de la proyección del j^{th} punto sobre la i^{th} cámara.
El problema de reconstrucción se puede cambiar a: dado el grupo de coordenadas de píxeles \{m_{j}^{i}\} , encuentre el conjunto correspondiente de matrices de cámara \{P^{i}\} y la estructura de la escena \{w_{j}\} tal que
m_{j}^{i}\simeq P^{i}w_{j} (1)
Generalmente, sin más límites, una reconstrucción proyectiva es con lo que terminaremos.
Si \{P^{i}\} y \{w_{j}\} satisface (1), \{P^{i}T\} y \{T^{{-1}}w_{j}\} satisfará (1) con 4 × 4 matrices no singulares T cualesquiera.
Sin ningún conocimiento previo, una reconstrucción proyectiva puede ser calculada únicamente por la correspondencia de puntos.
El paso inicial de la autocalibración, también conocida como autocalibración, es la recuperación del movimiento y los parámetros de la cámara a través de la rigidez. Entonces los cálculos estructurales se vuelven simples. Aquí hay dos enfoques para poner este plan en acción:
Las propiedades internas de la cámara se pueden calcular con un mínimo de tres desplazamientos utilizando un conjunto de ecuaciones polinómicas desarrolladas por Kruppa, La matriz K=AA^{{\top }} es desconocida en las ecuaciones de Kruppa, Matriz de los coeficientes de Kruppa.
Es sencillo calcular los parámetros intrínsecos utilizando K y la técnica de factorización de Cholesky:
K={\begin{bmatrix}k_{1}&k_{2}&k_{3}\\k_{2}&k_{4}&k_{5}\\k_{3}&k_{5}&1\\\end{bmatrix}}Una nueva versión más simple fue presentada recientemente por Hartley.
F Que se escriba como F=DUV^{\top } , donde
Después de esto, se reformulan las ecuaciones de Kruppa (la derivación se puede encontrar en )
La clave de esta estrategia es el estricto cumplimiento de las restricciones.
Crear un modelo de precios, que tenga en cuenta las matrices básicas como argumentos y los parámetros intrínsecos como entrada.
{\displaystyle {F}_{ij}} se define como la matriz fundamental, {A}_{i} y {A}_{j} como matrices de parámetros intrínsecos.
Recientemente se han propuesto nuevos enfoques basados en la idea de estratificación. Actualice esta reconstrucción proyectiva a una reconstrucción euclidiana utilizando todas las restricciones disponibles, a partir de una estructura proyectiva que se pueda calcular utilizando solo correspondencias. Esto permite que el problema se divida en partes manejables, cada una de las cuales se puede examinar en un nivel diferente (proyectivo, afín o euclidiano) dependiendo del número de restricciones disponibles.
Normalmente, pensamos en el mundo como un espacio euclidiano tridimensional. Toda la estructura euclidiana del espacio 3D no se puede utilizar en todas las situaciones. La geometría proyectiva es la más simple, seguida de la geometría afín (una capa intermedia) y luego la geometría euclidiana (la más compleja). Una serie de transformaciones proyectivas (una homografía) se encuentra en el estrato proyectivo, una serie afín de transformaciones se encuentra en el estrato afín y una serie euclidiana de transformaciones se encuentra en el estrato euclidiano.
Digamos que tenemos dos o más cámaras de perspectiva mirando la misma escena, y conocemos las correspondencias entre las ubicaciones visibles en cada imagen.
Sin embargo, en la práctica, el problema de la coincidencia es crucial para la visión por computadora, pero también muy difícil de resolver.
Aquí, suponemos que n los puntos 3D
