Visión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora
Por Fouad Sabry
()
Información de este libro electrónico
¿Qué es la visión estéreo por computadora?
La visión estéreo por computadora es la extracción de información 3D a partir de imágenes digitales, como las obtenidas por una cámara CCD. Al comparar información sobre una escena desde dos puntos de vista, se puede extraer información 3D examinando las posiciones relativas de los objetos en los dos paneles. Esto es similar al proceso biológico de estereopsis.
Cómo te beneficiarás
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Visión estéreo por computadora
Capítulo 2: Reconstrucción 3D
Capítulo 3: Modelo de contorno activo
Capítulo 4: Detector de región afín de Harris
Capítulo 5: Detección de primer plano
Capítulo 6: Matrix Chernoff obligado
Capítulo 7: Similitud
Capítulo 8: Similitud estructural
Capítulo 9: Función de varianza
Capítulo 10: Distancia inicial de Fréchet
(II) Respondiendo a las principales preguntas del público sobre la visión estéreo por computadora.
(III) Ejemplos del mundo real para el uso de la visión estéreo por computadora en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o información básica para cualquier tipo de Visión Estéreo por Computadora.
Lee más de Fouad Sabry
Tecnologías Emergentes en Agricultura [Spanish]
Relacionado con Visión estéreo por computadora
Títulos en esta serie (100)
Visión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPerfil de color: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesMapeo de colores: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesDetección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Segmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesModelo de cámara estenopeica: Comprender la perspectiva a través de la óptica computacional Calificación: 0 de 5 estrellas0 calificacionesGráficos de trazado de rayos: Explorando la representación fotorrealista en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSuperficie procesal: Explorando la generación y el análisis de texturas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFlujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de volumen: Explorando el realismo visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVóxel: Explorando las profundidades de la visión por computadora con tecnología Voxel Calificación: 0 de 5 estrellas0 calificacionesIluminación global: Visión avanzada: conocimientos sobre la iluminación global Calificación: 0 de 5 estrellas0 calificacionesGeometría epipolar: Desbloqueo de la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de radiosidad: Avances en la visualización a través de la radiosidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de vértice: Explorando la intersección de los gráficos por computadora Vertex y la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDeterminación de superficies ocultas: Revelando los secretos de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRed de sensores visuales: Explorando el poder de las redes de sensores visuales en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDistancia Niebla: Explorando la frontera visual: información sobre la niebla a distancia de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEstimación de la postura del cuerpo articulado: Desbloqueando el movimiento humano en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelado y renderizado basado en imágenes: Explorando el realismo visual: técnicas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCampo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado Calificación: 0 de 5 estrellas0 calificacionesEstimación de movimiento: Avances y aplicaciones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de relieve: Mapeo de relieve: exploración de la profundidad en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesProyección tridimensional: Liberando la profundidad de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de gráficos por computadora: Explorando el realismo visual: conocimientos sobre gráficos por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos rasterizados: Comprender los fundamentos de los gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos ráster: Transformando realidades visuales: dominio de los editores de gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de polígono: Explorando la intersección de gráficos por computadora poligonales y visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGeometría descriptiva: Desbloqueando el ámbito visual: explorando la geometría descriptiva en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de objetos: Avances, aplicaciones y algoritmos Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
El mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5El poder de las imagenes, la palabra no tiene poder Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesCómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: con aplicaciones a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesSobreviviendo a la IA Calificación: 3 de 5 estrellas3/5ANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificaciones¿Cómo piensan las máquinas?: Inteligencia artificial para humanos Calificación: 5 de 5 estrellas5/5Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesEl imperio de los algoritmos: IA inclusiva, ética y al servicio de la humanidad Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Introducción a la Ingeniería Industrial Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5GuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio Calificación: 0 de 5 estrellas0 calificacionesProgramación de Inteligencia Artificial. Curso Práctico Calificación: 0 de 5 estrellas0 calificacionesDiseño de algoritmos y su programación en C Calificación: 0 de 5 estrellas0 calificacionesArquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesEstructuras de Datos Básicas: Programación orientada a objetos con Java Calificación: 5 de 5 estrellas5/5Mecatrónica Calificación: 0 de 5 estrellas0 calificacionesMi Asistente IA Calificación: 0 de 5 estrellas0 calificacionesMonetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Python fácil Calificación: 4 de 5 estrellas4/5Klara y el Sol Calificación: 5 de 5 estrellas5/5Resumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesLaravel: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesDesarrollo y programación en entornos web Calificación: 0 de 5 estrellas0 calificaciones
Comentarios para Visión estéreo por computadora
0 clasificaciones0 comentarios
Vista previa del libro
Visión estéreo por computadora - Fouad Sabry
Capítulo 1: Visión estereoscópica por ordenador
El objetivo de la visión estereoscópica por computadora es recuperar mapas de profundidad a partir de imágenes digitales capturadas por una cámara CCD, por ejemplo. La extracción de datos 3D de una escena implica la comparación de datos de dos paneles y la observación de las posiciones relativas de los elementos. El proceso biológico de la estereopsis es análogo a esto.
Al igual que la visión binocular humana, la visión estereoscópica clásica emplea dos cámaras separadas por una distancia horizontal para capturar dos perspectivas distintas de una escena. Al comparar las dos fotos, se puede generar un mapa de disparidad que codifique la diferencia en las posiciones horizontales de los puntos en las dos imágenes y, por lo tanto, la profundidad relativa entre ellos. Este mapa de disparidad contiene valores que son inversamente proporcionales a la profundidad de la escena en cada píxel individual.
Las imágenes deben superponerse en un dispositivo estereoscópico, con la imagen de la cámara derecha presentada al ojo derecho del observador y la imagen de la cámara izquierda al ojo izquierdo del observador, para que una persona pueda hacer una comparación.
Varios procesos preliminares son obligatorios en cada sistema de visión artificial.
Antes de que se pueda hacer cualquier otra cosa con la imagen, debe estar sin distorsiones, lo que significa que se han eliminado tanto la distorsión de barril como la tangencial. Por lo tanto, se garantiza que la imagen vista sea idéntica a la que proyectaría una cámara estenopeica perfecta.
La rectificación de imágenes es el proceso de devolver una imagen a un plano estándar para su comparación en paralelo.
La distancia entre las dos fotos se reduce utilizando una medida de información. Esto genera un mapa de disparidad, la mejor estimación de dónde se encuentran las entidades entre las dos imágenes.
Se genera una nube de puntos 3D a partir del mapa de disparidad recibido. Utilizando las características proyectivas de las cámaras, se puede calcular la nube de puntos para obtener mediciones escalables.
Para aliviar la complejidad del problema de la coincidencia estéreo, la visión estéreo activa hace uso de un láser o luz estructurada. La visión estereoscópica activa es el antónimo.
El método tradicional de visión de luz estructurada (SLV) utiliza un láser o luz estructurada para establecer las correspondencias entre el proyector y la cámara.
Al igual que la visión estereoscópica pasiva, la visión estereoscópica activa (ASV) tradicional utiliza una luz estructurada o láser, pero solo hace coincidencia estéreo para las correspondencias cámara-cámara.
Tanto las correspondencias cámara-cámara como proyector-cámara se pueden utilizar en un método híbrido.
Hay una amplia variedad de usos para las pantallas estéreo 3D en los medios de comunicación, la educación y la fabricación. La extracción de información sobre las relaciones espaciales entre objetos 3D alrededor de sistemas autónomos es un caso de uso importante para la visión estereoscópica en dominios como la robótica. La robótica tiene otros usos potenciales, como el reconocimiento de objetos, que se basa en la información de profundidad para identificar y aislar objetos que de otro modo quedarían ocultos por otros cercanos, como una silla frente a otra silla.
La visión estereoscópica digital tiene varios usos científicos, incluida la extracción de datos de levantamientos aéreos, el cálculo de mapas de contorno y la extracción de geometría para la cartografía de edificios en 3D y la cartografía fotogramétrica por satélite.
Los píxeles son pequeños cuadrados que se utilizan para registrar datos de color. Las coordenadas (x, y) en una cuadrícula de píxeles y la distancia (z) al píxel en cuestión definen su ubicación.
La visión estereoscópica proporciona dos vistas de la misma escena, vistas desde ángulos ligeramente diferentes. La fuente de luz A brilla a través de los puntos de entrada de la cámara estenopeica B y D en las pantallas de imagen E y H en el siguiente diagrama.
La distancia BD = BC + CD en el diagrama adjunto es la distancia entre las dos lentes de la cámara. Ambos triángulos tienen el mismo aspecto, ACB y BFE
ACD y DGH
{\begin{aligned}{\text{Therefore displacement }}d&=EF+GH\\&=BF({\frac {EF}{BF}}+{\frac {GH}{BF}})\\&=BF({\frac {EF}{BF}}+{\frac {GH}{DG}})\\&=BF({\frac {BC+CD}{AC}})\\&=BF{\frac {BD}{AC}}\\&={\frac {k}{z}}{\text{, where}}\\\end{aligned}}k = BD BF
La distancia angular z = AC mide desde el plano de la cámara hasta el sujeto.
El desplazamiento del eje Y entre el píxel idéntico en las dos fotos es, por lo tanto, suponiendo que las cámaras están niveladas y los planos de la imagen son planos en el mismo plano, d={\frac {k}{z}}
En el que k es el producto de las distancias focales de ambas cámaras y la distancia entre el objetivo y la imagen.
El componente de profundidad en las dos imágenes es z_{1} y z_{2} , dado por,
z_{2}(x,y)=\min \left\{v:v=z_{1}(x,y-{\frac {k}{z_{1}(x,y)}})\right\}z_{1}(x,y)=\min \left\{v:v=z_{2}(x,y+{\frac {k}{z_{2}(x,y)}})\right\}Estas fórmulas acomodan la oclusión de vóxeles en una imagen por vóxeles en la segunda imagen que están más cerca de la superficie del objeto.
Cuando los planos de dos imágenes no son paralelos entre sí, es necesaria la rectificación de imágenes para hacerlos paralelos. Una transformación lineal que podría lograr esto es.
Cada imagen puede requerir corrección para que parezca que fue tomada con una cámara estenopeica y proyectada sobre una superficie plana.
La similitud entre los tonos se puede cuantificar por su suavidad. Es más probable que los píxeles de colores similares pertenezcan a un solo objeto en lugar de a varios objetos, en la idea de que un objeto distinto tiene un pequeño número de colores.
Utilizando la teoría de la información y la premisa de que el color de un vóxel afecta al color de los vóxeles vecinos de acuerdo con la distribución normal en la distancia entre puntos, el método anterior evalúa la suavidad. El modelo toma como punto de partida aproximaciones sobre el mundo.
La autocorrelación es otra técnica que presupone que los datos son fluidos.
En lugar de ser una cualidad inherente a una imagen, la suavidad es un rasgo del mundo mismo. No habría suavidad en una imagen formada por puntos aleatorios, y sacar conclusiones basadas en su proximidad no tendría sentido.
La suavidad, como cualquier otra propiedad del mundo, debe aprenderse en concepto. Parece que el sistema visual humano funciona de esta manera.
A esto lo llamamos normal
o el
La probabilidad P es proporcional a la cantidad de información enviada por la longitud del mensaje L, P(x)=2^{{-L(x)}}
L(x)=-\log _{2}{P(x)}así que
L(x,\mu ,\sigma )=\log _{2}(\sigma {\sqrt {2\pi }})+{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\log _{2}eSolo la longitud relativa del mensaje es relevante cuando se comparan imágenes estereoscópicas. I, o la Suma