Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Visión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora
Visión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora
Visión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora
Libro electrónico137 páginas1 hora

Visión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

¿Qué es la visión estéreo por computadora?


La visión estéreo por computadora es la extracción de información 3D a partir de imágenes digitales, como las obtenidas por una cámara CCD. Al comparar información sobre una escena desde dos puntos de vista, se puede extraer información 3D examinando las posiciones relativas de los objetos en los dos paneles. Esto es similar al proceso biológico de estereopsis.


Cómo te beneficiarás


(I) Insights y validaciones sobre los siguientes temas:


Capítulo 1: Visión estéreo por computadora


Capítulo 2: Reconstrucción 3D


Capítulo 3: Modelo de contorno activo


Capítulo 4: Detector de región afín de Harris


Capítulo 5: Detección de primer plano


Capítulo 6: Matrix Chernoff obligado


Capítulo 7: Similitud


Capítulo 8: Similitud estructural


Capítulo 9: Función de varianza


Capítulo 10: Distancia inicial de Fréchet


(II) Respondiendo a las principales preguntas del público sobre la visión estéreo por computadora.


(III) Ejemplos del mundo real para el uso de la visión estéreo por computadora en muchos campos.


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o información básica para cualquier tipo de Visión Estéreo por Computadora.


 


 

IdiomaEspañol
Fecha de lanzamiento28 abr 2024
Visión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora

Lee más de Fouad Sabry

Relacionado con Visión estéreo por computadora

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Visión estéreo por computadora

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Visión estéreo por computadora - Fouad Sabry

    Capítulo 1: Visión estereoscópica por ordenador

    El objetivo de la visión estereoscópica por computadora es recuperar mapas de profundidad a partir de imágenes digitales capturadas por una cámara CCD, por ejemplo. La extracción de datos 3D de una escena implica la comparación de datos de dos paneles y la observación de las posiciones relativas de los elementos. El proceso biológico de la estereopsis es análogo a esto.

    Al igual que la visión binocular humana, la visión estereoscópica clásica emplea dos cámaras separadas por una distancia horizontal para capturar dos perspectivas distintas de una escena. Al comparar las dos fotos, se puede generar un mapa de disparidad que codifique la diferencia en las posiciones horizontales de los puntos en las dos imágenes y, por lo tanto, la profundidad relativa entre ellos. Este mapa de disparidad contiene valores que son inversamente proporcionales a la profundidad de la escena en cada píxel individual.

    Las imágenes deben superponerse en un dispositivo estereoscópico, con la imagen de la cámara derecha presentada al ojo derecho del observador y la imagen de la cámara izquierda al ojo izquierdo del observador, para que una persona pueda hacer una comparación.

    Varios procesos preliminares son obligatorios en cada sistema de visión artificial.

    Antes de que se pueda hacer cualquier otra cosa con la imagen, debe estar sin distorsiones, lo que significa que se han eliminado tanto la distorsión de barril como la tangencial. Por lo tanto, se garantiza que la imagen vista sea idéntica a la que proyectaría una cámara estenopeica perfecta.

    La rectificación de imágenes es el proceso de devolver una imagen a un plano estándar para su comparación en paralelo.

    La distancia entre las dos fotos se reduce utilizando una medida de información. Esto genera un mapa de disparidad, la mejor estimación de dónde se encuentran las entidades entre las dos imágenes.

    Se genera una nube de puntos 3D a partir del mapa de disparidad recibido. Utilizando las características proyectivas de las cámaras, se puede calcular la nube de puntos para obtener mediciones escalables.

    Para aliviar la complejidad del problema de la coincidencia estéreo, la visión estéreo activa hace uso de un láser o luz estructurada. La visión estereoscópica activa es el antónimo.

    El método tradicional de visión de luz estructurada (SLV) utiliza un láser o luz estructurada para establecer las correspondencias entre el proyector y la cámara.

    Al igual que la visión estereoscópica pasiva, la visión estereoscópica activa (ASV) tradicional utiliza una luz estructurada o láser, pero solo hace coincidencia estéreo para las correspondencias cámara-cámara.

    Tanto las correspondencias cámara-cámara como proyector-cámara se pueden utilizar en un método híbrido.

    Hay una amplia variedad de usos para las pantallas estéreo 3D en los medios de comunicación, la educación y la fabricación. La extracción de información sobre las relaciones espaciales entre objetos 3D alrededor de sistemas autónomos es un caso de uso importante para la visión estereoscópica en dominios como la robótica. La robótica tiene otros usos potenciales, como el reconocimiento de objetos, que se basa en la información de profundidad para identificar y aislar objetos que de otro modo quedarían ocultos por otros cercanos, como una silla frente a otra silla.

    La visión estereoscópica digital tiene varios usos científicos, incluida la extracción de datos de levantamientos aéreos, el cálculo de mapas de contorno y la extracción de geometría para la cartografía de edificios en 3D y la cartografía fotogramétrica por satélite.

    Los píxeles son pequeños cuadrados que se utilizan para registrar datos de color. Las coordenadas (x, y) en una cuadrícula de píxeles y la distancia (z) al píxel en cuestión definen su ubicación.

    La visión estereoscópica proporciona dos vistas de la misma escena, vistas desde ángulos ligeramente diferentes. La fuente de luz A brilla a través de los puntos de entrada de la cámara estenopeica B y D en las pantallas de imagen E y H en el siguiente diagrama.

    La distancia BD = BC + CD en el diagrama adjunto es la distancia entre las dos lentes de la cámara. Ambos triángulos tienen el mismo aspecto, ACB y BFE

    ACD y DGH

    {\begin{aligned}{\text{Therefore displacement }}d&=EF+GH\\&=BF({\frac {EF}{BF}}+{\frac {GH}{BF}})\\&=BF({\frac {EF}{BF}}+{\frac {GH}{DG}})\\&=BF({\frac {BC+CD}{AC}})\\&=BF{\frac {BD}{AC}}\\&={\frac {k}{z}}{\text{, where}}\\\end{aligned}}

    k = BD BF

    La distancia angular z = AC mide desde el plano de la cámara hasta el sujeto.

    El desplazamiento del eje Y entre el píxel idéntico en las dos fotos es, por lo tanto, suponiendo que las cámaras están niveladas y los planos de la imagen son planos en el mismo plano, d={\frac {k}{z}}

    En el que k es el producto de las distancias focales de ambas cámaras y la distancia entre el objetivo y la imagen.

    El componente de profundidad en las dos imágenes es z_{1} y z_{2} , dado por,

    z_{2}(x,y)=\min \left\{v:v=z_{1}(x,y-{\frac {k}{z_{1}(x,y)}})\right\}z_{1}(x,y)=\min \left\{v:v=z_{2}(x,y+{\frac {k}{z_{2}(x,y)}})\right\}

    Estas fórmulas acomodan la oclusión de vóxeles en una imagen por vóxeles en la segunda imagen que están más cerca de la superficie del objeto.

    Cuando los planos de dos imágenes no son paralelos entre sí, es necesaria la rectificación de imágenes para hacerlos paralelos. Una transformación lineal que podría lograr esto es.

    Cada imagen puede requerir corrección para que parezca que fue tomada con una cámara estenopeica y proyectada sobre una superficie plana.

    La similitud entre los tonos se puede cuantificar por su suavidad. Es más probable que los píxeles de colores similares pertenezcan a un solo objeto en lugar de a varios objetos, en la idea de que un objeto distinto tiene un pequeño número de colores.

    Utilizando la teoría de la información y la premisa de que el color de un vóxel afecta al color de los vóxeles vecinos de acuerdo con la distribución normal en la distancia entre puntos, el método anterior evalúa la suavidad. El modelo toma como punto de partida aproximaciones sobre el mundo.

    La autocorrelación es otra técnica que presupone que los datos son fluidos.

    En lugar de ser una cualidad inherente a una imagen, la suavidad es un rasgo del mundo mismo. No habría suavidad en una imagen formada por puntos aleatorios, y sacar conclusiones basadas en su proximidad no tendría sentido.

    La suavidad, como cualquier otra propiedad del mundo, debe aprenderse en concepto. Parece que el sistema visual humano funciona de esta manera.

    A esto lo llamamos normal o el

    P(x,\mu ,\sigma )={\frac {1}{\sigma {\sqrt {2\pi }}}}e^{{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}}

    La probabilidad P es proporcional a la cantidad de información enviada por la longitud del mensaje L, P(x)=2^{{-L(x)}}

    L(x)=-\log _{2}{P(x)}

    así que

    L(x,\mu ,\sigma )=\log _{2}(\sigma {\sqrt {2\pi }})+{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}\log _{2}e

    Solo la longitud relativa del mensaje es relevante cuando se comparan imágenes estereoscópicas. I, o la Suma

    ¿Disfrutas la vista previa?
    Página 1 de 1