Mosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos
Por Fouad Sabry
()
Información de este libro electrónico
Qué es el mosaico de documentos
El mosaico de documentos es un proceso que une múltiples imágenes instantáneas superpuestas de un documento para producir una composición grande y de alta resolución. El documento se desliza manualmente debajo de una cámara estacionaria colocada sobre el escritorio hasta que todas las partes del documento son fotografiadas por el campo de visión de la cámara. A medida que el documento se desliza debajo de la cámara, el sistema de visión sigue de forma aproximada todo movimiento del documento. Periódicamente se toman instantáneas del documento de modo que las instantáneas sucesivas se superpongan en aproximadamente un 50%. Luego, el sistema encuentra los pares superpuestos y los une repetidamente hasta que todos los pares se unen como una sola pieza del documento.
Cómo se beneficiará
( I) Información y validaciones sobre los siguientes temas:
Capítulo 1: Mosaico de documentos
Capítulo 2: Unión de imágenes
Capítulo 3: Demostración
Capítulo 4: Análisis del diseño del documento
Capítulo 5: Persiana enrollable
Capítulo 6: Calibración automática de la cámara
Capítulo 7: Visión estéreo por computadora
Capítulo 8: Segmentación de movimiento rígido
Capítulo 9: Textura de la imagen
Capítulo 10: Rectificación de la imagen
(II) Respondiendo las principales preguntas del público sobre el mosaico de documentos.
(III) Ejemplos del mundo real sobre el uso del mosaico de documentos en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de mosaico de documentos.
Lee más de Fouad Sabry
Tecnologías Emergentes En Tecnologías De La Información Y Las Comunicaciones [Spanish]
Relacionado con Mosaico de documentos
Títulos en esta serie (100)
Reducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEstimación de la postura del cuerpo articulado: Desbloqueando el movimiento humano en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de característica invariante de escala: Revelando el poder de la transformación de características invariantes de escala en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesGeometría proyectiva: Explorando la geometría proyectiva en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de línea de exploración: Explorando el realismo visual a través de técnicas de renderizado Scanline Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesTensor trifocal: Explorando la profundidad, el movimiento y la estructura en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Estimación de movimiento: Avances y aplicaciones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesClasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz Calificación: 0 de 5 estrellas0 calificacionesModelado y renderizado basado en imágenes: Explorando el realismo visual: técnicas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReconstrucción tridimensional multivista: Técnicas avanzadas de percepción espacial en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de cámara estenopeica: Comprender la perspectiva a través de la óptica computacional Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de polígono: Explorando la intersección de gráficos por computadora poligonales y visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesFlujo óptico: Explorando patrones visuales dinámicos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia activa: Liberando el poder de los modelos de apariencia activa en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de característica invariante de escala: Revelando el poder de la transformación de características invariantes de escala en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos ráster: Transformando realidades visuales: dominio de los editores de gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCampo de movimiento: Explorando la dinámica de la visión por computadora: campo de movimiento revelado Calificación: 0 de 5 estrellas0 calificacionesAlgoritmo de la línea de Bresenham: Representación eficiente de líneas con píxeles perfectos para visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMétodo de ajuste de nivel: Avances en la visión por computadora, exploración del método de conjunto de niveles Calificación: 0 de 5 estrellas0 calificacionesInterpolación bilineal: Mejora de la resolución y claridad de la imagen mediante interpolación bilineal Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesSuperficie procesal: Explorando la generación y el análisis de texturas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de volumen: Explorando el realismo visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora bidimensionales: Explorando el ámbito visual: gráficos por computadora bidimensionales en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAlgoritmo de dibujo lineal: Dominar técnicas para la representación de imágenes de precisión Calificación: 0 de 5 estrellas0 calificacionesDetección de manchas: Revelando patrones en datos visuales Calificación: 0 de 5 estrellas0 calificacionesRepresentación de línea de exploración: Explorando el realismo visual a través de técnicas de renderizado Scanline Calificación: 0 de 5 estrellas0 calificacionesCortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHashing geométrico: Algoritmos eficientes para el reconocimiento y la comparación de imágenes Calificación: 0 de 5 estrellas0 calificacionesGráficos rasterizados: Comprender los fundamentos de los gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos vectoriales: Potenciando la creación visual con algoritmos avanzados Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Resumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Cómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesFundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesMáquinas predictivas: La sencilla economía de la inteligencia artificial Calificación: 5 de 5 estrellas5/5Chat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificacionesEscritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5Metodología de la programación Calificación: 0 de 5 estrellas0 calificacionesKlara y el Sol Calificación: 5 de 5 estrellas5/5Introducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesCómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesComputación Forense Calificación: 0 de 5 estrellas0 calificacionesOracle 12c PL/SQL: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesPython fácil Calificación: 4 de 5 estrellas4/5Inteligencia Artificial Calificación: 4 de 5 estrellas4/5El mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5¿Cómo piensan las máquinas?: Inteligencia artificial para humanos Calificación: 5 de 5 estrellas5/5Introducción a la Ingeniería Industrial Calificación: 0 de 5 estrellas0 calificacionesDesarrollo y programación en entornos web Calificación: 0 de 5 estrellas0 calificacionesMáquinas como yo Calificación: 4 de 5 estrellas4/5PHP: Programación web avanzada para profesionales Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de software con netbeans 7.1: Programe para scritorio, web y dispositivos móviles Calificación: 0 de 5 estrellas0 calificacionesEl imperio de los algoritmos: IA inclusiva, ética y al servicio de la humanidad Calificación: 0 de 5 estrellas0 calificacionesSobreviviendo a la IA Calificación: 3 de 5 estrellas3/5Inteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Diseño de algoritmos y su programación en C Calificación: 0 de 5 estrellas0 calificacionesHistoria y evolución de la Inteligencia Artificial Calificación: 3 de 5 estrellas3/5
Comentarios para Mosaico de documentos
0 clasificaciones0 comentarios
Vista previa del libro
Mosaico de documentos - Fouad Sabry
Capítulo 1: Mosaico de documentos
El mosaico de documentos es una técnica que combina muchas instantáneas superpuestas de un documento en una sola imagen enorme de alta resolución. El documento se coloca manualmente debajo de una cámara fija sobre el escritorio hasta que toda su superficie se captura dentro del campo de visión de la cámara. A medida que el documento se movía debajo de la cámara, el sistema de visión monitoreaba el movimiento del documento de forma aproximada. Periódicamente, se toman imágenes del documento de tal manera que se superponen en aproximadamente un 50 por ciento. A continuación, la tecnología identifica los pares superpuestos y los une continuamente hasta que todos los pares se combinan en un solo documento.
La creación de mosaicos de documentos se puede dividir en cuatro pasos principales.
Seguimiento
Detección de características
Correspondencias que establezcan
Mosaico de imágenes.
El sistema realiza un seguimiento aproximado del movimiento del documento a medida que se desliza por debajo de la cámara durante este procedimiento. Para el seguimiento se utiliza un método conocido como procedimiento de correlación simple. Como se muestra en la Figura 1, se recupera un pequeño parche del centro de la imagen como plantilla de correlación en el primer fotograma de instantáneas. El procedimiento de correlación se ejecuta en un área cuatro veces el tamaño del parche del siguiente fotograma. La velocidad del papel está representada por el pico de la función de correlación. El pico en la función de correlación representa la velocidad del papel. A partir de este fotograma, la plantilla se vuelve a muestrear y el seguimiento continúa hasta que la plantilla llega al borde del documento. Una vez que la plantilla llega al borde del documento, se captura otra imagen y se repite el procedimiento de seguimiento hasta que se haya capturado todo el documento. Las instantáneas se guardan en una lista ordenada para ayudar a las operaciones posteriores que emparejan fotos superpuestas.
Encontrar la transformación que alinea una imagen con otra es el proceso de detección de características. Hay dos métodos principales para detectar características.
Los parámetros de movimiento se calculan en función de las correspondencias de puntos mediante un método basado en entidades. Este método es aplicable cuando hay una abundancia de características estables y detectables.
Cuando el movimiento entre dos imágenes es modesto, se utiliza el método de flujo óptico para estimar los parámetros de movimiento. Sin embargo, cuando el movimiento entre dos imágenes es sustancial, los parámetros de movimiento se calculan mediante correlación cruzada generalizada. Sin embargo, este método requiere recursos computacionalmente costosos.
Cada imagen se divide en una estructura jerárquica de columnas, líneas y palabras que corresponden a las agrupaciones organizadas de entidades en las imágenes. La estimación del ángulo de inclinación y la localización de columnas, líneas y palabras son ejemplos de operaciones de detección de entidades.
En primer lugar, se estima el ángulo (ángulo de inclinación) entre las filas de texto y las líneas ráster de la imagen.
Se supone que se encuentra en el rango de ±20°.
Un pequeño parche de texto en la imagen se selecciona aleatoriamente y luego se gira en el rango de ±20° hasta que se maximiza la varianza de las intensidades de píxeles del parche sumadas a lo largo de las líneas ráster.
Véase el diagrama 2.
Para asegurarse de que el ángulo de inclinación calculado es preciso, el sistema de mosaico de documentos realiza cálculos en muchos parches de imagen y deriva la estimación final calculando la media de los diferentes ángulos ponderados por la variación en las intensidades de píxeles para cada parche.
El manuscrito desensartado se divide intuitivamente en columnas, líneas y palabras durante esta operación. La sensibilidad del documento sin sesgo a la iluminación y al color de la página se puede eliminar aplicando un operador Sobel a la imagen sin sesgo y ajustando el umbral de la salida para crear la imagen sin sesgo de degradado binario. Véase el diagrama 3.
El procedimiento se puede dividir en tres fases: segmentación de columnas, segmentación de líneas y segmentación de palabras.
La Figura 4 ilustra la facilidad con la que se pueden distinguir las columnas de las imágenes de degradado binario y sin sesgo mediante la adición de píxeles verticalmente.
Las líneas base de cada fila se dividen de la misma manera que las bases de columna, pero horizontalmente.
Por último, las palabras individuales se segmentan aplicando el procedimiento vertical a cada fila que se ha segmentado.
Estas segmentaciones son cruciales porque el mosaico del documento se forma haciendo coincidir las esquinas inferiores derechas de las palabras en las imágenes que se superponen. Además, el procedimiento de segmentación puede organizar de forma fiable la lista de fotos dentro de una jerarquía de filas y