Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Mosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos
Mosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos
Mosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos
Libro electrónico85 páginas56 minutos

Mosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

Qué es el mosaico de documentos


El mosaico de documentos es un proceso que une múltiples imágenes instantáneas superpuestas de un documento para producir una composición grande y de alta resolución. El documento se desliza manualmente debajo de una cámara estacionaria colocada sobre el escritorio hasta que todas las partes del documento son fotografiadas por el campo de visión de la cámara. A medida que el documento se desliza debajo de la cámara, el sistema de visión sigue de forma aproximada todo movimiento del documento. Periódicamente se toman instantáneas del documento de modo que las instantáneas sucesivas se superpongan en aproximadamente un 50%. Luego, el sistema encuentra los pares superpuestos y los une repetidamente hasta que todos los pares se unen como una sola pieza del documento.


Cómo se beneficiará


( I) Información y validaciones sobre los siguientes temas:


Capítulo 1: Mosaico de documentos


Capítulo 2: Unión de imágenes


Capítulo 3: Demostración


Capítulo 4: Análisis del diseño del documento


Capítulo 5: Persiana enrollable


Capítulo 6: Calibración automática de la cámara


Capítulo 7: Visión estéreo por computadora


Capítulo 8: Segmentación de movimiento rígido


Capítulo 9: Textura de la imagen


Capítulo 10: Rectificación de la imagen


(II) Respondiendo las principales preguntas del público sobre el mosaico de documentos.


(III) Ejemplos del mundo real sobre el uso del mosaico de documentos en muchos campos.


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de mosaico de documentos.


 


 

IdiomaEspañol
Fecha de lanzamiento5 may 2024
Mosaico de documentos: Desbloqueo de información visual a través del mosaico de documentos

Lee más de Fouad Sabry

Relacionado con Mosaico de documentos

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Mosaico de documentos

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Mosaico de documentos - Fouad Sabry

    Capítulo 1: Mosaico de documentos

    El mosaico de documentos es una técnica que combina muchas instantáneas superpuestas de un documento en una sola imagen enorme de alta resolución. El documento se coloca manualmente debajo de una cámara fija sobre el escritorio hasta que toda su superficie se captura dentro del campo de visión de la cámara. A medida que el documento se movía debajo de la cámara, el sistema de visión monitoreaba el movimiento del documento de forma aproximada. Periódicamente, se toman imágenes del documento de tal manera que se superponen en aproximadamente un 50 por ciento. A continuación, la tecnología identifica los pares superpuestos y los une continuamente hasta que todos los pares se combinan en un solo documento.

    La creación de mosaicos de documentos se puede dividir en cuatro pasos principales.

    Seguimiento

    Detección de características

    Correspondencias que establezcan

    Mosaico de imágenes.

    El sistema realiza un seguimiento aproximado del movimiento del documento a medida que se desliza por debajo de la cámara durante este procedimiento. Para el seguimiento se utiliza un método conocido como procedimiento de correlación simple. Como se muestra en la Figura 1, se recupera un pequeño parche del centro de la imagen como plantilla de correlación en el primer fotograma de instantáneas. El procedimiento de correlación se ejecuta en un área cuatro veces el tamaño del parche del siguiente fotograma. La velocidad del papel está representada por el pico de la función de correlación. El pico en la función de correlación representa la velocidad del papel. A partir de este fotograma, la plantilla se vuelve a muestrear y el seguimiento continúa hasta que la plantilla llega al borde del documento. Una vez que la plantilla llega al borde del documento, se captura otra imagen y se repite el procedimiento de seguimiento hasta que se haya capturado todo el documento. Las instantáneas se guardan en una lista ordenada para ayudar a las operaciones posteriores que emparejan fotos superpuestas.

    Encontrar la transformación que alinea una imagen con otra es el proceso de detección de características. Hay dos métodos principales para detectar características.

    Los parámetros de movimiento se calculan en función de las correspondencias de puntos mediante un método basado en entidades. Este método es aplicable cuando hay una abundancia de características estables y detectables.

    Cuando el movimiento entre dos imágenes es modesto, se utiliza el método de flujo óptico para estimar los parámetros de movimiento. Sin embargo, cuando el movimiento entre dos imágenes es sustancial, los parámetros de movimiento se calculan mediante correlación cruzada generalizada. Sin embargo, este método requiere recursos computacionalmente costosos.

    Cada imagen se divide en una estructura jerárquica de columnas, líneas y palabras que corresponden a las agrupaciones organizadas de entidades en las imágenes. La estimación del ángulo de inclinación y la localización de columnas, líneas y palabras son ejemplos de operaciones de detección de entidades.

    En primer lugar, se estima el ángulo (ángulo de inclinación) entre las filas de texto y las líneas ráster de la imagen.

    Se supone que se encuentra en el rango de ±20°.

    Un pequeño parche de texto en la imagen se selecciona aleatoriamente y luego se gira en el rango de ±20° hasta que se maximiza la varianza de las intensidades de píxeles del parche sumadas a lo largo de las líneas ráster.

    Véase el diagrama 2.

    Para asegurarse de que el ángulo de inclinación calculado es preciso, el sistema de mosaico de documentos realiza cálculos en muchos parches de imagen y deriva la estimación final calculando la media de los diferentes ángulos ponderados por la variación en las intensidades de píxeles para cada parche.

    El manuscrito desensartado se divide intuitivamente en columnas, líneas y palabras durante esta operación. La sensibilidad del documento sin sesgo a la iluminación y al color de la página se puede eliminar aplicando un operador Sobel a la imagen sin sesgo y ajustando el umbral de la salida para crear la imagen sin sesgo de degradado binario. Véase el diagrama 3.

    El procedimiento se puede dividir en tres fases: segmentación de columnas, segmentación de líneas y segmentación de palabras.

    La Figura 4 ilustra la facilidad con la que se pueden distinguir las columnas de las imágenes de degradado binario y sin sesgo mediante la adición de píxeles verticalmente.

    Las líneas base de cada fila se dividen de la misma manera que las bases de columna, pero horizontalmente.

    Por último, las palabras individuales se segmentan aplicando el procedimiento vertical a cada fila que se ha segmentado.

    Estas segmentaciones son cruciales porque el mosaico del documento se forma haciendo coincidir las esquinas inferiores derechas de las palabras en las imágenes que se superponen. Además, el procedimiento de segmentación puede organizar de forma fiable la lista de fotos dentro de una jerarquía de filas y

    ¿Disfrutas la vista previa?
    Página 1 de 1