Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Reconocimiento óptico de caracteres: Liberando el poder de la visión por computadora para el reconocimiento óptico de caracteres
Reconocimiento óptico de caracteres: Liberando el poder de la visión por computadora para el reconocimiento óptico de caracteres
Reconocimiento óptico de caracteres: Liberando el poder de la visión por computadora para el reconocimiento óptico de caracteres
Libro electrónico109 páginas1 hora

Reconocimiento óptico de caracteres: Liberando el poder de la visión por computadora para el reconocimiento óptico de caracteres

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

Qué es el reconocimiento óptico de caracteres


El reconocimiento óptico de caracteres o lector óptico de caracteres (OCR) es la conversión electrónica o mecánica de imágenes de texto mecanografiado, escrito a mano o impreso en formato mecánico. texto codificado, ya sea de un documento escaneado, una fotografía de un documento, una fotografía de una escena o un texto de subtítulo superpuesto a una imagen.


Cómo se beneficiará


(I) Ideas y validaciones sobre los siguientes temas:


Capítulo 1: Reconocimiento óptico de caracteres


Capítulo 2: Tipo de letra


Capítulo 3: Reconocimiento de escritura a mano


Capítulo 4: Escáner de imágenes


Capítulo 5: Reconocimiento óptico de marcas


Capítulo 6: Reconocimiento inteligente de caracteres


Capítulo 7: Tesseract ( software)


Capítulo 8: OCRopus


Capítulo 9: CuneiForm (software)


Capítulo 10: Comparación de software de reconocimiento óptico de caracteres


(II) Responder a las principales preguntas del público sobre el reconocimiento óptico de caracteres.


(III) Ejemplos del mundo real sobre el uso del reconocimiento óptico de caracteres en muchos campos.


Quién es este libro es para


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de Reconocimiento Óptico de Caracteres.


 


 

IdiomaEspañol
Fecha de lanzamiento4 may 2024
Reconocimiento óptico de caracteres: Liberando el poder de la visión por computadora para el reconocimiento óptico de caracteres

Lee más de Fouad Sabry

Relacionado con Reconocimiento óptico de caracteres

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Reconocimiento óptico de caracteres

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Reconocimiento óptico de caracteres - Fouad Sabry

    Capítulo 1: Reconocimiento óptico de caracteres

    A partir de un documento escaneado, una foto del documento, una foto de escena (como el texto de letreros y vallas publicitarias en una foto de paisaje) o texto de subtítulos superpuesto a una imagen, el reconocimiento óptico de caracteres (OCR) es la conversión electrónica o mecánica de imágenes de texto mecanografiado, escrito a mano o impreso en texto codificado por máquina (por ejemplo, de una transmisión de televisión).

    Es un método común de digitalización de textos impresos para la edición electrónica, la búsqueda, el almacenamiento compacto, la visualización en línea y el uso en procesos automáticos como la computación cognitiva, la traducción automática, la conversión de texto a voz (extraído) y otra documentación adecuada, como documentos de pasaporte, facturas, extractos bancarios, recibos computarizados, tarjetas de visita, correo, impresiones de datos estáticos y otra documentación adecuada. El reconocimiento de patrones, la IA y la visión artificial contribuyen al OCR.

    Las versiones anteriores solo admitían un único tipo de letra y requerían entrenamiento con fotos de cada personaje. Los sistemas modernos a menudo manejan muchos formatos de archivos de imágenes digitales y pueden proporcionar un alto nivel de precisión de identificación para la mayoría de los tipos de letra. Algunas implementaciones pueden generar una copia de la página con todos los detalles de formato conservados, como gráficos, columnas y otros elementos no textuales.

    La telegrafía y el desarrollo de ayudas a la lectura para ciegos son dos posibles antecedentes del reconocimiento óptico moderno de caracteres.

    Para examinar archivos de microfilmes utilizando un sistema de reconocimiento de código óptico, Emanuel Goldberg creó lo que denominó una máquina estadística en las décadas de 1920 y 1930. En 1931, recibió la patente estadounidense 1.838.389 por su creación. IBM ahora es propietaria de la patente.

    Después de desarrollar el OCR omni-font, que podía leer texto escrito en casi cualquier tipo de letra, Ray Kurzweil fundó Kurzweil Computer Products, Inc. en 1974. (A menudo se le atribuye a Kurzweil la invención del OCR de fuente omnidireccional, pero fue utilizado por empresas, incluida CompuScan, a fines de la década de 1960 y 1970). El uso óptimo de esta tecnología, razonó Kurzweil, sería desarrollar una máquina de lectura para ciegos, que permitiría a las personas con discapacidad visual tener una computadora que lea en voz alta cualquier texto que el usuario ingrese. Dos tecnologías clave, el escáner de cama plana CCD y el sintetizador de texto a voz, tuvieron que ser desarrolladas para que este dispositivo se convirtiera en una realidad. El producto final fue presentado durante una conferencia de prensa el 13 de enero de 1976, presidida por Kurzweil y la Federación Nacional de Ciegos. La primera versión comercial del software de reconocimiento óptico de caracteres fue lanzada por Kurzweil Computer Products en 1978. Como uno de los primeros en adoptarlo, LexisNexis compró el software para incluir artículos de noticias y resúmenes legales en sus incipientes bases de datos en línea. Kurzweil vendió su empresa a Xerox dos años más tarde debido al deseo de esta última de comercializar la conversión de texto del papel a la computadora. Scansoft, que había sido escindida por Xerox, se fusionó más tarde con Nuance Communications.

    En la década de 2000, el OCR se hizo accesible en la nube, en dispositivos móviles y en la traducción en tiempo real de signos en idiomas extranjeros utilizando un teléfono inteligente a través de servicios como WebOCR. Con el auge de los dispositivos móviles conectados a Internet, como los teléfonos inteligentes y los relojes inteligentes, el OCR se está utilizando en aplicaciones que extraen texto de imágenes tomadas con la cámara del dispositivo. Si el dispositivo no tiene capacidades de OCR integradas en el sistema operativo, se utilizará una API de OCR para leer el archivo de imagen y extraer el texto. La API de OCR envía el texto extraído de vuelta al programa en el dispositivo, junto con información sobre en qué parte de la imagen original se reconoció el texto, para que la aplicación pueda hacer algo con él (como convertirlo en voz o mostrarlo).

    Los caracteres latinos, cirílicos, árabes, hebreos, índicos, bengalíes (bengalíes), devanagari, tamiles, chinos, japoneses y coreanos son compatibles con una amplia variedad de sistemas OCR comerciales y de código abierto.

    El OCR de recibos, el OCR de facturas, el OCR de cheques y el OCR de documentos de facturación legal son solo algunos de los numerosos tipos de aplicaciones de OCR específicas del dominio que se han creado sobre los motores de OCR.

    Puede utilizarlos en:

    Introducir información de registros corporativos como cheques, pasaportes, facturas, extractos bancarios y recibos

    Software de lectura de matrículas

    En los aeropuertos, para escanear pasaportes y extraer datos

    Extracción automática de datos clave de los papeles de seguros

    La capacidad de leer las señales de tráfico

    Añadir datos de contacto de una tarjeta de visita

    Acelere el proceso de conversión de materiales impresos en texto, como el escaneo de libros para el Proyecto Gutenberg.

    Permite buscar copias digitales de libros y revistas impresas como Google Books.

    Uso del reconocimiento de escritura a mano en tiempo real para operar una computadora (pen computing)

    Evitar los sistemas anti-bot CAPTCHA, incluso si están destinados a detener el OCR. Las pruebas de fuerza del sistema anti-bot CAPTCHA son otro posible objetivo.

    Equipos diseñados para ayudar a las personas con discapacidad visual

    Las instrucciones del vehículo se escriben localizando imágenes CAD en una base de datos que son relevantes para el diseño del vehículo en constante evolución.

    El proceso de transformación de documentos escaneados en archivos PDF con capacidad de búsqueda

    El texto mecanografiado es en lo que se centra el reconocimiento óptico de caracteres (OCR). Lo hace analizando cada glifo o letra individual.

    El escaneo palabra por palabra del texto impreso es el foco del reconocimiento óptico de palabras (para idiomas que utilizan un espacio como divisor de palabras). (Comúnmente abreviado como OCR)

    La escritura manuscrita impresa o cursiva es otro objetivo del reconocimiento inteligente de caracteres (ICR), que se centra en cada glifo o letra individual.

    El análisis palabra por palabra de la escritura a mano en letra impresa o cursiva es otro de los objetivos del reconocimiento inteligente de palabras (IWR). Esto es particularmente útil para los idiomas que emplean la escritura cursiva sin separar los glifos.

    El reconocimiento óptico de caracteres suele ser un procedimiento fuera de línea que evalúa un documento conservado. Las API de OCR en línea son ofrecidas por ciertos servicios basados en la nube. Es posible proporcionar datos sobre los movimientos de la mano de un escritor en un sistema de reconocimiento de escritura a mano. Este método es superior a confiar únicamente en las formas de los glifos y las palabras, ya que puede registrar acciones como el orden en que se dibujan las partes, la dirección tomada y el ritmo de cuando se deja y se recoge el bolígrafo. Estos datos complementarios tienen el potencial de mejorar la precisión general

    ¿Disfrutas la vista previa?
    Página 1 de 1