Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Palabra Visual: Liberando el poder de la comprensión de imágenes
Palabra Visual: Liberando el poder de la comprensión de imágenes
Palabra Visual: Liberando el poder de la comprensión de imágenes
Libro electrónico141 páginas1 hora

Palabra Visual: Liberando el poder de la comprensión de imágenes

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

Qué es Visual Word


Las palabras visuales, tal como se usan en los sistemas de recuperación de imágenes, se refieren a pequeñas partes de una imagen que contienen algún tipo de información relacionada con las características o cambios. que ocurren en los píxeles, como el filtrado y los descriptores de funciones de bajo nivel.


Cómo se beneficiará


(I) Información y validaciones sobre lo siguiente temas:


Capítulo 1: Visual Word


Capítulo 2: Código


Capítulo 3: Recuperación de información


Capítulo 4: Segmentación de imágenes


Capítulo 5: Resumen automático


Capítulo 6: Análisis semántico latente


Capítulo 7: Recuperación de imágenes basada en contenido


Capítulo 8: N -gram


Capítulo 9: Matriz de términos de documento


Capítulo 10: Búsqueda de texto completo


(II) Respondiendo las principales preguntas del público sobre palabras visuales.


(III) Ejemplos del mundo real sobre el uso de palabras visuales en muchos campos.


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de Visual Word.


 


 

IdiomaEspañol
Fecha de lanzamiento4 may 2024
Palabra Visual: Liberando el poder de la comprensión de imágenes

Relacionado con Palabra Visual

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Palabra Visual

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Palabra Visual - Fouad Sabry

    Capítulo 1: Palabra visual

    Las palabras visuales, tal como se emplean en los sistemas de recuperación de imágenes, se refieren a porciones cortas de una imagen que contienen información sobre las características (como el color, la forma o la textura) o los cambios en los píxeles, como los descriptores de características de bajo nivel de filtrado (SIFT o SURF).

    Metodologías del sistema de recuperación de texto (o sistema de recuperación de información)

    Tenga en cuenta que los píxeles de una imagen, que son las porciones más pequeñas de una imagen digital y no se pueden dividir más, son similares a las letras alfabéticas de un idioma. Entonces, un grupo de píxeles dentro de una imagen (un parche o matrices de píxeles) constituye una palabra. Luego, cada palabra se puede reprocesar dentro de un sistema morfológico para recuperar un término relacionado. Entonces, varias palabras con el mismo significado se referirán al mismo concepto (como en cualquier idioma). Numerosas palabras comparten el mismo significado y constituyen la misma frase (tienen la misma información). De acuerdo con esta perspectiva, los investigadores pueden adaptar las técnicas de recuperación de texto a los sistemas de recuperación de imágenes.

    Este enfoque se puede aplicar a los juegos para determinar qué palabras y frases aparecerán en nuestras imágenes. El objetivo es intentar comprender las imágenes utilizando un vocabulario de palabras visuales.

    Región pequeña de una imagen que puede incluir cualquier información en cualquier espacio de entidades, como cambios de color o textura.

    En términos generales, las palabras visuales (VW) existen en un espacio de características de valores continuos, lo que implica un gran número de palabras y, en consecuencia, un vasto lenguaje. Dado que los sistemas de recuperación de imágenes deben utilizar técnicas de recuperación de texto en función de los lenguajes naturales, que tienen un límite en el número de términos y palabras, el número de palabras visuales debe reducirse.

    Hay numerosas formas de superar este problema, como dividir el espacio de entidades en rangos con características compartidas (que se pueden considerar como la misma palabra). Sin embargo, esta técnica tiene numerosos defectos, incluida la estrategia de división y la amplitud del rango en el espacio de características. El uso de un método de agrupamiento para clasificar y fusionar palabras que transmiten información común en un número finito de términos es otra solución presentada por los investigadores.

    La consecuencia de la agrupación en clústeres en el espacio de características (centros de los clústeres). Varios parches pueden proporcionar la información más cercana en el espacio de características, por lo que podemos considerarlos equivalentes.

    Como el término de un texto (el verbo infinito, los sustantivos y los artículos) hace referencia a numerosas palabras comunes con las mismas propiedades, el término visual (con su resultado de agrupación) se referirá a todas las palabras comunes que comparten la misma información en un espacio de características.

    Por último, si todas las imágenes corresponden al mismo conjunto de conceptos visuales, entonces todas pueden comunicarse en el mismo lenguaje (o lenguaje visual).

    Una colección de palabras y frases visuales.

    Teniendo en cuenta únicamente los términos visuales está el Vocabulario Visual, que será el sistema de referencia y recuperación que dependerá de él para recuperar imágenes.

    Este lenguaje visual representará todas las imágenes como una colección de palabras visuales, o una bolsa de palabras visuales.

    Una colección de palabras visuales que juntas explican el significado de una parte o de toda la imagen.

    Sobre la base de este tipo de representación de imágenes, es posible crear un sistema de recuperación de imágenes utilizando técnicas de recuperación de texto. Sin embargo, debido a que todos los sistemas de recuperación de texto se basan en términos, las imágenes de consulta del usuario deben transformarse en una colección de palabras visuales dentro del sistema. A continuación, el sistema comparará estos términos visuales con todos los términos visuales de la base de datos.

    {Fin del capítulo 1}

    Capítulo 2: Código

    A los efectos de la comunicación y el procesamiento de la información, un código es un conjunto de principios que transforma la información, como una letra, una palabra, un sonido, una imagen o un gesto, en otra forma, a veces más corta o secreta, para su almacenamiento en un dispositivo de almacenamiento o para su transmisión a través de un canal de comunicación. Un ejemplo temprano es el desarrollo del lenguaje, que permitió a las personas expresar verbalmente lo que estaban pensando, viendo, escuchando o sintiendo a los demás. Sin embargo, el habla restringe a la audiencia a los presentes en el momento en que se pronuncia el discurso y limita el rango de comunicación a la distancia que puede recorrer una voz. El advenimiento de la escritura, que transformó la comunicación verbal en símbolos visuales, aumentó el potencial de comunicación a través del tiempo y la distancia.

    La codificación es el proceso de transformar los datos de una fuente en símbolos para su transmisión o almacenamiento. El procedimiento opuesto, conocido como decodificación, consiste en traducir los símbolos del código a un idioma que el destinatario pueda comprender, como el inglés y/o el español.

    La codificación se utiliza para facilitar la comunicación en situaciones en las que sería difícil o imposible hacerlo utilizando un lenguaje sencillo habitual, ya sea verbalmente o por escrito. Por ejemplo, el semáforo encripta partes del mensaje, generalmente caracteres individuales y números, utilizando la disposición de las banderas sostenidas por el señalizador o los brazos de la torre del semáforo. Las banderas pueden ser leídas por alguien lejano y pueden repetir los mensajes enviados.

    En la teoría de la información y las ciencias de la computación, se suele pensar en un código como un método que representa discretamente símbolos de un alfabeto de origen mediante cadenas codificadas, que podrían estar en un alfabeto de destino diferente. La concatenación de las cadenas codificadas produce una extensión del código para codificar secuencias de símbolos en el alfabeto de origen.

    Este es un pequeño ejemplo antes de proporcionar una definición que sea matemáticamente exacta. El diagrama

    C = \{\, a\mapsto 0, b\mapsto 01, c\mapsto 011\,\}

    El código, cuyo alfabeto de origen es el conjunto \{a,b,c\} y cuyo alfabeto de destino es el conjunto \{0,1\} .

    Usando la extensión del código, la cadena codificada 0011001 se puede agrupar en palabras de código como 0 011 0 01, y estas a su vez se pueden usar para decodificar el orden de los símbolos originales, acab.

    Haciendo uso de conceptos de la teoría formal del lenguaje, La siguiente es una definición matemática detallada de esta idea: S y T deben ser dos conjuntos finitos, alfabetos conocidos como fuente y destino, respectivamente.

    Un código C:\, S \to T^* es una función total que asigna cada símbolo de S a una secuencia de símbolos sobre T.

    La extensión C' de C , es un homomorfismo de S^{*} en T^{*} , Convierte automáticamente cada conjunto de símbolos de origen en un conjunto de símbolos de destino.

    En esta sección, hablaremos de los códigos que traducen cada carácter de origen (texto sin cifrar) en una palabra clave tomada de un diccionario, que cuando se concatena produce una cadena codificada. Cuando los caracteres de texto sin cifrar tienen probabilidades variadas, los códigos de longitud variable son extremadamente útiles; Consulte también Codificación de entropía.

    Un código de prefijo es aquel que posee la propiedad conocida como propiedad de prefijo: ninguna otra palabra de código válida en el conjunto tiene un prefijo (inicio) que también sea una palabra de código válida en el sistema. El algoritmo más conocido para generar códigos de prefijo es la codificación huffman. Incluso cuando el código de prefijo no fue generado por un método de Huffman, con frecuencia se le conoce como códigos de Huffman. Las secciones de país y editor de los ISBN, los números de llamada de país y los códigos de sincronización secundarios utilizados por el estándar inalámbrico UMTS WCDMA 3G son instancias adicionales de códigos de prefijo.

    Los posibles conjuntos de longitudes de palabras de código en un código de prefijo se describen mediante la desigualdad de Kraft. Casi cualquier código de uno a muchos que se pueda decodificar de forma única, no solo los códigos de prefijo, debe satisfacer la desigualdad de Kraft.

    Además, los códigos se pueden emplear para representar datos de una manera que sea más resistente a los errores de transmisión o almacenamiento. La forma en que funciona este código supuestamente corrector de errores es mediante la construcción cuidadosa de redundancia en los datos almacenados (o transmitidos). Algunos ejemplos son los códigos de espacio-tiempo, los códigos de comprobación de paridad de baja densidad, Reed-Solomon, Reed-Muller, Walsh-Hadamard, Bose-Chaudhuri-Hochquenghem, Turbo, Golay y Goppa. Los algoritmos de detección de errores se pueden mejorar para encontrar errores aleatorios o de ráfaga.

    Al sustituir palabras más cortas por palabras como barco o factura, un código de cable permite que la misma información se comunique con menos caracteres, más rápidamente

    ¿Disfrutas la vista previa?
    Página 1 de 1