Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Compresión de imagen: Técnicas eficientes para la optimización de datos visuales
Compresión de imagen: Técnicas eficientes para la optimización de datos visuales
Compresión de imagen: Técnicas eficientes para la optimización de datos visuales
Libro electrónico188 páginas2 horas

Compresión de imagen: Técnicas eficientes para la optimización de datos visuales

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

¿Qué es la compresión de imágenes?


Cuando se aplica a fotografías digitales, la compresión de imágenes es una forma de compresión de datos que ayuda a reducir la cantidad de dinero que se requiere para su almacenamiento o transmisión. Es posible que los algoritmos utilicen la percepción visual y los aspectos estadísticos de los datos de las imágenes para proporcionar mejores resultados en comparación con los enfoques genéricos de compresión de datos que se utilizan para otros tipos de datos digitales.


Cómo te beneficiarás


(I) Insights y validaciones sobre los siguientes temas:


Capítulo 1: Compresión de imágenes


Capítulo 2: Compresión de datos


Capítulo 3: JPEG


Capítulo 4: Compresión con pérdida


Capítulo 5: Compresión sin pérdida


Capítulo 6: PNG


Capítulo 7: Codificación de transformación


Capítulo 8: Transformada de coseno discreto


Capítulo 9: JPEG 2000


Capítulo 10: Artefacto de compresión


(II) Respondiendo a las principales preguntas del público sobre la compresión de imágenes.


(III) Ejemplos del mundo real para el uso de la compresión de imágenes en muchos campos.


Quién este libro es para


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de compresión de imágenes.


 


 

IdiomaEspañol
Fecha de lanzamiento29 abr 2024
Compresión de imagen: Técnicas eficientes para la optimización de datos visuales

Relacionado con Compresión de imagen

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Compresión de imagen

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Compresión de imagen - Fouad Sabry

    Capítulo 1: Compresión de imágenes

    Las fotografías digitales se pueden comprimir mediante la compresión de imágenes, una forma de compresión de datos, para reducir su tamaño y, por lo tanto, sus costos de almacenamiento y transferencia. Con el fin de obtener mejores resultados que los métodos genéricos de compresión de datos utilizados para otros datos digitales, los algoritmos pueden explotar la percepción visual y las características estadísticas de los datos de imagen.

    La compresión de imágenes con y sin pérdida son posibles. La mayoría de las imágenes médicas, los dibujos técnicos, las imágenes prediseñadas y los dibujos animados se benefician de la compresión sin pérdidas para el almacenamiento a largo plazo. Los artefactos de compresión son introducidos por técnicas de compresión con pérdidas, especialmente cuando se trabaja con velocidades de bits bajas. Cuando se desea una reducción significativa de la velocidad binaria, pero es aceptable una pequeña pérdida de calidad (a menudo indetectable), los enfoques con pérdida son ideales. Este es el caso de las imágenes naturales como las fotografías. La compresión visualmente sin pérdidas utiliza una forma de compresión con pérdidas que produce pérdidas de calidad imperceptibles.

    Técnicas de compresión con pérdida:

    La técnica más utilizada es la codificación por transformación.

    El tipo más popular de compresión con pérdida es la transformada discreta de coseno (DCT). Inventada por Nasir Ahmed, T. Natarajan y K. R. Rao en 1974, pertenece a una familia de transformadas que incluye la transformada de Fourier. En el contexto de un grupo de transformadas discretas de coseno, la DCT se denomina con frecuencia DCT-II (ver transformada discreta de coseno). Es el método más eficaz de compresión de imágenes en la mayoría de los casos.

    El formato con pérdida más utilizado, JPEG, utiliza DCT, al igual que el HEIF más moderno.

    La cuantificación y la codificación de entropía vienen a continuación, y luego la transformada wavelet más contemporánea.

    La cuantización del color es el proceso de reducir la paleta de colores de una imagen a un pequeño conjunto de tonos representativos. El encabezado de la imagen comprimida incluye una paleta de colores que especifica los colores que se utilizaron para crear la imagen. El índice de color se menciona simplemente en cada píxel. Con el fin de evitar la posterización, esta técnica se puede utilizar junto con el tramado.

    Paleta de colores completa, comúnmente utilizada en archivos GIF y PNG, con un máximo de 256 colores.

    En BTC, CCC, S2TC y S3TC, se emplea una paleta de bloques de 2 o 4 colores cada bloque de 4x4 píxeles.

    Reducción del espacio de color mediante submuestreo de croma. Al promediar o eliminar parte de la información de crominancia en la imagen, se aprovecha el hecho de que el ojo humano registra los cambios espaciales de brillo de manera más aguda que los de color.

    Compresión fractal.

    Los perceptrones multicapa, las redes neuronales convolucionales y las redes generativas adversarias, todas ellas procedentes del ámbito del aprendizaje automático, se han utilizado en aplicaciones más contemporáneas.

    Técnicas de compresión sin pérdidas:

    PCX utiliza la codificación de longitud de ejecución de forma predeterminada, mientras que BMP, TGA y TIFF la admiten como modo alternativo de codificación.

    Compresión de imágenes de área

    DPCM hace uso de la codificación predictiva.

    La codificación matemática y la codificación Huffman son las dos formas más populares de codificación de entropía.

    LZW, un popular método de diccionario adaptativo utilizado en GIF y TIFF, utiliza DEFLATE en archivos PNG, MNG y TIFF.

    Códigos de cadena

    Modelos de difusión

    El objetivo principal de la compresión de imágenes es obtener la mayor calidad posible a una velocidad de compresión (o tasa de bits) dada:

    En la mayoría de los casos, reducir la escalabilidad significa sacrificar la calidad mediante la manipulación del flujo de bits o archivo subyacente (sin descompresión y recompresión). La codificación progresiva y los flujos de bits incrustados son otros nombres para la escalabilidad. Los códecs sin pérdida también tienen escalabilidad, sin embargo, adopta una forma diferente (a menudo un escaneo de píxeles gruesos a finos) y se utilizan para otros fines. La vista previa de las imágenes durante la descarga (en un navegador web, por ejemplo) u ofrecer un acceso de calidad variable a los recursos (como las bases de datos) se benefician enormemente de la escalabilidad. Existen diferentes tipos de escalabilidad:

    Escalamiento progresivo de la calidad o la complejidad: Cada iteración del flujo de bits mejora la calidad de la imagen reconstruida.

    Para codificar una versión de mayor calidad de una imagen, primero se debe codificar la versión de menor resolución.

    Codificación gradual del color a partir de una versión previamente codificada en blanco y negro.

    Codificación por área de interés. Las diferentes regiones de la imagen se codifican con diferentes niveles de calidad. A esto se le podría añadir la capacidad de escalar (codificar primero estas partes, luego otras).

    Datos sobre datos. Las imágenes se pueden explorar, buscar y categorizar con la ayuda de metadatos que pueden estar presentes en los datos comprimidos. Los datos de color y textura, las imágenes de vista previa y la información sobre el autor/copyright son ejemplos de este tipo de datos.

    Capacidad de cómputo. Los métodos de compresión tienen diferentes demandas computacionales de codificación y decodificación. Se necesitan muchos recursos de CPU para ejecutar algunos métodos de alta compresión.

    La relación señal-ruido máxima es una métrica común utilizada para evaluar la eficacia de una técnica de compresión. Cuantifica la cantidad de ruido creado por la compresión con pérdida de una imagen, pero la evaluación subjetiva del espectador a veces se considera tan esencial, si no más.

    La codificación de Shannon-Fano, precursora de la codificación de entropía moderna, se desarrolló a finales de la década de 1940, Data Compression for Images.

    En enero de 1974, IEEE Trans. Computers publicó Discrete Cosine Transform de Nasir Ahmed, T. Natarajan y K. R. Rao en las páginas 90-93.

    ↑ Maayan, Gilad David (24 de noviembre de 2021). Estado del Arte en Compresión de Imágenes Basada en Inteligencia Artificial. Hacia la ciencia de los datos. Extraído el 6 de abril de 2023.

    Compresión generativa de imágenes de alta calidad. Extraído el 6 de abril de 2023.

    ^ Bühlmann, Matthias (2022-09-28).

    Comprimir imágenes utilizando un método de difusión estable.

    Medio.

    Consultado el 2022-11-02.

    Burt, P.; ↑ Adelson, E. (1 de abril de 1983). La pirámide laplaciana es un código de imagen condensado. Comunicaciones, IEEE, 31(4), pp.532-540. doi:10.1109/TCOM.1983.1095851; Cita SeerX:10.1.1.54.299; S2CID:8018433.

    ^ Shao, Dan; Kropatsch, Walter G.

    (3 al 5 de febrero de 2010).

    Špaček, Libor; Franc, Vojtěch (eds.).

    Pirámide de Grafos Laplacianos Irregulares (PDF).

    Taller de Invierno de Visión por Computador 2010.

    Nové Hrady, República Checa: Sociedad Checa de Reconocimiento de Patrones.

    Fecha de publicación inicial: 27 de mayo de 2013 (PDF).

    Agradecimientos a: Claude Elwood Shannon (1948). Alcatel-Lucent (ed.). La Teoría Matemática de la Interacción Interpersonal (PDF). 27 (3-4) Bell System Technical Journal, páginas 379-423, 623-656. Referencias: hdl:11858/00-001M-0000-002C-4314-2; doi:10.1002/j.1538-7305.1948.tb01338.x. Se puede acceder al original (PDF) a partir del 24 de mayo de 2011. Fecha de consulta: 21 de abril de 2019.

    La versión original (PDF) de Un método para la creación de códigos de redundancia mínima de David Albert Huffman fue archivada el 2005-10-08 de Proceedings of the IRE, vol. 40, no. 9, pp. 1098-1101 (doi:10.1109/JRPROC.1952.273898).

    Referencia: Hadamard transform image coding, William K. Pratt, Julius Kane y Harry C. Andrews, Proceedings of the IEEE 57.1 (1969), páginas 58-68.

    ↑ Nasir Ahmed (enero de 1991). Transformada discreta de coseno: la historia detrás de su creación. Para citar este artículo: Digital Signal Processing 1 (enero): 4-5.

    T.81: REQUISITOS Y DIRECTRICES PARA LA COMPRESIÓN DIGITAL Y LA CODIFICACIÓN DE IMÁGENES FIJAS DE TONO CONTINUO (PDF). Publicado en el CCITT en septiembre de 1992. Recuperado el 18-08-2000 del original (PDF) en esa fecha. ¡Consíguelo el 12 de julio de 2019!.

    Hay una explicación del formato de imagen JPEG en BT.com. 31 de mayo de 2018, BT Group. A partir del 5 de agosto de 2019.

    ^ JPEG: ¿Qué es? El artículo cotidiano que pasa desapercibido. Publicado en The Atlantic el 24 de septiembre de 2013. Extraído el 13 de septiembre de 2019.

    ↑ Chris Baraniuk (15 de octubre de 2015). Según BBC News, las restricciones de copia podrían llegar a los JPEG. Recuperado de la BBC el 13 de septiembre de 2019.

    El debate sobre los GIF: el punto de vista de un programador", 27 de enero de 1995. Disponible a partir del 26 de mayo de 2015.

    Autor: L. Peter Deutsch (mayo de 1996). Abstracto. DOI:10.17487/RFC1951. Especificación de formato de datos comprimidos DEFLATE versión 1.3. IETF. Página 1. sección Resumen. Obtén esto: 2014-04-23.

    Véase: Taubman, David; Marcelino, Miguel (2012). Conceptos básicos de compresión de imágenes con JPEG2000: prácticas recomendadas y pautas técnicas. ISBN: 9781461507994, publicado por Springer Science & Business Media.

    ^ a b Unser, M; Blu, T.

    (2003).

    JPEG2000 características matemáticas del filtro de ondículas (PDF).

    IEEE Transactions on Image Processing (Transacciones IEEE sobre procesamiento de imágenes).

    12 (9): 1080-1090.

    Bibcode:2003ITIP... 12.1080U.

    doi:10.1109/TIP.2003.812329.

    PMID 18237979.

    S2CID 2765169.

    Archivado desde el original (PDF) el 2019-10-13.

    Por Gary Sullivan (8-12 de diciembre de 2003). Características generales de la codificación de vídeo de subbanda temporal y problemas de diseño. Grupo de Expertos en Codificación del UIT-Video T. Extraído el 13 de septiembre de 2019.

    Alan C. Bovik (2009). Video Processing: An Essential Guide, Academic Press, p. 355, ISBN 9780080922508.

    Citado en Le Gall, Didier y Ali J. Tabatabai (1988). Codificación de subbanda de imágenes digitales con codificación aritmética y filtros de kernel corto simétricos. Para más información, consulte: http://dx.doi.org/10.1109/ICASSP.1988.196696. S2CID=109186495 ICASSP-88., Conferencia Internacional sobre Acústica, Habla y Procesamiento de Señales: 761-764 volumen 2.

    Para citar: Swartz, Charles S. (2005). La Guía del Profesional para Entender el Cine Digital. 147 Taylor y Francis. ISBN 9780240806174.

    {Fin del capítulo 1}

    Capítulo 2: Compresión de datos

    En la teoría de la información, la compresión de datos, la codificación de fuentes y otros campos relacionados: En el lenguaje común, un dispositivo que participa en el proceso de compresión de datos se conoce como codificador, mientras que un dispositivo que se involucra en el proceso inverso, es decir, la descompresión, se conoce como decodificador.

    La compresión de datos es el proceso de reducir el tamaño de un archivo de datos y es un término que se usa con bastante frecuencia. La codificación de origen es un proceso de codificación que tiene lugar en el origen de datos original, antes de que los datos se almacenen o transfieran. Este proceso se conoce en el contexto de la transmisión de datos. Es importante no confundir la codificación de origen con otros tipos de codificación, como la codificación de canal, que se utiliza para la detección y corrección de errores, o la codificación de línea, que es un método para asignar datos a una señal.

    La compresión de datos es beneficiosa, ya que reduce la cantidad de espacio y ancho de banda necesarios para almacenar y transferir información. Los procedimientos de compresión y descompresión necesitan una cantidad significativa de recursos computacionales. El equilibrio entre la complejidad del espacio-tiempo es algo que debe tenerse en cuenta al comprimir los datos. Por ejemplo, un método de compresión de vídeo puede requerir hardware costoso para que el vídeo se descomprima lo suficientemente rápido como para verlo mientras se descomprime. Además, la opción de descomprimir completamente el video antes de verlo puede ser un inconveniente o requerir espacio de almacenamiento adicional. Al diseñar esquemas de compresión de datos, los diseñadores deben hacer concesiones entre una serie de factores diferentes. Estos factores incluyen el nivel de compresión alcanzado, la cantidad de distorsión que se introduce (cuando se utiliza la compresión de datos con pérdida) y la cantidad de recursos computacionales que se necesitan para comprimir y descomprimir los datos.

    Para representar los datos sin perder ninguna información en el proceso, los métodos de compresión de datos sin pérdidas suelen hacer uso de la redundancia estadística. Esto asegura que el proceso pueda revertirse. Debido a que la gran mayoría de los datos en el mundo real tienen redundancia estadística, la compresión sin pérdidas es factible. Por ejemplo, una imagen puede incluir parches de color que no cambian en el transcurso de varios píxeles; En este caso, los datos pueden registrarse como 279 píxeles rojos en lugar de la notación tradicional de píxel rojo, píxel rojo,... Esta es una ilustración fundamental de la codificación de longitud de ejecución; Hay muchos más métodos para disminuir el tamaño de un archivo eliminando la información redundante.

    Las técnicas de compresión como Lempel-Ziv

    ¿Disfrutas la vista previa?
    Página 1 de 1