Composición alfa: Dominar el arte de la composición de imágenes en visión por computadora
Por Fouad Sabry
()
Información de este libro electrónico
Qué es la composición alfa
En gráficos por computadora, la composición alfa o combinación alfa es el proceso de combinar una imagen con un fondo para crear la apariencia de transparencia parcial o total. A menudo resulta útil renderizar elementos de imagen (píxeles) en pasadas o capas separadas y luego combinar las imágenes 2D resultantes en una única imagen final llamada compuesta. La composición se utiliza ampliamente en el cine cuando se combinan elementos de imagen renderizados por computadora con imágenes en vivo. La combinación alfa también se utiliza en gráficos por computadora 2D para colocar elementos rasterizados de primer plano sobre un fondo.
Cómo se beneficiará
(I) Información y validaciones sobre los siguientes temas:
Capítulo 1: Composición alfa
Capítulo 2: Composición digital
Capítulo 3: PNG
Capítulo 4: Modelo de color RGB
Capítulo 5: Corrección de gamma
Capítulo 6: Submuestreo de croma
Capítulo 7: Formato de archivo BMP
Capítulo 8: Modelo de color RGBA
Capítulo 9: Escala de grises
Capítulo 10: Transparencia (gráfico)
(II) Respondiendo a las principales preguntas del público sobre la composición alfa.
(III) Ejemplos del mundo real para el uso de la composición alfa en muchos campos.
Para quién es este libro
Profesionales, estudiantes universitarios y estudiantes de posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de Composición Alfa.
Relacionado con Composición alfa
Títulos en esta serie (100)
Joint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesHistograma de gradientes orientados: Revelando el ámbito visual: explorando el histograma de gradientes orientados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de bordes: Explorando los límites en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesMétodo de ajuste de nivel: Avances en la visión por computadora, exploración del método de conjunto de niveles Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Mapeo de colores: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesAlgoritmo de la línea de Bresenham: Representación eficiente de líneas con píxeles perfectos para visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAlgoritmo de dibujo lineal: Dominar técnicas para la representación de imágenes de precisión Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesPartición del espacio binario: Explorando la partición del espacio binario: fundamentos y aplicaciones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesPerfil de color: Explorando la percepción y el análisis visual en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de volumen: Explorando el realismo visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos ráster: Transformando realidades visuales: dominio de los editores de gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRepresentación de línea de exploración: Explorando el realismo visual a través de técnicas de renderizado Scanline Calificación: 0 de 5 estrellas0 calificacionesAntialiasing: Mejora de la claridad visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesInterpolación bilineal: Mejora de la resolución y claridad de la imagen mediante interpolación bilineal Calificación: 0 de 5 estrellas0 calificacionesGráficos rasterizados: Comprender los fundamentos de los gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráfico de trama digital: Revelando el poder de los gráficos rasterizados digitales en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMétodo de ajuste de nivel: Avances en la visión por computadora, exploración del método de conjunto de niveles Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificacionesPequeño Diccionario de Diseño Gráfico y Fotografía (ed. 2019) Calificación: 0 de 5 estrellas0 calificacionesEditora de gráficos vectoriales: Potenciando la creación visual con algoritmos avanzados Calificación: 0 de 5 estrellas0 calificacionesMatplotlib, Introducción a la Visualización 2D, Parte II Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesMapa de altura: Explorando la representación del terreno a través de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEliminación de líneas ocultas: Revelando lo invisible: secretos de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesGráficos por computadora de radiosidad: Avances en la visualización a través de la radiosidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesNiveles y Curvas con GIMP Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Klara y el Sol Calificación: 5 de 5 estrellas5/5Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesCómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesAprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesResumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesMáquinas predictivas: La sencilla economía de la inteligencia artificial Calificación: 5 de 5 estrellas5/5Dominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Inteligencia Artificial Calificación: 4 de 5 estrellas4/5Máquinas como yo Calificación: 4 de 5 estrellas4/5Sobreviviendo a la IA Calificación: 3 de 5 estrellas3/5Inteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Metodología de la programación Calificación: 0 de 5 estrellas0 calificacionesANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesAdministración básica de bases de datos con ORACLE 12c SQL: Prácticas y ejercicios Calificación: 0 de 5 estrellas0 calificacionesMecatrónica Calificación: 0 de 5 estrellas0 calificacionesPython fácil Calificación: 4 de 5 estrellas4/5UML: Modelado de Software para Profesionales Calificación: 0 de 5 estrellas0 calificacionesPHP: Programación web avanzada para profesionales Calificación: 0 de 5 estrellas0 calificacionesArquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesEscritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5Laravel: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Casos prácticos con aprendizaje profundo Calificación: 4 de 5 estrellas4/5GuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio Calificación: 0 de 5 estrellas0 calificacionesR en profundidad: Programación, gráficos y estadística Calificación: 0 de 5 estrellas0 calificacionesMonetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5
Comentarios para Composición alfa
0 clasificaciones0 comentarios
Vista previa del libro
Composición alfa - Fouad Sabry
Capítulo 1: Composición alfa
La composición alfa o mezcla alfa es el proceso de mezclar una imagen con un fondo para simular la transparencia parcial o completa en los gráficos por ordenador. A menudo es ventajoso renderizar componentes de imagen (píxeles) en varias pasadas o capas y, a continuación, fusionar las imágenes 2D resultantes en una única imagen final conocida como composición. La película hace un uso considerable de la composición cuando se fusionan elementos gráficos renderizados por computadora con imágenes en vivo. La fusión alfa también se utiliza para colocar elementos de primer plano rasterizados sobre un fondo en gráficos por ordenador 2D.
Además del color del elemento, es importante mantener un mate relacionado para cada elemento de la imagen con el fin de integrarlos de manera efectiva. Esta capa mate proporciona la información de cobertura, es decir, la forma de la geometría que se está dibujando, lo que facilita la diferenciación entre las áreas de la imagen en las que se dibujó algo y las áreas en las que no se dibujó nada.
Aunque la operación más fundamental para fusionar dos imágenes es colocar una encima de la otra, se utilizan varios procesos diferentes, o modos de fusión.
A finales de la década de 1970, Alvy Ray Smith y Ed Catmull introdujeron el concepto de un canal alfa en el Laboratorio de Gráficos por Computadora del Instituto de Tecnología de Nueva York. En 1981, Bruce A. Wallace derivó el operador recto idéntico utilizando un modelo de reflectancia/transmitancia física.
El uso del término alfa es explicado por Smith de la siguiente manera: Lo llamamos así debido a la fórmula clásica de interpolación lineal {\displaystyle \alpha A+(1-\alpha )B} que usa la letra griega \alpha (alfa) para controlar la cantidad de interpolación entre, en este caso, dos representaciones A y B
.
Es decir, al superponer la imagen A sobre la imagen B, el valor de \alpha en la fórmula se toma directamente del canal alfa de A.
En una imagen 2D, se mantiene una combinación de colores para cada píxel, a menudo una mezcla de rojo, verde y azul (RGB). Cuando se emplea la composición alfa, el canal alfa de cada píxel contiene un valor numérico adicional que oscila entre 0 y 1. Un valor de 0 indica que el píxel es completamente transparente, lo que permite que el color del píxel inferior sea visible. Uno indica que el píxel es completamente opaco.
Con la presencia de un canal alfa, los procesos de composición de imágenes se pueden expresar utilizando un álgebra de composición. Dadas dos fotos A y B, por ejemplo, el proceso de composición más frecuente es combinar las imágenes para que A aparezca en primer plano y B en segundo plano. Esto podría expresarse como A frente a B. Además de over, Porter y Duff definieron los operadores de composición in, sostenidos por (a menudo abreviado out), atop, y xor (y los operadores inversos rover, rin, rout y ratop) a partir de una consideración de las opciones para mezclar los colores de dos píxeles cuando su cobertura se superpone conceptualmente ortogonalmente:
Por ejemplo, el operador over se puede implementar aplicando la siguiente fórmula a cada píxel:
{\displaystyle \alpha _{o}=\alpha _{a}+\alpha _{b}(1-\alpha _{a})}{\displaystyle C_{o}={\frac {C_{a}\alpha _{a}+C_{b}\alpha _{b}(1-\alpha _{a})}{\alpha _{o}}}}Aquí C_{o} , C_{a} y C_{b} representan los componentes de color de los píxeles en el resultado, la imagen A y la imagen B individualmente, aplicadas individualmente a cada canal de color (rojo, verde, azul), mientras que {\displaystyle \alpha _{o}} , \alpha _{a} y \alpha _{b} son los valores alfa de los píxeles respectivos.
En esencia, el operador sobre es la operación de pintura estándar (consulte el algoritmo de Painter). Los operadores de entrada y salida son el equivalente al recorte en la composición alfa. Los dos utilizan solo el canal alfa e ignoran los componentes de color de la segunda imagen. Además, plus define la mezcla de aditivos.
Si una imagen contiene un canal alfa, hay dos representaciones comunes disponibles: Alfa puede ser recta (no asociada) o premultiplicada (asociada).
Los componentes RGB representan el color del objeto o píxel independientemente de su opacidad cuando se utiliza alfa directo. Este es el procedimiento implícito en el operador over de la sección anterior.
Con alfa premultiplicado, los componentes RGB indican la emisión del objeto o píxel, mientras que el componente alfa denota oclusión. A continuación, el operador over se convierte en:
{\displaystyle C_{o}=C_{a}+C_{b}(1-\alpha _{a})}{\displaystyle \alpha _{o}=\alpha _{a}+\alpha _{b}(1-\alpha _{a})}El mayor beneficio del alfa premultiplicado es que permite una mezcla, interpolación y filtrado precisos.
Suponiendo que el color del píxel se indica mediante tuplas RGBA rectas (no premultiplicadas), un píxel con el valor (0, 0,7, 0, 0,5) tiene el 70 por ciento de la intensidad verde máxima y el 50 por ciento de opacidad. Si el tono fuera completamente verde, su RGBA sería (0, 1, 0, 0.5).
PNG y TIFF son los formatos de imagen más comunes que admiten el canal alfa. GIF admite canales alfa, pero es ineficiente con respecto al espacio de archivos. Algunos códecs de vídeo, como Animation y Apple ProRes 4444 del formato QuickTime, o el códec multiformato Techsmith, incluyen canales alfa.
En general, el formato de archivo BMP no es compatible con este canal; Sin embargo, es posible almacenar el canal alfa en otros formatos, como 32 bits (888-8) o 16 bits (444-4), aunque no todos los ordenadores o programas pueden leerlo: También se han desarrollado programas particulares para la generación de estos BMP, que se utilizan principalmente en videojuegos.
Los valores RGB de las fotografías digitales típicas se comprimen mediante un mecanismo de corrección gamma en lugar de reflejar directamente las intensidades de luz física:
{\displaystyle C_{\text{encoded}}=C_{\text{linear}}^{1/\gamma }}Esta transformación utiliza mejor el número limitado de bits en la imagen codificada eligiendo \gamma que coincida mejor con la percepción humana no lineal de la luminancia.
En consecuencia, los programas informáticos que manipulan dichas imágenes deben decodificar los valores RGB en un espacio lineal (eliminando la compresión gamma), mezclar las intensidades de luz lineal y luego volver a aplicar la compresión gamma a la imagen resultante:
{\displaystyle C_{o}=\left({\frac {C_{a}^{\gamma }\alpha _{a}+C_{b}^{\gamma }\alpha _{b}(1-\alpha _{a})}{\alpha _{o}}}\right)^{1/\gamma }}Antes de la compresión gamma, la premultiplicación se realiza en el espacio lineal cuando se combina con alfa premultiplicado. Esto da como resultado la fórmula que se muestra a continuación:
{\displaystyle C_{o}=\left(C_{a}^{\gamma }+C_{b}^{\gamma }(1-\alpha _{a})\right)^{1/\gamma }}Tenga en cuenta que la corrección gamma solo se aplica a los canales de color; El canal alfa es siempre lineal.
Aunque se emplean por razones similares, los colores transparentes y las máscaras de imagen evitan la mezcla perfecta de píxeles de imagen superpuestos con píxeles de fondo (solo se permiten píxeles de imagen completos o píxeles de fondo completos).
Se puede obtener un efecto similar con un canal alfa de 1 bit, como se encuentra en el modo de alto color RGBA de 16 bits del formato de archivo de imagen Truevision TGA y el modo gráfico de alto color de los adaptadores de pantalla TARGA y AT-Vista/NU-Vista correspondientes. Este modo asigna 5 bits a cada uno de los tres colores RGB primarios (RGB de 15 bits) más un bit para el canal alfa
.
Cuando solo está disponible alfa de 1 bit, la transparencia de la puerta mosquitera puede imitar la oclusión parcial.
Un solo canal alfa es insuficiente para algunas aplicaciones; una vidriera, por ejemplo, requiere un canal de transparencia distinto para cada canal RGB para simular la transparencia roja, verde y azul de forma independiente. Para aplicaciones precisas de filtración de color de espectro, se pueden agregar canales alfa adicionales.
Algunos métodos de transparencia independientes del orden sustituyen el operador sobre por una aproximación que es conmutativa.
{Fin del capítulo 1}
Capítulo 2: Composición digital
La composición digital es la técnica de integrar digitalmente numerosas imágenes para crear una imagen terminada, a menudo para impresión, película o proyección en una pantalla. Este proceso es el equivalente digital de la composición de películas ópticas.
La fusión alfa es el procedimiento básico utilizado en la composición digital, si un valor de opacidad, 'α', controla la relación entre dos valores de píxel de entrada que dan como resultado un único píxel de salida.
Como ilustración simple, supongamos que se proporcionan dos fotos de tamaño idéntico para la composición. Las imágenes de entrada se conocen como imagen de primer plano e imagen de fondo, respectivamente. Cada imagen contiene la misma cantidad de píxeles. La imagen compuesta es el resultado de fusionar matemáticamente la información de los píxeles coincidentes de las dos imágenes de entrada y capturar el resultado como una tercera imagen.
Piensa en tres píxeles; f representa un píxel en primer plano.
Un píxel de fondo, B un píxel de primer plano
c es un píxel compuesto.
y
α, el valor de la opacidad del píxel de primer plano.
(α = 1 para un primer plano opaco, α = 0 para un primer plano completamente transparente).
Un mate es una imagen rasterizada monocromática en la que los valores de píxel deben interpretarse como valores alfa.
Entonces, teniendo en cuenta los tres canales de color, y asumiendo que los canales de color se expresan en un espacio de color γ=1 (es decir, las cantidades observadas son proporcionales a la cantidad de luz), tenemos:
cr =