Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Composición alfa: Dominar el arte de la composición de imágenes en visión por computadora
Composición alfa: Dominar el arte de la composición de imágenes en visión por computadora
Composición alfa: Dominar el arte de la composición de imágenes en visión por computadora
Libro electrónico136 páginas1 hora

Composición alfa: Dominar el arte de la composición de imágenes en visión por computadora

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

Qué es la composición alfa


En gráficos por computadora, la composición alfa o combinación alfa es el proceso de combinar una imagen con un fondo para crear la apariencia de transparencia parcial o total. A menudo resulta útil renderizar elementos de imagen (píxeles) en pasadas o capas separadas y luego combinar las imágenes 2D resultantes en una única imagen final llamada compuesta. La composición se utiliza ampliamente en el cine cuando se combinan elementos de imagen renderizados por computadora con imágenes en vivo. La combinación alfa también se utiliza en gráficos por computadora 2D para colocar elementos rasterizados de primer plano sobre un fondo.


Cómo se beneficiará


(I) Información y validaciones sobre los siguientes temas:


Capítulo 1: Composición alfa


Capítulo 2: Composición digital


Capítulo 3: PNG


Capítulo 4: Modelo de color RGB


Capítulo 5: Corrección de gamma


Capítulo 6: Submuestreo de croma


Capítulo 7: Formato de archivo BMP


Capítulo 8: Modelo de color RGBA


Capítulo 9: Escala de grises


Capítulo 10: Transparencia (gráfico)


(II) Respondiendo a las principales preguntas del público sobre la composición alfa.


(III) Ejemplos del mundo real para el uso de la composición alfa en muchos campos.


Para quién es este libro


Profesionales, estudiantes universitarios y estudiantes de posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de Composición Alfa.


 


 

IdiomaEspañol
Fecha de lanzamiento5 may 2024
Composición alfa: Dominar el arte de la composición de imágenes en visión por computadora

Relacionado con Composición alfa

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Composición alfa

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Composición alfa - Fouad Sabry

    Capítulo 1: Composición alfa

    La composición alfa o mezcla alfa es el proceso de mezclar una imagen con un fondo para simular la transparencia parcial o completa en los gráficos por ordenador. A menudo es ventajoso renderizar componentes de imagen (píxeles) en varias pasadas o capas y, a continuación, fusionar las imágenes 2D resultantes en una única imagen final conocida como composición. La película hace un uso considerable de la composición cuando se fusionan elementos gráficos renderizados por computadora con imágenes en vivo. La fusión alfa también se utiliza para colocar elementos de primer plano rasterizados sobre un fondo en gráficos por ordenador 2D.

    Además del color del elemento, es importante mantener un mate relacionado para cada elemento de la imagen con el fin de integrarlos de manera efectiva. Esta capa mate proporciona la información de cobertura, es decir, la forma de la geometría que se está dibujando, lo que facilita la diferenciación entre las áreas de la imagen en las que se dibujó algo y las áreas en las que no se dibujó nada.

    Aunque la operación más fundamental para fusionar dos imágenes es colocar una encima de la otra, se utilizan varios procesos diferentes, o modos de fusión.

    A finales de la década de 1970, Alvy Ray Smith y Ed Catmull introdujeron el concepto de un canal alfa en el Laboratorio de Gráficos por Computadora del Instituto de Tecnología de Nueva York. En 1981, Bruce A. Wallace derivó el operador recto idéntico utilizando un modelo de reflectancia/transmitancia física.

    El uso del término alfa es explicado por Smith de la siguiente manera: Lo llamamos así debido a la fórmula clásica de interpolación lineal {\displaystyle \alpha A+(1-\alpha )B} que usa la letra griega \alpha (alfa) para controlar la cantidad de interpolación entre, en este caso, dos representaciones A y B.

    Es decir, al superponer la imagen A sobre la imagen B, el valor de \alpha en la fórmula se toma directamente del canal alfa de A.

    En una imagen 2D, se mantiene una combinación de colores para cada píxel, a menudo una mezcla de rojo, verde y azul (RGB). Cuando se emplea la composición alfa, el canal alfa de cada píxel contiene un valor numérico adicional que oscila entre 0 y 1. Un valor de 0 indica que el píxel es completamente transparente, lo que permite que el color del píxel inferior sea visible. Uno indica que el píxel es completamente opaco.

    Con la presencia de un canal alfa, los procesos de composición de imágenes se pueden expresar utilizando un álgebra de composición. Dadas dos fotos A y B, por ejemplo, el proceso de composición más frecuente es combinar las imágenes para que A aparezca en primer plano y B en segundo plano. Esto podría expresarse como A frente a B. Además de over, Porter y Duff definieron los operadores de composición in, sostenidos por (a menudo abreviado out), atop, y xor (y los operadores inversos rover, rin, rout y ratop) a partir de una consideración de las opciones para mezclar los colores de dos píxeles cuando su cobertura se superpone conceptualmente ortogonalmente:

    Por ejemplo, el operador over se puede implementar aplicando la siguiente fórmula a cada píxel:

    {\displaystyle \alpha _{o}=\alpha _{a}+\alpha _{b}(1-\alpha _{a})}{\displaystyle C_{o}={\frac {C_{a}\alpha _{a}+C_{b}\alpha _{b}(1-\alpha _{a})}{\alpha _{o}}}}

    Aquí C_{o} , C_{a} y C_{b} representan los componentes de color de los píxeles en el resultado, la imagen A y la imagen B individualmente, aplicadas individualmente a cada canal de color (rojo, verde, azul), mientras que {\displaystyle \alpha _{o}} , \alpha _{a} y \alpha _{b} son los valores alfa de los píxeles respectivos.

    En esencia, el operador sobre es la operación de pintura estándar (consulte el algoritmo de Painter). Los operadores de entrada y salida son el equivalente al recorte en la composición alfa. Los dos utilizan solo el canal alfa e ignoran los componentes de color de la segunda imagen. Además, plus define la mezcla de aditivos.

    Si una imagen contiene un canal alfa, hay dos representaciones comunes disponibles: Alfa puede ser recta (no asociada) o premultiplicada (asociada).

    Los componentes RGB representan el color del objeto o píxel independientemente de su opacidad cuando se utiliza alfa directo. Este es el procedimiento implícito en el operador over de la sección anterior.

    Con alfa premultiplicado, los componentes RGB indican la emisión del objeto o píxel, mientras que el componente alfa denota oclusión. A continuación, el operador over se convierte en:

    {\displaystyle C_{o}=C_{a}+C_{b}(1-\alpha _{a})}{\displaystyle \alpha _{o}=\alpha _{a}+\alpha _{b}(1-\alpha _{a})}

    El mayor beneficio del alfa premultiplicado es que permite una mezcla, interpolación y filtrado precisos.

    Suponiendo que el color del píxel se indica mediante tuplas RGBA rectas (no premultiplicadas), un píxel con el valor (0, 0,7, 0, 0,5) tiene el 70 por ciento de la intensidad verde máxima y el 50 por ciento de opacidad. Si el tono fuera completamente verde, su RGBA sería (0, 1, 0, 0.5).

    PNG y TIFF son los formatos de imagen más comunes que admiten el canal alfa. GIF admite canales alfa, pero es ineficiente con respecto al espacio de archivos. Algunos códecs de vídeo, como Animation y Apple ProRes 4444 del formato QuickTime, o el códec multiformato Techsmith, incluyen canales alfa.

    En general, el formato de archivo BMP no es compatible con este canal; Sin embargo, es posible almacenar el canal alfa en otros formatos, como 32 bits (888-8) o 16 bits (444-4), aunque no todos los ordenadores o programas pueden leerlo: También se han desarrollado programas particulares para la generación de estos BMP, que se utilizan principalmente en videojuegos.

    Los valores RGB de las fotografías digitales típicas se comprimen mediante un mecanismo de corrección gamma en lugar de reflejar directamente las intensidades de luz física:

    {\displaystyle C_{\text{encoded}}=C_{\text{linear}}^{1/\gamma }}

    Esta transformación utiliza mejor el número limitado de bits en la imagen codificada eligiendo \gamma que coincida mejor con la percepción humana no lineal de la luminancia.

    En consecuencia, los programas informáticos que manipulan dichas imágenes deben decodificar los valores RGB en un espacio lineal (eliminando la compresión gamma), mezclar las intensidades de luz lineal y luego volver a aplicar la compresión gamma a la imagen resultante:

    {\displaystyle C_{o}=\left({\frac {C_{a}^{\gamma }\alpha _{a}+C_{b}^{\gamma }\alpha _{b}(1-\alpha _{a})}{\alpha _{o}}}\right)^{1/\gamma }}

    Antes de la compresión gamma, la premultiplicación se realiza en el espacio lineal cuando se combina con alfa premultiplicado. Esto da como resultado la fórmula que se muestra a continuación:

    {\displaystyle C_{o}=\left(C_{a}^{\gamma }+C_{b}^{\gamma }(1-\alpha _{a})\right)^{1/\gamma }}

    Tenga en cuenta que la corrección gamma solo se aplica a los canales de color; El canal alfa es siempre lineal.

    Aunque se emplean por razones similares, los colores transparentes y las máscaras de imagen evitan la mezcla perfecta de píxeles de imagen superpuestos con píxeles de fondo (solo se permiten píxeles de imagen completos o píxeles de fondo completos).

    Se puede obtener un efecto similar con un canal alfa de 1 bit, como se encuentra en el modo de alto color RGBA de 16 bits del formato de archivo de imagen Truevision TGA y el modo gráfico de alto color de los adaptadores de pantalla TARGA y AT-Vista/NU-Vista correspondientes. Este modo asigna 5 bits a cada uno de los tres colores RGB primarios (RGB de 15 bits) más un bit para el canal alfa.

    Cuando solo está disponible alfa de 1 bit, la transparencia de la puerta mosquitera puede imitar la oclusión parcial.

    Un solo canal alfa es insuficiente para algunas aplicaciones; una vidriera, por ejemplo, requiere un canal de transparencia distinto para cada canal RGB para simular la transparencia roja, verde y azul de forma independiente. Para aplicaciones precisas de filtración de color de espectro, se pueden agregar canales alfa adicionales.

    Algunos métodos de transparencia independientes del orden sustituyen el operador sobre por una aproximación que es conmutativa.

    {Fin del capítulo 1}

    Capítulo 2: Composición digital

    La composición digital es la técnica de integrar digitalmente numerosas imágenes para crear una imagen terminada, a menudo para impresión, película o proyección en una pantalla. Este proceso es el equivalente digital de la composición de películas ópticas.

    La fusión alfa es el procedimiento básico utilizado en la composición digital, si un valor de opacidad, 'α', controla la relación entre dos valores de píxel de entrada que dan como resultado un único píxel de salida.

    Como ilustración simple, supongamos que se proporcionan dos fotos de tamaño idéntico para la composición. Las imágenes de entrada se conocen como imagen de primer plano e imagen de fondo, respectivamente. Cada imagen contiene la misma cantidad de píxeles. La imagen compuesta es el resultado de fusionar matemáticamente la información de los píxeles coincidentes de las dos imágenes de entrada y capturar el resultado como una tercera imagen.

    Piensa en tres píxeles; f representa un píxel en primer plano.

    Un píxel de fondo, B un píxel de primer plano

    c es un píxel compuesto.

    y

    α, el valor de la opacidad del píxel de primer plano.

    (α = 1 para un primer plano opaco, α = 0 para un primer plano completamente transparente).

    Un mate es una imagen rasterizada monocromática en la que los valores de píxel deben interpretarse como valores alfa.

    Entonces, teniendo en cuenta los tres canales de color, y asumiendo que los canales de color se expresan en un espacio de color γ=1 (es decir, las cantidades observadas son proporcionales a la cantidad de luz), tenemos:

    cr =

    ¿Disfrutas la vista previa?
    Página 1 de 1