Descubre millones de libros electrónicos, audiolibros y mucho más con una prueba gratuita

Solo $11.99/mes después de la prueba. Puedes cancelar en cualquier momento.

Vacilar: Dither: ruido visual en la visión por computadora
Vacilar: Dither: ruido visual en la visión por computadora
Vacilar: Dither: ruido visual en la visión por computadora
Libro electrónico146 páginas1 hora

Vacilar: Dither: ruido visual en la visión por computadora

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

Qué es el tramado


El tramado es una forma de ruido aplicada intencionalmente que se utiliza para aleatorizar el error de cuantificación, evitando patrones a gran escala, como bandas de color en las imágenes. El tramado se utiliza habitualmente en el procesamiento de datos de audio y vídeo digitales y, a menudo, es una de las últimas etapas de la masterización de audio en un CD.


Cómo se beneficiará


(I) Insights y validaciones sobre los siguientes temas:


Capítulo 1: Tramado


Capítulo 2: Convertidor analógico a digital


Capítulo 3: Rango dinámico


Capítulo 4: Relación señal-ruido


Capítulo 5: Medios tonos


Capítulo 6: Comparación de grabación analógica y digital


Capítulo 7: Artefacto de compresión


Capítulo 8: Muestreo (procesamiento de señal)


Capítulo 9: Cuantización (procesamiento de señal)


Capítulo 10: Escala de grises


(II) Respondiendo a las principales preguntas del público sobre el tramado.


(III) Ejemplos del mundo real sobre el uso del tramado en muchos campos.


Para quién es este libro


Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básicos para cualquier tipo de Dither.


 


 

IdiomaEspañol
Fecha de lanzamiento5 may 2024
Vacilar: Dither: ruido visual en la visión por computadora

Lee más de Fouad Sabry

Relacionado con Vacilar

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Ver más

Artículos relacionados

Comentarios para Vacilar

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Vacilar - Fouad Sabry

    Capítulo 1: Tramado

    El tramado es un tipo de ruido deliberado que se utiliza para aleatorizar el error de cuantificación, evitando así patrones a gran escala, como las bandas de color en las fotografías. El tramado se emplea comúnmente en el procesamiento de datos digitales de audio y video, y con frecuencia es uno de los pasos finales en la masterización de audio para un CD.

    Normalmente, el tramado se utiliza para transformar una imagen en escala de grises a blanco y negro, de modo que la densidad de puntos negros en la imagen resultante se aproxime al nivel de gris medio de la imagen original.

    … Una de las primeras [aplicaciones] de tramado se produjo en la Segunda Guerra Mundial.

    Los bombarderos utilizaban computadoras mecánicas para la navegación y el cálculo de la trayectoria de las bombas.

    Curiosamente, estas computadoras (cajas que contienen cientos de engranajes y engranajes) funcionaban con mayor precisión a bordo del avión y estaban menos sólidamente establecidas.

    Los ingenieros notaron que la vibración de la aeronave minimizaba el error causado por las partes móviles pegajosas.

    En lugar de moverse en tirones rápidos, debes moverte suavemente, se movieron con mayor consistencia.

    Se incluyeron motores vibratorios en miniatura en las computadoras, el término dither se derivó del verbo del inglés medio didderen, que significa sacudir. Hoy en día, cuando se toca un medidor mecánico para mejorar su precisión, los diccionarios modernos definen el tramado como un estado mental profundamente ansioso, confuso o agitado.

    En cantidades minúsculas, Dither hace que un sistema digital sea más analógico en el sentido positivo de la palabra.

    Ken Pohlmann, Principios del audio digital

    Poco después de la Segunda Guerra Mundial, el término tramado se publicó en la literatura sobre computación analógica y armamento de accionamiento hidráulico.

    El tramado se aplica en numerosos campos que incluyen el procesamiento y el análisis digital. Estas aplicaciones incluyen audio digital, video digital, fotografía digital, sismología, radar y sistemas de pronóstico meteorológico que requieren procesamiento de señal digital.

    La cuantificación produce error. Si esta inexactitud está asociada con la señal, entonces el resultado puede ser cíclico o predecible. En algunos dominios, particularmente aquellos en los que el receptor es sensible a tales distorsiones, los errores cíclicos dan lugar a artefactos no deseados. La introducción de tramado en estas áreas transforma el error en ruido aleatorio. La industria del audio es un buen ejemplo de ello. El oído humano actúa de manera similar a una transformada de Fourier en el sentido de que detecta distintas frecuencias.

    En un sistema analógico, la señal es continua, mientras que en un sistema digital PCM, la amplitud de la señal está confinada a uno de un conjunto fijo de valores o números. Este método se conoce como cuantización. Cada valor codificado es un paso discreto; Si una señal se cuantifica sin tramado, habrá distorsión de cuantificación asociada con la señal de entrada original... Para evitar esto, la señal es difuminada, un procedimiento que matemáticamente elimina los armónicos y otras distorsiones altamente indeseables y los reemplaza con un nivel constante y fijo de ruido.

    Durante el proceso de producción, a menudo se utiliza un mayor número de bits para representar cada muestra; Esto debe reducirse a 16 bits para crear un disco compacto.

    Hay numerosas formas de lograr esto. Uno puede, por ejemplo, descartar los bits adicionales; Esto se conoce como truncamiento. Además, se pueden redondear los bits sobrantes al valor más cercano. Cada una de estas estrategias, sin embargo, produce fallas que son predecibles y calculables. El tramado sustituye estas imprecisiones por un nivel de ruido continuo y fijo.

    Ejemplos de ejemplo de audio de truncamiento de 6 bits

    Sinusoide de 16 bits


    reducido a seis bits


    reducido a 6 bits


    ¿Tiene problemas para reproducir estos archivos? Consulte el soporte multimedia.

    Tomemos, por ejemplo, una forma de onda con los siguientes valores:

    1 2 3 4 5 6 7 8

    Si la forma de onda se reduce en un 20%, se obtienen los siguientes valores:

    0.8 1.6 2.4 3.2 4.0 4.8 5.6 6.4

    Si se acortan estos valores, los datos resultantes son los siguientes:

    0 1 2 3 4 4 5 6

    Si, en cambio, estos valores se redondean, se obtienen los siguientes datos:

    1 2 2 3 4 5 6 6

    La técnica de disminuir la amplitud de cualquier forma de onda original en un 20 por ciento da como resultado errores consistentes. Considere una onda sinusoidal que, para una porción, cumple con los parámetros antes mencionados. Como se muestra en el ejemplo anterior, cada vez que el valor de la onda sinusoidal alcanza 3,2, el resultado acortado sería incorrecto en 0,2. Siempre que el valor de la onda sinusoidal alcanzara 4,0, no habría ningún error porque el resultado acortado estaría desviado en 0,0, como se ilustró anteriormente. A lo largo del ciclo de la onda sinusoidal, la magnitud del error varía regular y repetidamente. Este error se revela específicamente como distorsión. Lo que el oído percibe como distorsión es la información adicional a frecuencias discretas que resulta de un error de cuantificación recurrente.

    Un posible enfoque sería redondear el número de dos dígitos (por ejemplo, 4,8) en cualquier dirección. Podría redondearse a cinco una vez y luego a cuatro la siguiente. Esto haría que el promedio a largo plazo fuera de 4,5 en lugar de 4, lo que acercaría el valor a su valor real a lo largo del tiempo. Sin embargo, esto todavía da como resultado un error determinable (aunque más intrincado). Cada dos veces que se encuentra el valor 4,8, el resultado es un error del 0,2 por ciento, y las otras veces, el error es 0,8. Esto sigue dando lugar a un error cuantificado y repetido.

    Una opción alternativa sería redondear 4,8 para que cuatro de cada cinco veces se redondee a 5, y la quinta vez se redondee a 4. A largo plazo, esto promediaría exactamente 4,8. Desafortunadamente, todavía resulta en fallas recurrentes y predecibles, y estas fallas continúan mostrándose como distorsión audible.

    Esto da como resultado la solución de tramado. En lugar de redondear hacia arriba o hacia abajo de una manera predecible y repetitiva, es posible redondear hacia arriba o hacia abajo al azar. Si se crea una serie de números aleatorios entre 0,0 y 0,9 (por ejemplo, 0,6, 0,1, 0,3, 0,6, 0,9, etc.) y se suman a 4,8, dos de cada diez veces el resultado se truncará a 4 (si se suman 0,0 o 0,1 a 4,8), y ocho de cada diez veces el resultado se truncará a 5. Cada condición tiene un 20% de probabilidad de ser redondeada a 4 y un 80% de probabilidad de ser redondeada a 5. El promedio a largo plazo de estos resultados es de 4,8, y su error de cuantificación es ruido aleatorio. Este ruido es menos desagradable para el oído que la distorsión medible producida por otras soluciones.

    Antes de la cuantificación o recuantificación, se introduce el tramado para desacoplar el ruido de cuantificación de la señal de entrada y evitar el comportamiento no lineal (distorsión). La cuantificación con una profundidad de bits más baja requiere más tramado. La técnica sigue dando lugar a una distorsión, pero la distorsión es aleatoria, por lo que el ruido resultante está esencialmente descorrelacionado con la señal deseada.

    Lipshitz y Vanderkooi demostraron en un estudio seminal publicado en el AES Journal que diferentes tipos de ruido con distintas funciones de densidad de probabilidad (PDF) reaccionan de manera diferente cuando se emplean como señales de tramado, Dither se puede utilizar para romper ciclos límite periódicos, un problema típico con los filtros digitales. Por lo general, el ruido aleatorio es menos molesto que los tonos armónicos producidos por los ciclos límite.

    Función de densidad de probabilidad rectangular (RPDF) Cualquier valor dentro del rango definido tiene la misma probabilidad de ocurrir dentro del ruido de tramado.

    Función de densidad de probabilidad triangular (TPDF) El ruido de tramado tiene una distribución triangular; La probabilidad de ocurrencia es mayor para los valores en el medio del rango. Es posible obtener una distribución triangular combinando dos fuentes RPDF separadas.

    La distribución gaussiana de PDF tiene una distribución normal. Esta curva en forma de campana o gaussiana es característica del tramado generado por fuentes analógicas como los preamplificadores de micrófono. Si la profundidad de bits de una grabación es suficiente, el ruido del preamplificador será adecuado para tramar la grabación.

    El modelado de ruido es un procedimiento de filtrado que modifica la energía espectral del error de cuantificación, a menudo para restar importancia a las frecuencias a las que el oído es más sensible o para separar completamente las bandas de señal y ruido. El hecho de que el tramado se inserte dentro o fuera del bucle de retroalimentación del modelador de ruido afecta a su espectro final si se utiliza. Si está dentro, el tramado se considera como parte de la señal de error y se forma junto con el error de cuantificación real. Si está fuera de la ventana de cuantificación, el tramado se trata como parte de la señal original y linealiza la cuantificación sin tener forma en sí misma. En este caso, el ruido de fondo final es igual a la suma del espectro de tramado plano y el ruido de cuantificación curvo. Si bien la conformación del ruido en el mundo real

    ¿Disfrutas la vista previa?
    Página 1 de 1