Modelo del sistema visual humano: Comprender la percepción y el procesamiento
Por Fouad Sabry
()
Información de este libro electrónico
¿Qué es el modelo del sistema visual humano?
Los expertos en procesamiento de imágenes, procesamiento de vídeo y visión por computadora utilizan un modelo del sistema visual humano para abordar problemas biológicos y psicológicos. procesos que aún no se comprenden completamente. Se utiliza un ejemplo de tal modelo para simplificar los comportamientos de un sistema que es extremadamente complejo. Cada vez que hay una mejora en nuestra comprensión del sistema visual real, el modelo se actualiza.
Cómo se beneficiará
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Modelo del sistema visual humano
Capítulo 2: Compresión de datos
Capítulo 3: Compresión de imágenes
Capítulo 4: Codificación de transformación
Capítulo 5: Ilusión óptica
Capítulo 6: Submuestreo de croma
Capítulo 7: Artefacto de compresión
Capítulo 8: Escala de grises
Capítulo 9: Mapeo de tonos
Capítulo 10: Modelo de apariencia de color
(II) Respondiendo a las principales preguntas del público sobre el modelo del sistema visual humano.
(III) Ejemplos del mundo real para el uso del modelo del sistema visual humano en muchos campos.
Para quién es este libro
Profesionales, estudiantes de pregrado y posgrado, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de Modelo de Sistema Visual Humano.
Lee más de Fouad Sabry
Tecnologías Emergentes En Robótica [Spanish]
Relacionado con Modelo del sistema visual humano
Títulos en esta serie (100)
Retinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHistograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesDetector de esquinas Harris: Revelando la magia de la detección de características de imagen Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesAjuste del paquete: Optimización de datos visuales para una reconstrucción precisa Calificación: 0 de 5 estrellas0 calificacionesCorrelación cruzada: Desbloqueo de patrones en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Compresión de datos: Liberando la eficiencia en visión por computadora con compresión de datos Calificación: 0 de 5 estrellas0 calificacionesReconocimiento óptico de Braille: Potenciando la accesibilidad a través de la inteligencia visual Calificación: 0 de 5 estrellas0 calificacionesCompresión de imagen: Técnicas eficientes para la optimización de datos visuales Calificación: 0 de 5 estrellas0 calificacionesFundamentos de Programación y Bases de Datos Calificación: 0 de 5 estrellas0 calificacionesFundamentos de Programación y Bases de Datos: 2ª Edición Calificación: 0 de 5 estrellas0 calificacionesEl Video Marketing Online. Potencia la Imagen de Empresa o Marca Calificación: 0 de 5 estrellas0 calificacionesRed de sensores visuales: Explorando el poder de las redes de sensores visuales en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesRepresentación de volumen: Explorando el realismo visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesAnálisis de datos con Power Bi, R-Rstudio y Knime Calificación: 0 de 5 estrellas0 calificacionesDetección de objetos: Avances, aplicaciones y algoritmos Calificación: 0 de 5 estrellas0 calificacionesAnotación automática de imágenes: Mejorar la comprensión visual mediante el etiquetado automatizado Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesEstructuras de datos y algoritmos fundamentales Calificación: 0 de 5 estrellas0 calificacionesClasificación de imágenes contextuales: Comprensión de los datos visuales para una clasificación eficaz Calificación: 0 de 5 estrellas0 calificacionesRecuperación de imágenes: Liberando el poder de los datos visuales Calificación: 0 de 5 estrellas0 calificacionesUF2175 - Diseño de bases de datos relacionales Calificación: 0 de 5 estrellas0 calificacionesGráficos rasterizados: Comprender los fundamentos de los gráficos rasterizados en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCortes de gráficos de visión por computadora: Explorando cortes de gráficos en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPalabra Visual: Liberando el poder de la comprensión de imágenes Calificación: 0 de 5 estrellas0 calificacionesIngeniería y Arquitectura del Software Calificación: 0 de 5 estrellas0 calificacionesTratamiento digital de imágenes fotográficas. ARPG0110 Calificación: 0 de 5 estrellas0 calificacionesVisión de máquina: Información sobre el mundo de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCámara inteligente: Revolucionando la percepción visual con la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSistema de gestión de color: Optimización de la percepción visual en entornos digitales Calificación: 0 de 5 estrellas0 calificacionesSimulación de sistemas productivos con Arena Calificación: 5 de 5 estrellas5/5Preparación de archivos para la impresión digital. ARGI0209 Calificación: 0 de 5 estrellas0 calificacionesTratamiento de textos para la maquetación. ARGP0110 Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesEl poder de las imagenes, la palabra no tiene poder Calificación: 0 de 5 estrellas0 calificacionesChat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Mecatrónica Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesCómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificacionesMetodología de la Programación Orientada a Objetos Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: con aplicaciones a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Resumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesANDROID: Aprende desde cero a crear aplicaciones Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5Desarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesProgramación de Inteligencia Artificial. Curso Práctico Calificación: 0 de 5 estrellas0 calificacionesEl imperio de los algoritmos: IA inclusiva, ética y al servicio de la humanidad Calificación: 0 de 5 estrellas0 calificacionesEscritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5Cómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Klara y el Sol Calificación: 5 de 5 estrellas5/5Monetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesBig data: La revolución de los datos masivos Calificación: 4 de 5 estrellas4/5Oracle 12c PL/SQL: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesLaravel: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5UML: Modelado de Software para Profesionales Calificación: 0 de 5 estrellas0 calificaciones
Comentarios para Modelo del sistema visual humano
0 clasificaciones0 comentarios
Vista previa del libro
Modelo del sistema visual humano - Fouad Sabry
Capítulo 1: Modelo del sistema visual humano
Los expertos en los campos del procesamiento de imágenes, el procesamiento de video y la visión por computadora emplean un modelo del sistema visual humano (modelo HVS) para dar cuenta de los procesos biológicos y psicológicos que aún no se comprenden bien. Un modelo de este tipo se emplea para reducir la complejidad del comportamiento del sistema. El modelo se revisa a medida que crece nuestra comprensión del sistema visual real.
El análisis de la percepción visual se conoce como investigación psicovisual
..
Es posible manipular la percepción y la visión utilizando un modelo del sistema visual humano. La televisión en color, la compresión con pérdida y la televisión de tubo de rayos catódicos (CRT) son aplicaciones del paradigma HVS.
Alguna vez se creyó que los requisitos de ancho de banda de la televisión en color eran demasiado grandes para la tecnología existente. Se descubrió que la resolución de color del HVS era mucho más baja que su resolución de brillo, lo que significaba que el submuestreo de croma podría usarse para exprimir más color en la señal.
Los formatos de compresión de imágenes con pérdidas, como JPEG, son otro ejemplo. De acuerdo con nuestro modelo HVS, no podemos distinguir detalles de alta frecuencia; como resultado, JPEG nos permite cuantificar estas piezas sin una caída notable en la calidad. El filtrado de parada de banda se utiliza en la compresión de audio para eliminar las frecuencias que los humanos no pueden escuchar.
Durante nuestro pasado evolutivo, cuando los humanos teníamos que protegernos o buscar alimento, adaptamos varios aspectos del HVS. Las propiedades HVS se muestran con frecuencia en ilusiones ópticas.
Debido a la escasez de varillas, el ojo humano funciona como un filtro de paso bajo. para ver las bandas de Mach
Resolución de color inaceptable (menos conos en el ojo humano que bastones)
Sensibilidad al movimiento
Mayor sensibilidad al entorno
Ver un animal camuflado tiene un efecto mucho más profundo que simplemente sentir su textura.
Se puede poner más énfasis en la textura que en la disparidad en 3D.
Reconocimiento facial incorporado (los bebés sonríen a las caras)
Una profundidad de cara invertida de apariencia normal (los rasgos faciales anulan la información de profundidad)
Incluso con la boca y los ojos al revés, la cara invertida parece normal.
El cine y la televisión utilizan el parpadeo a altas frecuencias para engañar al espectador y hacer que perciba una imagen continua explotando la persistencia de la visión.
Con el fin de crear la ilusión de una frecuencia de parpadeo más alta, los televisores entrelazados pintan medias imágenes.
Difusión de color (crominancia a la mitad de la resolución de la luminancia correspondiente a las proporciones de bastones y conos en el ojo)
Comprimir una imagen (difícil de ver, las frecuencias más altas se cuantifican con mayor dureza)
Estimación del movimiento (usar luminancia e ignorar color)
Marca de agua y esteganografía
{Fin del capítulo 1}
Capítulo 2: Compresión de datos
En la teoría de la información, la compresión de datos, la codificación de fuentes y otros campos relacionados: En el lenguaje común, un dispositivo que participa en el proceso de compresión de datos se conoce como codificador, mientras que un dispositivo que se involucra en el proceso inverso, es decir, la descompresión, se conoce como decodificador.
La compresión de datos es el proceso de reducir el tamaño de un archivo de datos y es un término que se usa con bastante frecuencia. La codificación de origen es un proceso de codificación que tiene lugar en el origen de datos original, antes de que los datos se almacenen o transfieran. Este proceso se conoce en el contexto de la transmisión de datos. Es importante no confundir la codificación de origen con otros tipos de codificación, como la codificación de canal, que se utiliza para la detección y corrección de errores, o la codificación de línea, que es un método para asignar datos a una señal.
La compresión de datos es beneficiosa, ya que reduce la cantidad de espacio y ancho de banda necesarios para almacenar y transferir información. Los procedimientos de compresión y descompresión necesitan una cantidad significativa de recursos computacionales. El equilibrio entre la complejidad del espacio-tiempo es algo que debe tenerse en cuenta al comprimir los datos. Por ejemplo, un método de compresión de vídeo puede requerir hardware costoso para que el vídeo se descomprima lo suficientemente rápido como para verlo mientras se descomprime. Además, la opción de descomprimir completamente el video antes de verlo puede ser un inconveniente o requerir espacio de almacenamiento adicional. Al diseñar esquemas de compresión de datos, los diseñadores deben hacer concesiones entre una serie de factores diferentes. Estos factores incluyen el nivel de compresión alcanzado, la cantidad de distorsión que se introduce (cuando se utiliza la compresión de datos con pérdida) y la cantidad de recursos computacionales que se necesitan para comprimir y descomprimir los datos.
Para representar los datos sin perder ninguna información en el proceso, los métodos de compresión de datos sin pérdidas suelen hacer uso de la redundancia estadística. Esto asegura que el proceso pueda revertirse. Debido a que la gran mayoría de los datos en el mundo real tienen redundancia estadística, la compresión sin pérdidas es factible. Por ejemplo, una imagen puede incluir parches de color que no cambian en el transcurso de varios píxeles; En este caso, los datos pueden registrarse como 279 píxeles rojos
en lugar de la notación tradicional de píxel rojo, píxel rojo,...
Esta es una ilustración fundamental de la codificación de longitud de ejecución; Hay muchos más métodos para disminuir el tamaño de un archivo eliminando la información redundante.
Las técnicas de compresión como Lempel-Ziv (LZ) se encuentran ahora entre los algoritmos más utilizados para el almacenamiento de datos sin pérdidas. Las entradas de tabla se reemplazan por cadenas de datos repetidas en la técnica de compresión LZ, que es un modelo de compresión basado en tablas. Esta tabla se crea dinámicamente para la gran mayoría de los algoritmos de LZ mediante el uso de datos de etapas anteriores de la entrada. La mayoría de las veces, la tabla en sí está codificada en Huffman. Los códigos basados en la gramática como este son capaces de comprimir con éxito entradas sustancialmente repetitivas, como una colección de datos biológicos de la misma especie o casi relacionada, una colección masiva de documentos versionados, archivos de Internet, etc. La construcción de una gramática libre de contexto que derive una sola cadena es la tarea fundamental de los sistemas de codificación basados en la gramática. Sequitur y Re-Pair son otras dos técnicas para comprimir la gramática que tienen aplicaciones prácticas.
Los modelos probabilísticos, como la predicción por coincidencia parcial, se utilizan en los compresores sin pérdidas más potentes desarrollados en los últimos tiempos. El modelado estadístico indirecto es otra forma de pensar en la transformada de Burrows-Wheeler, que también puede considerar.
Casi al mismo tiempo que las fotos digitales se generalizaban a finales de la década de 1980, se desarrollaron los primeros estándares para la compresión de imágenes sin pérdidas. A principios de la década de 1990, las técnicas de compresión con pérdida comenzaron a ser más comunes. Estas distinciones perceptivas son utilizadas por una