Visión de máquina: Información sobre el mundo de la visión por computadora
Por Fouad Sabry
()
Información de este libro electrónico
Qué es la visión artificial
La tecnología y los métodos que se utilizan para proporcionar inspección y análisis automáticos basados en imágenes para aplicaciones como la inspección automática, el control de procesos y el guiado de robots. , normalmente en la industria, se denominan visión artificial. El término "visión artificial" abarca una amplia gama de tecnologías, incluidos elementos de software y hardware, sistemas integrados, actividades, procedimientos y profesionales calificados. A diferencia de la visión por computadora, que es un subcampo de la informática, la visión artificial es un campo de la ingeniería de sistemas que podría considerarse diferente de la visión por computadora. Busca combinar tecnologías existentes de formas novedosas y aplicarlas a la solución de problemas que se encuentran en el mundo real. Esta palabra es la que más comúnmente se utiliza para estas funciones en situaciones que involucran automatización industrial; sin embargo, también se utiliza para estas funciones en otros entornos, como el guiado de vehículos.
Cómo se beneficiará
(I) Insights y validaciones sobre los siguientes temas:
Capítulo 1: Visión artificial
Capítulo 2: Visión por computadora
Capítulo 3: Termografía
Capítulo 4: Cámara inteligente
Capítulo 5: Escaneo 3D
Capítulo 6: Mapeo móvil
Capítulo 7: Servocontrol visual
Capítulo 8: Odometría visual
Capítulo 9: Sistemas robóticos guiados por visión
Capítulo 10: Clasificación óptica
(II) Respondiendo a las principales preguntas del público sobre visión artificial.
(III) Ejemplos del mundo real sobre el uso de la visión artificial en muchos campos.
Para quién es este libro
Profesionales, estudiantes universitarios y posgrados estudiantes, entusiastas, aficionados y aquellos que quieran ir más allá del conocimiento o la información básica para cualquier tipo de visión artificial.
Lee más de Fouad Sabry
Relacionado con Visión de máquina
Títulos en esta serie (100)
Histograma de imagen: Revelando conocimientos visuales, explorando las profundidades de los histogramas de imágenes en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesReducción de ruido: Mejora de la claridad, técnicas avanzadas para la reducción del ruido en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesCorrección gamma: Mejora de la claridad visual en la visión por computadora: la técnica de corrección gamma Calificación: 0 de 5 estrellas0 calificacionesVisión por computadora submarina: Explorando las profundidades de la visión por computadora debajo de las olas Calificación: 0 de 5 estrellas0 calificacionesModelo del sistema visual humano: Comprender la percepción y el procesamiento Calificación: 0 de 5 estrellas0 calificacionesEspacio de color: Explorando el espectro de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRetinax: Revelando los secretos de la visión computacional con Retinex Calificación: 0 de 5 estrellas0 calificacionesHomografía: Homografía: Transformaciones en Visión por Computador Calificación: 0 de 5 estrellas0 calificacionesEn Pintura: Cerrar brechas en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDifusión anisotrópica: Mejora del análisis de imágenes mediante difusión anisotrópica Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesContorno activo: Avances en la visión por computadora con técnicas de contorno activo Calificación: 0 de 5 estrellas0 calificacionesMapeo de tonos: Mapeo de tonos: perspectivas iluminadoras en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de contorno: Revelando el arte de la percepción visual en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesPercepción visual: Información sobre el procesamiento visual computacional Calificación: 0 de 5 estrellas0 calificacionesFiltro adaptativo: Mejora de la visión por computadora mediante filtrado adaptativo Calificación: 0 de 5 estrellas0 calificacionesJoint Photographic Experts Group: Liberando el poder de los datos visuales con el estándar JPEG Calificación: 0 de 5 estrellas0 calificacionesEcualización de histograma: Mejora del contraste de la imagen para mejorar la percepción visual Calificación: 0 de 5 estrellas0 calificacionesTransformación de radón: Revelando patrones ocultos en datos visuales Calificación: 0 de 5 estrellas0 calificacionesTransformacion afin: Desbloqueo de perspectivas visuales: exploración de la transformación afín en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetector de bordes astuto: Revelando el arte de la percepción visual Calificación: 0 de 5 estrellas0 calificacionesVisión estéreo por computadora: Explorando la percepción de profundidad en la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesBanco de filtros: Información sobre las técnicas del banco de filtros de Computer Vision Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia de color: Comprensión de la percepción y la representación en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación dura: Revelando la magia de Hough Transform en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesFunción de combinación de colores: Comprensión de la sensibilidad espectral en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesTransformación de Hadamard: Revelando el poder de la transformación de Hadamard en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesModelo de color: Comprensión del espectro de la visión por computadora: exploración de modelos de color Calificación: 0 de 5 estrellas0 calificacionesConsenso de muestra aleatoria: Estimación robusta en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesHashing geométrico: Algoritmos eficientes para el reconocimiento y la comparación de imágenes Calificación: 0 de 5 estrellas0 calificaciones
Libros electrónicos relacionados
Cámara inteligente: Revolucionando la percepción visual con la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesDetección de objetos: Avances, aplicaciones y algoritmos Calificación: 0 de 5 estrellas0 calificacionesRed de sensores visuales: Explorando el poder de las redes de sensores visuales en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesVer síntesis: Explorando perspectivas en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRobot automatizado de inspección por rayos X: Mejora del control de calidad mediante la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesSegmentación de imagen: Desbloqueo de información a través de Pixel Precision Calificación: 0 de 5 estrellas0 calificacionesReconocimiento óptico de Braille: Potenciando la accesibilidad a través de la inteligencia visual Calificación: 0 de 5 estrellas0 calificacionesReconocimiento automático de objetivos: Avances en técnicas de visión por computadora para el reconocimiento de objetivos Calificación: 0 de 5 estrellas0 calificacionesAuditoría de seguridad informática. IFCT0109 Calificación: 5 de 5 estrellas5/5Contador de personas: Desbloqueo de conocimientos a través de análisis visual Calificación: 0 de 5 estrellas0 calificacionesTratamiento y análisis de la información de mercados. COMM0110 Calificación: 0 de 5 estrellas0 calificacionesDimensionar, instalar y optimizar el hardware. IFCT0510 Calificación: 0 de 5 estrellas0 calificacionesBúsqueda inversa de imágenes: Descubriendo los secretos del reconocimiento visual Calificación: 0 de 5 estrellas0 calificacionesSistemas de pruebas y control de la maquetación. ARGP0110 Calificación: 0 de 5 estrellas0 calificacionesSistema de reconocimiento facial: Liberando el poder de la inteligencia visual Calificación: 0 de 5 estrellas0 calificacionesSistema operativo, búsqueda de información: Internet/Intranet y correo electrónico. ADGG0208 Calificación: 0 de 5 estrellas0 calificacionesOperaciones auxiliares con Tecnologías de la Información y la Comunicación. IFCT0108 Calificación: 0 de 5 estrellas0 calificacionesInstalación y parametrización del software. IFCT0510 Calificación: 0 de 5 estrellas0 calificacionesMachine Learning y Deep Learning Calificación: 0 de 5 estrellas0 calificacionesSoftware Afelio: Desbloqueando la visión: explorando las profundidades del software Aphelion Calificación: 0 de 5 estrellas0 calificacionesSistema operativo, búsqueda de información: Internet/Intranet y correo electrónico. ADGN0210 Calificación: 0 de 5 estrellas0 calificacionesRecuperación de imágenes: Liberando el poder de los datos visuales Calificación: 0 de 5 estrellas0 calificacionesVisión por computador: Explorando las profundidades de la visión por computadora Calificación: 0 de 5 estrellas0 calificacionesRealidad aumentada: Explorando las fronteras de la visión por computadora en realidad aumentada Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de aplicaciones web en el entorno servidor. IFCD0210 Calificación: 0 de 5 estrellas0 calificacionesProcesamiento de imágenes piramidales: Explorando las profundidades del análisis visual Calificación: 0 de 5 estrellas0 calificacionesModelo de apariencia activa: Liberando el poder de los modelos de apariencia activa en visión por computadora Calificación: 0 de 5 estrellas0 calificacionesMaquetación y compaginación de productos gráficos complejos. ARGP0110 Calificación: 0 de 5 estrellas0 calificacionesAnotación automática de imágenes: Mejorar la comprensión visual mediante el etiquetado automatizado Calificación: 0 de 5 estrellas0 calificaciones
Inteligencia (IA) y semántica para usted
Chat GPT-4 para Principiantes: Chat GPT, #1 Calificación: 0 de 5 estrellas0 calificacionesCómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon... Calificación: 0 de 5 estrellas0 calificacionesArquitectura de computadoras Calificación: 0 de 5 estrellas0 calificacionesR en profundidad: Programación, gráficos y estadística Calificación: 0 de 5 estrellas0 calificacionesFundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java Calificación: 0 de 5 estrellas0 calificacionesDominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish Calificación: 3 de 5 estrellas3/5Inteligencia artificial: Casos prácticos con aprendizaje profundo Calificación: 4 de 5 estrellas4/5Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia Calificación: 4 de 5 estrellas4/5Resumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1 Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la ingeniería Calificación: 0 de 5 estrellas0 calificacionesDesarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico Calificación: 0 de 5 estrellas0 calificacionesCómo triunfar en Instagram usando ChatGPT: La guía definitiva para crear contenido impactante con ChatGPT Calificación: 0 de 5 estrellas0 calificacionesEl mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos Calificación: 5 de 5 estrellas5/5¿Cómo ganar dinero con la inteligencia artificial? Calificación: 0 de 5 estrellas0 calificacionesLaravel: Curso práctico de formación Calificación: 0 de 5 estrellas0 calificacionesIntroducción a la computación cuántica para ingenieros Calificación: 0 de 5 estrellas0 calificacionesCiencias de la Computación en la escuela: Guía para enseñar mucho más que a programar Calificación: 5 de 5 estrellas5/5Monetización de ChatGPT: aproveche el poder de AI: Spanish Calificación: 1 de 5 estrellas1/5Mecatrónica Calificación: 0 de 5 estrellas0 calificacionesGuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio Calificación: 0 de 5 estrellas0 calificacionesPHP: Programación web avanzada para profesionales Calificación: 0 de 5 estrellas0 calificacionesMetodología de la Programación Orientada a Objetos Calificación: 0 de 5 estrellas0 calificacionesProgramacion Orientada a Objetos y Estructura de Datos a Fondo Calificación: 0 de 5 estrellas0 calificacionesCómo usar Chatgpt para tu negocio Calificación: 0 de 5 estrellas0 calificacionesInteligencia artificial: la cuarta revolución industrial Calificación: 0 de 5 estrellas0 calificacionesInteligencia Artificial Calificación: 4 de 5 estrellas4/5Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes Calificación: 4 de 5 estrellas4/5
Comentarios para Visión de máquina
0 clasificaciones0 comentarios
Vista previa del libro
Visión de máquina - Fouad Sabry
Capítulo 1: Visión artificial
La visión artificial (MV) se refiere tanto a la tecnología como a las metodologías que se utilizan para ofrecer inspección y análisis automatizados basados en imágenes para aplicaciones como la inspección automática, el control de procesos y el guiado de robots, que a menudo se utilizan en entornos industriales. La visión artificial es un término general que abarca una amplia variedad de tecnologías, productos de software y hardware, sistemas integrados, actividades, enfoques y experiencia. La visión por computadora, que es un subcampo de las ciencias de la computación, y la visión artificial, que es un tema de ingeniería de sistemas, pueden diferenciarse entre sí. Se esfuerza por combinar la tecnología ya existente de formas novedosas y utilizarlas en el proceso de encontrar soluciones a los problemas que ocurren en el mundo real. Este es el nombre que más se utiliza para estas actividades en situaciones que involucran la automatización industrial; Sin embargo, también se utiliza para estas funciones en otros entornos, incluidos los que implican el guiado de vehículos.
El proceso de visión artificial en su conjunto comienza con el diseño de las características específicas de las necesidades y el proyecto, y le sigue el desarrollo de una solución. La obtención de imágenes es el primer paso del proceso, al que sigue el examen automático de la imagen y la recopilación de cualquier información necesaria durante el tiempo de ejecución.
La palabra visión artificial
puede tener varios significados diferentes, pero todos se refieren a la tecnología y los procedimientos que se utilizan para extraer automáticamente información de una imagen. Esto contrasta con el procesamiento de imágenes, que da como resultado la creación de una imagen completamente nueva. La información que se recupera puede ser tan simple como una señal de parte buena/parte mala, o puede ser una colección más sofisticada de datos, como la identificación, ubicación y orientación de cada elemento individual incluido dentro de una imagen. Los datos se pueden utilizar en una variedad de aplicaciones, incluida la inspección autónoma, el guiado de robots y procesos en la industria, el monitoreo de seguridad y el guiado de vehículos. Consulte el glosario de visión artificial para obtener más información.
La inspección y clasificación automatizadas basadas en imágenes, así como la navegación robótica, son las aplicaciones clave para la visión artificial; En esta sección se describe el procedimiento tecnológico que se lleva a cabo cuando la solución está en funcionamiento.
La captura de una imagen es la primera etapa de la cadena de operaciones que componen la inspección automatizada. Esta fase a menudo implica el uso de cámaras, lentes e iluminación que han sido diseñados para ofrecer la diferencia que se necesita para el procesamiento futuro.
La iluminación es uno de los componentes que a menudo se incluye en un sistema de inspección automatizado, un dispositivo fotográfico u otro dispositivo de imagen, un procesador, software y dispositivos de salida.: 11–13
Es posible que el dispositivo de imagen (como una cámara) sea independiente de la unidad de procesamiento de imágenes primaria o que se acople a ella. Si se elige la última opción, el dispositivo resultante a menudo se denomina cámara inteligente o sensor inteligente.
El procesamiento de una imagen se produce después de que se haya adquirido. En la mayoría de los casos, el producto final es la culminación de muchas fases de procesamiento que se realizaron en el orden correcto. En un proceso típico, el primer paso es la modificación de la imagen utilizando herramientas como filtros, luego viene la eliminación de objetos, luego viene la eliminación (utilizando métodos como mediciones o la lectura de códigos) de los datos de esos objetos, y finalmente viene la comunicación de esos datos o la comparación de esos datos con los valores objetivo, lo que da como resultado la creación y comunicación de resultados de aprobado/reprobado
. Entre las muchas tecnologías de procesamiento de imágenes disponibles se encuentra la visión artificial; Combinación de imágenes 2D o 3D vecinas a través de un proceso conocido como unión o registro.
Filtrado (por ejemplo, filtrado morfológico)
La primera etapa en el umbral es establecer o determinar un valor gris que será útil para las fases posteriores del proceso. Después de eso, el valor se usa para dividir la imagen en secciones y, ocasionalmente, también se emplea para convertir cada sección de la imagen a blanco y negro simple, dependiendo de si está o no por debajo o por encima de ese valor de escala de grises.
El conteo de píxeles es el proceso de contar el número de píxeles que son luminosos u oscuros.
El proceso de simplificar y/o transformar la representación de una imagen en algo más comprensible y sencillo de analizar se denomina segmentación. La segmentación es la partición de una imagen digital en varios segmentos.
Encontrar los bordes de un objeto es a lo que se refiere la detección de bordes.
Análisis del color: Identificación de componentes, bienes y cosas en función de sus colores; juzgar la calidad de los productos en función de sus colores; Aislar las características mediante colores.
El examen de una imagen en busca de manchas discretas de píxeles vinculados (como un agujero negro en un objeto gris, por ejemplo) como puntos de referencia de la imagen se conoce como detección y extracción de manchas.
Procesamiento basado en redes neuronales, deep learning y machine learning: toma de decisiones multivariable ponderada y autoentrenable
La identificación de patrones, especialmente la coincidencia de plantillas. Es necesario localizar, hacer coincidir y/o contar ciertos patrones. Esto puede incluir la posición de un elemento que se puede girar, parcialmente cubierto por otro objeto o fluctuar en tamaño.
Lectura de códigos de barras, matrices de datos y los llamados códigos de barras 2D
OCR significa reconocimiento óptico de caracteres y se refiere al proceso de automatización de la lectura de texto, como los números de serie.
La medición de las dimensiones de un artículo es una parte importante de la medición y la metrología (por ejemplo, en píxeles, pulgadas o milímetros)
Comparación de los valores reales con los especificados para llegar a una conclusión de aprobado o reprobado
o pasa/no pasa
. Por ejemplo, al verificar la información mediante un código o un código de barras, el valor que se lee se compara con el valor objetivo que se ha guardado. En el proceso de medición, se comprobará una medición con el valor estándar y las tolerancias aplicables. Al comprobar los códigos alfanuméricos, el valor generado por el OCR se compara con el valor correcto, también conocido como valor objetivo. Al realizar una comprobación de defectos, es posible comparar el tamaño medible de las imperfecciones con los máximos permitidos por las normas de calidad.
Los sistemas de inspección automática a menudo proporcionan determinaciones de aprobación/reprobación como una de sus salidas.
Es una práctica típica de la visión artificial proporcionar a un robot información sobre su ubicación y orientación, lo que permite que el robot agarre correctamente el producto. Esta capacidad también se utiliza para dirigir el movimiento que es menos complicado que los robots, como un controlador de movimiento con solo uno o dos ejes.
Todavía en 2006, un consultor de la industria estimó que el sector de los vehículos de media tensión representaba un tamaño de mercado de 1.500 millones de dólares en América del Norte.
{Fin del capítulo 1}
Capítulo 2: Visión artificial
El estudio de cómo las computadoras pueden obtener conocimiento de alto nivel a partir de imágenes o videos digitales es el foco del área científica multidisciplinaria de la visión por computadora. Desde el punto de vista tecnológico, investiga e intenta automatizar actividades que están dentro de las capacidades del sistema visual humano.
Las tareas asociadas con la visión por computadora incluyen técnicas para obtener, procesar, analizar y comprender imágenes digitales, así como la extracción de datos de alta dimensión del entorno físico para crear información numérica o simbólica, como juicios.
La visión por computadora es un subcampo de las ciencias de la computación que investiga los fundamentos teóricos de los sistemas artificiales diseñados para obtener información de imágenes. Los datos visuales pueden presentarse en una variedad de formatos, incluidas secuencias de video, imágenes obtenidas de varias cámaras, datos multidimensionales obtenidos de un escáner 3D o equipo de escaneo médico, etc. El objetivo del campo técnico conocido como visión por computador es implementar las ideas y modelos que ha desarrollado en el proceso de construcción de sistemas de visión por computador.
Los campos de la reconstrucción de escenas, la detección de objetos, la detección de eventos, el seguimiento de vídeo, el reconocimiento de objetos, la estimación de poses en 3D, el aprendizaje, la indexación, la estimación de movimiento, el servoing visual, el modelado de escenas en 3D y la restauración de imágenes son subdominios de la visión por ordenador. Otros subdominios de la visión artificial incluyen el modelado de escenas en 3D.
La visión por computadora es un estudio multidisciplinario que examina cómo se pueden programar las computadoras