Libro electrónico465 páginas3 horas

Machine Learning y Deep Learning

Name: Machine Learning y Deep Learning
Author: Jesús Bobadilla
ISBN: 9788499648903

Por Jesús Bobadilla

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

Automático (Machine Learning). El objetivo del machine learning es que los sistemas informáticos sean capaces de aprender a partir de los datos, emulando de esta manera las capacidades humanas._x000D_
El Aprendizaje Profundo (Deep Learning) es el área más prometedora del machine learning. Los modernos sistemas de reconocimiento facial, conducción automática, chatbots, comportamiento de los videojuegos, etc. se llevan a cabo haciendo uso de técnicas de deep learning._x000D_
_x000D_
En este libro se explican los conceptos más relevantes tanto de machine learning como de deep learning. Ambos bloques se pueden abordar de manera independiente y en cualquier orden. Se aportan multitud de ejemplos programados en Python y explicados desde cero, con gráficos representativos. También se hace uso de las bibliotecas Scikit_x000D_
y Keras. Cualquier lector con conocimientos de programación podrá entender los conceptos y los ejemplos que se exponen en el libro:_x000D_
_x000D_
• Regresión_x000D_
• Clasificación_x000D_
• Clustering_x000D_
• Reducción de Dimensionalidad_x000D_
• Redes Neuronales_x000D_
• Redes Convolucionales (Convolutional Neural Networks)_x000D_
• Enriquecimiento de datos (Data Augmentation)_x000D_
• Generadores de Datos_x000D_
• Aprendizaje por Transferencia (Transfer Learning)_x000D_
• Autoencoders_x000D_
• Visualización de capas ocultas_x000D_
• Aprendizaje Generativo (Generative Learning)_x000D_
_x000D_
El libro contiene material adicional que podrá descargar accediendo a la ficha del libro en www.ra-ma.es

Saltar el carrusel

IdiomaEspañol

EditorialRA-MA, S.A. Editorial y Publicaciones

Fecha de lanzamiento24 feb 2020

ISBN9788499648903

Autor

Jesús Bobadilla

Relacionado con Machine Learning y Deep Learning

Libros electrónicos relacionados

Saltar el carrusel

Análisis de datos con Power Bi, R-Rstudio y Knime
Libro electrónico
Análisis de datos con Power Bi, R-Rstudio y Knime
deJorge Fernando Betancourt Uscátegui
Calificación: 0 de 5 estrellas
0 calificaciones
Gamificación
Libro electrónico
Gamificación
deFélix Óscar García Rubio
Calificación: 0 de 5 estrellas
0 calificaciones
Programación Orientada a Objetos en JAVA
Libro electrónico
Programación Orientada a Objetos en JAVA
deFrancisco Blasco
Calificación: 0 de 5 estrellas
0 calificaciones
Matlab aplicado a telecomunicaciones
Libro electrónico
Matlab aplicado a telecomunicaciones
deMauricio Ortega Ruíz
Calificación: 5 de 5 estrellas
5/5
MATLAB Aplicado a telecomunicaciones
Libro electrónico
MATLAB Aplicado a telecomunicaciones
deMauricio Ortega
Calificación: 0 de 5 estrellas
0 calificaciones
Introducción a los Algoritmos y las Estructuras de Datos, 1: Una base sólida para el mundo real del aprendizaje de máquinas y la estructura de datos
Libro electrónico
Introducción a los Algoritmos y las Estructuras de Datos, 1: Una base sólida para el mundo real del aprendizaje de máquinas y la estructura de datos
deBolakale Aremu
Calificación: 0 de 5 estrellas
0 calificaciones
Análisis y diseño de algoritmos: Un enfoque práctico
Libro electrónico
Análisis y diseño de algoritmos: Un enfoque práctico
deEduardo Villegas Jaramillo
Calificación: 0 de 5 estrellas
0 calificaciones
Implantación de Sistemas Operativos (GRADO SUP.).: SISTEMAS OPERATIVOS
Libro electrónico
Implantación de Sistemas Operativos (GRADO SUP.).: SISTEMAS OPERATIVOS
deJosé Luis Raya Cabrera
Calificación: 0 de 5 estrellas
0 calificaciones
Python para finanzas
Libro electrónico
Python para finanzas
deCarlos Mario Ramírez Gil
Calificación: 0 de 5 estrellas
0 calificaciones
Introducción a los Algoritmos y las Estructuras de Datos 1: Introducción a los Algoritmos y las Estructuras de Datos, #1
Libro electrónico
Introducción a los Algoritmos y las Estructuras de Datos 1: Introducción a los Algoritmos y las Estructuras de Datos, #1
deBolakale Aremu
Calificación: 0 de 5 estrellas
0 calificaciones
Ingeniería y Arquitectura del Software
Libro electrónico
Ingeniería y Arquitectura del Software
deÁngel Arias
Calificación: 3 de 5 estrellas
3/5
Hacking ético con herramientas Python: SEGURIDAD INFORMÁTICA
Libro electrónico
Hacking ético con herramientas Python: SEGURIDAD INFORMÁTICA
deJosé Manuel Ortega Candel
Calificación: 4 de 5 estrellas
4/5
Sistemas Telemáticos.: Gestión de redes
Libro electrónico
Sistemas Telemáticos.: Gestión de redes
deManuel Santos González
Calificación: 5 de 5 estrellas
5/5
Tratamiento y análisis de la información de mercados. COMM0110
Libro electrónico
Tratamiento y análisis de la información de mercados. COMM0110
deMaría del Sol García Fernández
Calificación: 0 de 5 estrellas
0 calificaciones
Fundamentos de Programación y Bases de Datos
Libro electrónico
Fundamentos de Programación y Bases de Datos
deÁngel Arias
Calificación: 0 de 5 estrellas
0 calificaciones
Hacking ético de redes y comunicaciones
Libro electrónico
Hacking ético de redes y comunicaciones
deLuis Herrero Pérez
Calificación: 0 de 5 estrellas
0 calificaciones
Estructuras de datos y algoritmos fundamentales
Libro electrónico
Estructuras de datos y algoritmos fundamentales
deVíctor Manuel de la Cueva Hernández
Calificación: 0 de 5 estrellas
0 calificaciones
Servicios en Red (GRADO MEDIO): Internet: obras generales
Libro electrónico
Servicios en Red (GRADO MEDIO): Internet: obras generales
deJosé Luis Raya Cabrera
Calificación: 0 de 5 estrellas
0 calificaciones
AI en los Negocios: Guía Práctica para Aplicar la Inteligencia Artificial en Diferentes Industrias
Libro electrónico
AI en los Negocios: Guía Práctica para Aplicar la Inteligencia Artificial en Diferentes Industrias
deDaria Gałek
Calificación: 0 de 5 estrellas
0 calificaciones
Calidad y sostenibilidad de sistemas de información en la práctica
Libro electrónico
Calidad y sostenibilidad de sistemas de información en la práctica
deSilvia Abrahäo
Calificación: 0 de 5 estrellas
0 calificaciones
Guía de uso en Matlab en el desarrollo de modelos de volatilidad
Libro electrónico
Guía de uso en Matlab en el desarrollo de modelos de volatilidad
deÓscar H. Moratto
Calificación: 0 de 5 estrellas
0 calificaciones
UML. Aplicaciones en Java y C++
Libro electrónico
UML. Aplicaciones en Java y C++
deCarlos Jiménez De Parga
Calificación: 4 de 5 estrellas
4/5
115 Ejercicios resueltos de programación C++
Libro electrónico
115 Ejercicios resueltos de programación C++
deJorge Fernando Betancourt Uscátegui
Calificación: 3 de 5 estrellas
3/5
Introducción al Machine Learning con MATLAB
Libro electrónico
Introducción al Machine Learning con MATLAB
deErik Cuevas Jiménez
Calificación: 0 de 5 estrellas
0 calificaciones
Colecciones de datos y algoritmos en Python: de cero al infinito
Libro electrónico
Colecciones de datos y algoritmos en Python: de cero al infinito
deSilvia Guardati Buemo
Calificación: 0 de 5 estrellas
0 calificaciones
Prácticas de Automatización
Libro electrónico
Prácticas de Automatización
deSaturnino Soria Tello
Calificación: 0 de 5 estrellas
0 calificaciones
Introducción a los Algoritmos y las Estructuras de Datos, 2: Una base sólida para el mundo real del aprendizaje de máquinas y análisis de datos
Libro electrónico
Introducción a los Algoritmos y las Estructuras de Datos, 2: Una base sólida para el mundo real del aprendizaje de máquinas y análisis de datos
deBolakale Aremu
Calificación: 0 de 5 estrellas
0 calificaciones
AJAX en J2EE. 2ª Edición actualizada
Libro electrónico
AJAX en J2EE. 2ª Edición actualizada
deAntonio J. Martín Sierra
Calificación: 0 de 5 estrellas
0 calificaciones
Metodología de la programación
Libro electrónico
Metodología de la programación
deOsvaldo Cairó
Calificación: 0 de 5 estrellas
0 calificaciones
La invasión del algoritmo
Libro electrónico
La invasión del algoritmo
deJosé Antonio Gabelas-Barroso
Calificación: 0 de 5 estrellas
0 calificaciones

Inteligencia (IA) y semántica para usted

Saltar el carrusel

Chat GPT-4 para Principiantes: Chat GPT, #1
Libro electrónico
Chat GPT-4 para Principiantes: Chat GPT, #1
deRyan Aitsonod
Calificación: 0 de 5 estrellas
0 calificaciones
Inteligencia artificial: Guía para seres pensantes
Libro electrónico
Inteligencia artificial: Guía para seres pensantes
deMelanie Mitchel
Calificación: 0 de 5 estrellas
0 calificaciones
Cómo usar Chatgpt para tu negocio
Libro electrónico
Cómo usar Chatgpt para tu negocio
deEdgar Díaz
Calificación: 0 de 5 estrellas
0 calificaciones
Cómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon...
Libro electrónico
Cómo Ganar Dinero por Internet con Inteligencia Artificial Emprende tu negocio digital con ChatGPT, Escríbelo.ia, Playground AI, You.com, Canva, Midjourney, Dall-E 2, Amazon...
deRoberto de los Bosques
Calificación: 0 de 5 estrellas
0 calificaciones
El mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos
Libro electrónico
El mito de la inteligencia artificial: Por qué las máquinas no pueden pensar como nosotros lo hacemos
deErik J. Larson
Calificación: 5 de 5 estrellas
5/5
Estructuras de Datos Básicas: Programación orientada a objetos con Java
Libro electrónico
Estructuras de Datos Básicas: Programación orientada a objetos con Java
deSilvia Guardati
Calificación: 5 de 5 estrellas
5/5
¿Cómo piensan las máquinas?: Inteligencia artificial para humanos
Libro electrónico
¿Cómo piensan las máquinas?: Inteligencia artificial para humanos
deFredi Vivas
Calificación: 5 de 5 estrellas
5/5
ChatGPT Ganar Dinero Desde Casa Nunca fue tan Fácil Las 7 mejores fuentes de ingresos pasivos con Inteligencia Artificial (IA): libros, redes sociales, marketing digital, programación...
Libro electrónico
ChatGPT Ganar Dinero Desde Casa Nunca fue tan Fácil Las 7 mejores fuentes de ingresos pasivos con Inteligencia Artificial (IA): libros, redes sociales, marketing digital, programación...
deIsabel Flores Sanz
Calificación: 5 de 5 estrellas
5/5
GuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio
Libro electrónico
GuíaBurros: Inteligencia Artificial: Su lado oscuro y el fin del principio
deFrank Moreno
Calificación: 0 de 5 estrellas
0 calificaciones
El poder de las imagenes, la palabra no tiene poder
Libro electrónico
El poder de las imagenes, la palabra no tiene poder
deAry Campo
Calificación: 0 de 5 estrellas
0 calificaciones
Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial
Libro electrónico
Aprendizaje automático y profundo en python: Una mirada hacia la inteligencia artificial
deCarlos Pineda
Calificación: 0 de 5 estrellas
0 calificaciones
Desarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico
Libro electrónico
Desarrollo de aplicaciones C#: con Visual Studio .NET Curso práctico
deBorja Orbegozo
Calificación: 0 de 5 estrellas
0 calificaciones
Dominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish
Libro electrónico
Dominando ChatGPT: Desbloquea el poder de la IA para mejorar la comunicación y las relaciones: Spanish
deVasyl Kolomiiets
Calificación: 3 de 5 estrellas
3/5
Inteligencia artificial: Lo que usted necesita saber sobre el aprendizaje automático, robótica, aprendizaje profundo, Internet de las cosas, redes neuronales, y nuestro futuro
Libro electrónico
Inteligencia artificial: Lo que usted necesita saber sobre el aprendizaje automático, robótica, aprendizaje profundo, Internet de las cosas, redes neuronales, y nuestro futuro
deNeil Wilkins
Calificación: 4 de 5 estrellas
4/5
Metodología de la programación
Libro electrónico
Metodología de la programación
deOsvaldo Cairó
Calificación: 0 de 5 estrellas
0 calificaciones
Arquitectura de computadoras
Libro electrónico
Arquitectura de computadoras
dePatricia Quiroga
Calificación: 0 de 5 estrellas
0 calificaciones
Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java
Libro electrónico
Fundamentos de Programación: Diagramas de flujo, Diagramas N-S, Pseudocódigo y Java
deJosé Alfredo Jiménez Murillo
Calificación: 0 de 5 estrellas
0 calificaciones
Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes
Libro electrónico
Escritura Creativa en la Era de la IA: Dominando la Colaboración con ChatGPT para Crear Libros Impactantes
deNotNotBoludo
Calificación: 4 de 5 estrellas
4/5
Inteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia
Libro electrónico
Inteligencia artificial: Una exploración filosófica sobre el futuro de la mente y la conciencia
deAna Isabel Sánchez Díez
Calificación: 4 de 5 estrellas
4/5
Metodología de la Programación Orientada a Objetos
Libro electrónico
Metodología de la Programación Orientada a Objetos
deLeobardo López
Calificación: 0 de 5 estrellas
0 calificaciones
Inteligencia artificial: con aplicaciones a la ingeniería
Libro electrónico
Inteligencia artificial: con aplicaciones a la ingeniería
dePedro Ponce
Calificación: 0 de 5 estrellas
0 calificaciones
Introducción a la ingeniería
Libro electrónico
Introducción a la ingeniería
deDavid Moisés Terán
Calificación: 0 de 5 estrellas
0 calificaciones
Python fácil
Libro electrónico
Python fácil
deArnoldo Pérez
Calificación: 4 de 5 estrellas
4/5
Business Intelligence: Técnicas herramientas y aplicaciones
Libro electrónico
Business Intelligence: Técnicas herramientas y aplicaciones
deMaría Pérez Marqués
Calificación: 0 de 5 estrellas
0 calificaciones
El imperio de los algoritmos: IA inclusiva, ética y al servicio de la humanidad
Libro electrónico
El imperio de los algoritmos: IA inclusiva, ética y al servicio de la humanidad
deCecilia Danesi
Calificación: 0 de 5 estrellas
0 calificaciones
Programacion Orientada a Objetos y Estructura de Datos a Fondo
Libro electrónico
Programacion Orientada a Objetos y Estructura de Datos a Fondo
dePablo Sznajdleder
Calificación: 0 de 5 estrellas
0 calificaciones
Sobreviviendo a la IA
Libro electrónico
Sobreviviendo a la IA
deCalum Chace
Calificación: 3 de 5 estrellas
3/5
Resumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1
Libro electrónico
Resumen CHAT GPT IA Revolución en 2023: Guía de la Tecnología CHAT GPT y su Impacto Social: Resumen Tecnológico, #1
deTechnology Summary
Calificación: 0 de 5 estrellas
0 calificaciones
Diseño de algoritmos y su programación en C
Libro electrónico
Diseño de algoritmos y su programación en C
deAlejandra Méndez
Calificación: 0 de 5 estrellas
0 calificaciones
Big data: La revolución de los datos masivos
Libro electrónico
Big data: La revolución de los datos masivos
deViktor Mayer-Schönberger
Calificación: 4 de 5 estrellas
4/5

Episodios de podcast relacionados

Saltar el carrusel

Datos a la vista con Graphext - Victoriano Izquierdo
Episodio de podcast
Datos a la vista con Graphext - Victoriano Izquierdo
deSoftware 2.0
0 calificaciones
0% encontró este documento útil
01 - Machine Learning: De los creadores de Big Data y "Todo en 3D", tenemos el siguiente término de moda en la tecnología que es el Machine Learning ¿Qué es lo que hace y como funciona el Aprendizaje Automático? Para saber más: Explicación Básica...
Episodio de podcast
01 - Machine Learning: De los creadores de Big Data y "Todo en 3D", tenemos el siguiente término de moda en la tecnología que es el Machine Learning ¿Qué es lo que hace y como funciona el Aprendizaje Automático? Para saber más: Explicación Básica...
deRiesgo Existencial
0 calificaciones
0% encontró este documento útil
69. Machine Learning en el trading
Episodio de podcast
69. Machine Learning en el trading
deTecnología y trading
0 calificaciones
0% encontró este documento útil
36. Invitado: Jerónimo Mohar de ALEPHRI, ¿Cómo analizar datos de delitos para proteger tu negocio?
Episodio de podcast
36. Invitado: Jerónimo Mohar de ALEPHRI, ¿Cómo analizar datos de delitos para proteger tu negocio?
deCafé de Datos
0 calificaciones
0% encontró este documento útil
Code Time (64): Algoritmos de ordenamiento PT 2
Episodio de podcast
Code Time (64): Algoritmos de ordenamiento PT 2
deCode Time
0 calificaciones
0% encontró este documento útil
7x03: Todo sobre los sistemas de diseño
Episodio de podcast
7x03: Todo sobre los sistemas de diseño
deParadisers
0 calificaciones
0% encontró este documento útil
Script Time: ¿Realmente se necesita una Mac para desarrollar software?
Episodio de podcast
Script Time: ¿Realmente se necesita una Mac para desarrollar software?
deCode Time
0 calificaciones
0% encontró este documento útil
Inteligencia artificial y Ecommerce: un año después del lanzamiento de ChatGPT [281]
Episodio de podcast
Inteligencia artificial y Ecommerce: un año después del lanzamiento de ChatGPT [281]
deMarketing4eCommerce Podcast
0 calificaciones
0% encontró este documento útil
Code Time (63): Algoritmos de ordenamiento
Episodio de podcast
Code Time (63): Algoritmos de ordenamiento
deCode Time
0 calificaciones
0% encontró este documento útil
115: El GRAN engaño de las estadísticas: El engaño de las estadísticas en Redes Sociales, Tinder, Google Analytics, oyentes PODCASTS... En análisis de datos, el muestreo es la práctica de analizar un subconjunto de datos para descubrir información relevante en todo el conjunto de datos. Por...
Episodio de podcast
115: El GRAN engaño de las estadísticas: El engaño de las estadísticas en Redes Sociales, Tinder, Google Analytics, oyentes PODCASTS... En análisis de datos, el muestreo es la práctica de analizar un subconjunto de datos para descubrir información relevante en todo el conjunto de datos. Por...
deLos últimos días
0 calificaciones
0% encontró este documento útil
128.¿Qué son los Algoritmos Supervisados? Clasificación Vs Regresión
Episodio de podcast
128.¿Qué son los Algoritmos Supervisados? Clasificación Vs Regresión
deCafé de Datos
0 calificaciones
0% encontró este documento útil
Resuelvo ALGORITMO de entrevista para FAANG ❄️
Episodio de podcast
Resuelvo ALGORITMO de entrevista para FAANG ❄️
deProgramador X
0 calificaciones
0% encontró este documento útil
El Manual para convertirte en Data Scientist: Con Jorge Perez, Sr. Data Scientist @ ROI DNA: Jorge Perez es un Ingeniero de Telecomunicaciones que tras pasar mas de 15 años trabajando en compañias como Siemens y Cisco decidio reinventarse y comenzar una nueva carrera como Data Scientist.Esta es la historia de Jorge.
Episodio de podcast
El Manual para convertirte en Data Scientist: Con Jorge Perez, Sr. Data Scientist @ ROI DNA: Jorge Perez es un Ingeniero de Telecomunicaciones que tras pasar mas de 15 años trabajando en compañias como Siemens y Cisco decidio reinventarse y comenzar una nueva carrera como Data Scientist.Esta es la historia de Jorge.
deConexiones: Latinos en Tech
0 calificaciones
0% encontró este documento útil
#44 RAG: Cómo personalizar la IA con tus documentos | Retrieval-augmented generation | Podcast IA
Episodio de podcast
#44 RAG: Cómo personalizar la IA con tus documentos | Retrieval-augmented generation | Podcast IA
de¿Qué IA está pasando? | Inteligencia Artificial y Tecnología para los negocios
0 calificaciones
0% encontró este documento útil
Episodio 21. Toca mojarse.
Episodio de podcast
Episodio 21. Toca mojarse.
deInteligencia Artificial y Educación
0 calificaciones
0% encontró este documento útil
Code Time (116.5) : Computabilidad. el halting problem y el poder de los programas
Episodio de podcast
Code Time (116.5) : Computabilidad. el halting problem y el poder de los programas
deCode Time
0 calificaciones
0% encontró este documento útil
⚡Episodio 89 - Los mejores recursos digitales para mejorar tu CV
Episodio de podcast
⚡Episodio 89 - Los mejores recursos digitales para mejorar tu CV
deMarketing Pills
0 calificaciones
0% encontró este documento útil
Mundo Wolfram
Episodio de podcast
Mundo Wolfram
deFísica a los 40
0 calificaciones
0% encontró este documento útil
1337. Trabajos del FUTURO, INTELIGENCIA ARTIFICIAL y otras preocupaciones
Episodio de podcast
1337. Trabajos del FUTURO, INTELIGENCIA ARTIFICIAL y otras preocupaciones
deDesarrollo profesional
0 calificaciones
0% encontró este documento útil
Compilando para el Z80 en 2022: <p>En este episodio nos acompaña Fran Gallego para hablar de nuevos métodos en las enseñanzas de Informática, de cómo se pueden programar algoritmos de Razonamiento Automático e IA en un ordenador de los 80, de su amor por el AMSTRAD CPC y de cómo desa...
Episodio de podcast
Compilando para el Z80 en 2022: <p>En este episodio nos acompaña Fran Gallego para hablar de nuevos métodos en las enseñanzas de Informática, de cómo se pueden programar algoritmos de Razonamiento Automático e IA en un ordenador de los 80, de su amor por el AMSTRAD CPC y de cómo desa...
deUnicode(U+00D1) Podcast
0 calificaciones
0% encontró este documento útil
Code Time (62): Estrategias para resolver problemas
Episodio de podcast
Code Time (62): Estrategias para resolver problemas
deCode Time
0 calificaciones
0% encontró este documento útil
Bocadillo de drones
Episodio de podcast
Bocadillo de drones
demixx.io
0 calificaciones
0% encontró este documento útil
Preguntas Enero 2021 - Andrés Torrubia
Episodio de podcast
Preguntas Enero 2021 - Andrés Torrubia
deSoftware 2.0
0 calificaciones
0% encontró este documento útil
#2.20 - Técnicas de optimizacion y automatización para ML
Episodio de podcast
#2.20 - Técnicas de optimizacion y automatización para ML
deCharlas técnicas de AWS (AWS en Español)
0 calificaciones
0% encontró este documento útil
Script Time: El programador, la matemática y la lógica ¿qué se necesita?
Episodio de podcast
Script Time: El programador, la matemática y la lógica ¿qué se necesita?
deCode Time
0 calificaciones
0% encontró este documento útil
#106: - “Explorando el impacto de la incertidumbre regulatoria en las criptomonedas y la gestión de riesgos y otros temas.”
Episodio de podcast
#106: - “Explorando el impacto de la incertidumbre regulatoria en las criptomonedas y la gestión de riesgos y otros temas.”
dePrácticas Empresariales
0 calificaciones
0% encontró este documento útil
Una apuesta arriesgada
Episodio de podcast
Una apuesta arriesgada
demixx.io
0 calificaciones
0% encontró este documento útil
"Habilitadores Tecnológicos para una Data Driven Company – Data Fabric" | Raken Data Group | CIOs Vlog
Episodio de podcast
"Habilitadores Tecnológicos para una Data Driven Company – Data Fabric" | Raken Data Group | CIOs Vlog
deTecnologiando con CIO's LATAM
0 calificaciones
0% encontró este documento útil
Big Data y el poder de la información
Episodio de podcast
Big Data y el poder de la información
deEncuentros Fundación Telefónica Movistar
0 calificaciones
0% encontró este documento útil
EP#53: Herramientas de trading Parte 3
Episodio de podcast
EP#53: Herramientas de trading Parte 3
deHablemos De Trading
0 calificaciones
0% encontró este documento útil

Vista previa del libro

Machine Learning y Deep Learning - Jesús Bobadilla

acerca del autor

JESÚS BOBADILLA SANCHO

Doctor y Licenciado en Informática por la Universidad Politécnica de Madrid. Catedrático de Escuela en la Escuela Técnica Superior de Ingeniería de Sistemas Informáticos (ETSISI) de la Universidad Politécnica de Madrid (UPM). Ha impartido docencia en los campos de Arquitectura de Computadores, Sistemas Operativos, Telemática, Reconocimiento de Voz, Inteligencia Artificial y Programación Orientada a Objetos. Ha sido autor de diez libros publicados en el ámbito de la Informática. Su trayectoria de investigación incluye estancias en la Universidad de Berkeley y en la Universidad de Sheffield. Es autor de numerosas publicaciones técnicas en revistas internacionales de alto impacto, y que suman una gran cantidad de citas. Una de estas publicaciones se encuentra entre el 1% de las más relevantes a nivel mundial en el área de Informática (fuente: Web of Science). Su investigación principal se centra en el Filtrado Colaborativo que fundamenta los modernos Sistemas de Recomendación (Amazon, Netflix, Spotify, etc.): un campo importante en el área del Aprendizaje Automático.

1 introducción

En este capítulo se explican diversos conceptos importantes de machine learning (aprendizaje automático). Estos conceptos nos ayudarán a comprender los siguientes apartados, donde se verán modelos de regresión y clasificación, así como las técnicas de clustering (agrupamiento) y de reducción de dimensiones. Mientras que los siguientes capítulos incluirán algunos formalismos matemáticos y desarrollos en Python, aquí se explicarán los conceptos de la manera más simple posible. En resumen, este capítulo pretende ofrecer un marco que facilite la comprensión de los principales conceptos asociados a machine learning.

Machine learning es la ciencia que hace que los ordenadores aprendan a partir de los datos. En vez de programar, paso a paso, cada solución específica para cada necesidad planteada, tal y como se realiza en el enfoque de la programación convencional, el área de machine learning está dedicada al desarrollo de algoritmos genéricos que pueden extraer patrones de diferentes tipos de datos. De esta manera, un programa de machine learning destinado, por ejemplo, a clasificar números escritos a mano, no va a diferir sustancialmente de un programa destinado a la clasificación de las imágenes de señales de tráfico: ambos se basarán en la existencia de algún tipo de algoritmo de machine learning que clasifique datos etiquetados. En este punto se podría pensar que el proceso completo de machine learning es fácilmente automatizable, cuando realmente no es el caso: un ingeniero de datos (data scientist) debe llevar a cabo numerosas tareas específicas tales como la identificación de la fuente de datos, su limpieza, la eliminación de información que esté fuertemente correlacionada, la búsqueda de información sesgada, la realización de las normalizaciones necesarias, la identificación de los tipos de soluciones de machine learning cuya aplicación resulte apropiada, la elección del algoritmo más adecuado, el ajuste fino de los hiper-parámetros del método elegido, el análisis de los resultados, la identificación de comportamientos incorrectos, la vuelta a procesos anteriores con el fin de cambiar lo que resulte necesario para mejorar los resultados, etc.

Tipos de machine learning

Con el objetivo de poder abordar cualquier tarea específica, el ingeniero de datos debe conocer algunos conceptos importantes de machine learning, así como las diferentes opciones existentes, las medidas de calidad más utilizadas, etc. Los conocimientos básicos incluyen la identificación de las tareas, empezando por la clasificación de los problemas de machine learning en alguno de los siguientes tipos:

Aprendizaje supervisado

regresión

clasificación

Aprendizaje no supervisado

clustering (agrupamiento)

reducción de dimensiones

Aprendizaje semi-supervisado

Aprendizaje por refuerzo

El aprendizaje supervisado en machine learning se aplica cuando cada dato, o conjunto de datos de entrada (muestra) tiene asociada una etiqueta. Pongamos un ejemplo: un conjunto de imágenes en las que cada una de ellas contiene algún tipo de metadato (habitualmente una etiqueta o conjunto de etiquetas): ((pict0001.bmp, perro), (pict0002.bmp, pájaro), (pct0003.bmp, gato). Partiendo de este conjunto de datos se pueden usar diferentes algoritmos de clasificación de machine learning con el objetivo de entrenar un modelo y poder, al acabar el entrenamiento, predecir la etiqueta correspondiente a una nueva imagen (no incluida en el conjunto de datos original); éste es un problema de clasificación. De igual manera, podemos hacer uso de un conjunto de datos que contenga muestras con valores numéricos asociados: por ejemplo, un conjunto de muestras de terremotos cuyos datos contienen la intensidad de la vibración previa tomada de sensores y cuyo objetivo es determinar la intensidad oficial del terremoto ([7.1, 6.3, ...], 5.4), ([3.2, 9.7, ...], 7.1). Este es un problema de regresión y su utilidad podría ser la de generar información acerca de la intensidad predicha por el modelo de regresión cuando se le aporta una nueva muestra (valores sísmicos recogidos en tiempo real).

Los siguientes números escritos a mano pueden ayudar a entender las posibilidades de los algoritmos de clasificación. Como veremos más tarde, hemos conseguido reconocerlos todos con la excepción del ‘cinco’ situado en medio de los dos ‘nueves’.

En el siguiente gráfico tridimensional podemos ver los datos correspondientes a un problema de regresión. El objetivo es predecir el precio de una propiedad inmobiliaria en Boston atendiendo a diferentes tipos de información. En el gráfico solo se muestra el número de habitaciones y la distancia a la autopista como tipos de información. El término utilizado en machine learning para los tipos de datos de información es característica ("feature). Así, en el ejemplo, tanto número de habitaciones como distancia a la autopista" son características. Los ejes horizontales x e y representan, cada uno, una característica. El eje vertical z muestra los valores objetivos para cada precio de venta de las propiedades inmobiliarias de Boston. En este caso, los valores objetivos no son etiquetas o nombres de categorías: son valores numéricos. Aquí afrontamos un problema de regresión, donde al suministrar un nuevo dato (habitaciones, distancia) lo que se obtiene es la predicción esperada: el precio de la propiedad inmobiliaria.

De los párrafos anteriores podemos entresacar un concepto importante: el modelo de machine learning. Este es un elemento clave, ya que la mayoría de los algoritmos de machine learning crean un modelo a partir de los datos. El modelo puede ser tan simple como la solución lineal que mejor ajuste las muestras de origen a los valores objetivo, o mucho más complejo, como la búsqueda de factores ocultos que representen la información más importante que esta contenida en los datos. La siguiente figura muestra una regresión lineal (gráfico de la izquierda) y una clasificación lineal (gráfico de la derecha). En el primer caso, los precios en Boston se obtienen usando un modelo de regresión simple que solamente usa la información más representativa de estos datos: el número de habitaciones. Para predecir el precio de una nueva propiedad inmobiliaria simplemente debemos conocer su número de habitaciones, y el modelo predecirá, linealmente, su valor. El gráfico de la derecha muestra dos clases generadas (clase 0 y clase 1), cada una de las cuales está definida por dos características (característica 1 y característica 2). El modelo de clasificación lineal ha resultado ser capaz de separar ambas clases. Para conocer la clase a la que pertenece una nueva muestra usamos el modelo lineal: indica si la muestra está a un lado o a otro de la recta que separa ambas clases. Aquí, el algoritmo de clasificación ha deducido (entrenado) un modelo a partir de los datos: la recta de color negro es el modelo aprendido.

La importancia del aprendizaje supervisado en machine learning está aumentando muy rápidamente debido a:

Las nuevas oportunidades brindadas por el Internet de las Cosas (Internet of Things o IoT), de donde se pueden obtener cantidades masivas de datos etiquetados de manera automática.

Las redes sociales, en cuyos servidores se almacena una enorme cantidad de interacciones y cuyo número de aplicaciones, como las destinadas al mercado digital, no para de crecer.

Los nuevos algoritmos, destinados a resolver diferentes tipos de aprendizaje supervisado, que hacen posible obtener resultados comerciales significativos: conducción automática, reconocimiento facial, sistemas de recomendación, etc.

Las crecientes capacidades de procesamiento, particularmente las supercomputadoras paralelas y las unidades de procesamiento gráfico (GPUs).

La democratización del machine learning, por la que todos podemos trabajar con recursos altamente tecnológicos como Tensorflow o granjas de GPUs, así como con potentes APIs, entornos, IDEs, etc., tales como las tecnologías proporcionadas por Scikit, Keras y Jupiter.

El aprendizaje no supervisado utiliza información no etiquetada. La aplicación más conocida del aprendizaje no supervisado es la de clustering (agrupamiento). El objetivo de la técnica de clustering es agrupar muestras: p. ej.: para obtener los diferentes tipos de clientes en un servicio online, para agrupar productos en un comercio electrónico, para identificar comportamientos en la conducción, etc. El siguiente gráfico muestra un esquema típico de clustering. Contiene tres clusters (grupos o clases) correspondientes a tres diferentes tipos de lirios. Podemos observar que es fácil diferenciar el tipo "setosa" de los otros dos, mientras que se podrían presentar dificultades para precisar los grupos de los tipos versicolor y virginica.

Un modelo de clustering podría proporcionar varios hiperplanos lineales de separación (en el caso anterior: dos rectas), mientras que un modelo de clustering diferente podría proporcionar algunos elementos virtuales representativos: centroides cuya área de influencia determina a qué cluster pertenece cada una de las muestras. Hay más tipos de modelos de clustering, pero los que se han indicado pueden ayudar a entender el concepto de modelo y el hecho de que diferentes algoritmos de machine learning pueden estar basados en diferentes tipos de modelos. El siguiente gráfico muestra un ejemplo de la evolución de los centroides (estrellas rojas) de cara a ajustar los cuatro clusters existentes en los datos de ejemplo.

La reducción de dimensionalidad se usa habitualmente como una etapa de pre-procesamiento en algún otro tipo de labores de machine learning, principalmente en clasificación o regresión. Muchos escenarios reales aportan datos dispersos o datos que en su mayoría proporcionan muy poca información. Un ejemplo de datos dispersos es la información que se maneja en un sistema de recomendación: los usuarios solamente compran, hacen clic, consumen o votan una proporción muy pequeña de los productos, canciones, películas, etc., disponibles. Si colocamos esta información en forma de matriz (usuarios x ítems), la matriz contendrá una gran proporción de elementos sin información: normalmente más del 97% de los datos en sistemas de recomendación son así. Siendo capaces de comprimir los datos, tal y como se hace con las imágenes o con los ficheros de texto, los datos comprimidos contendrían casi toda la información, pero de una manera condensada. Trabajar con esta información comprimida es mucho más eficiente y produce resultados más precisos. Lo que hacemos aquí es convertir datos multidimensionales (una dimensión para cada una de las características: para cada ítem), que son altamente dispersos, en información multidimensional mucho más concentrada y densa. La siguiente figura muestra una imagen fuente y varias versiones de la imagen obtenida a base de aplicar diferentes niveles de reducción de dimensionalidad.

El aprendizaje semisupervisado trata con conjuntos de datos en los que una porción de los datos está etiquetada y el resto no. Normalmente, la cantidad de muestras etiquetadas es mucho más pequeña que las no etiquetadas. La mayoría de los algoritmos de aprendizaje semisupervisado son una mezcla de métodos supervisados y no supervisados. El aprendizaje por refuerzo es un área innovadora y con un gran futuro, ya que está inspirada en mecanismos naturales. En este caso, el algoritmo de aprendizaje recibe información de un entorno real o simulado. Cuando el sistema realiza una acción es recompensado o penalizado, tal y como pasa con los seres vivos. Tales algoritmos de aprendizaje se denominan agentes y pueden aprender siguiendo los principios de la evolución natural. Los agentes aprenden estrategias, denominadas políticas, que maximizan las recompensas y minimizan las penalizaciones. La mayoría de los sistemas de inteligencia artificial actuales, que están especializados en juegos, están basados en el enfoque de aprendizaje por refuerzo.

Los métodos de machine learning también pueden ser clasificados como:

Basado en modelos o basados en memoria.

Aprendizaje incremental o aprendizaje por lotes.

Aprendizaje superficial (shallow learning) o aprendizaje profundo (deep learning).

Los algoritmos basados en memoria (basados en instancias) toman las muestras de datos como entrada y procesan directamente la predicción o la clasificación. Si se necesita una nueva predicción se procesa de nuevo, partiendo de las muestras de datos. Por el contrario, los algoritmos basados en modelos necesitan actualizar el modelo periódicamente, aunque el proceso de predicción es mucho más rápido que en el enfoque basado en memoria. La separación lineal que hemos visto previamente es un modelo simple: puede llevar algún tiempo calcular la pendiente y el punto de corte de la recta, pero la predicción del valor de y partiendo de una nueva muestra x es muy rápido. Si se aportan nuevas muestras de manera periódica, el modelo debe ser actualizado para poder calcular la nueva recta que se ajusta mediante clasificación o regresión.

Los algoritmos de aprendizaje por lotes (batch learning) siempre calculan el modelo desde el principio. Si disponemos de 2000 muestras, el proceso por lotes las usa todas para crear el modelo. Cuando se aporten 300 nuevas muestras al sistema, el proceso por lotes crea el modelo desde el principio, usando las 2300 muestras y así sucesivamente.

Los algoritmos de aprendizaje incremental no crean sucesivos modelos desde el principio: actualizan el modelo existente. En nuestro ejemplo lineal, los algoritmos de proceso por lotes obtendrían el modelo procesando, desde cero, las 2300 muestras existentes. Sin embargo, los algoritmos de aprendizaje incremental usarían las 300 nuevas muestras para cambiar los valores de la pendiente existente y el punto de corte (en muchas situaciones se usan más muestras de datos que las 300 nuevas). Los algoritmos incrementales presentan una importante ventaja: pueden ser usados como el núcleo de sistemas de machine learning escalables.

En el aprendizaje superficial (shallow learning), los parámetros (pendiente, punto de corte, etc.) se aprenden directamente de las características de las muestras de datos. En el aprendizaje profundo (deep learning) siempre existe una arquitectura con más de un nivel (capa). En el segundo nivel (y sucesivos), los parámetros aprenden de los resultados de las capas precedentes. No aprenden directamente de las características de las muestras de datos, que están situadas en la primera capa. Las arquitecturas deep learning (aprendizaje profundo) pueden conformarse a base de varias capas con métodos de machine learning iguales o diferentes, aunque de manera habitual están basadas en redes neuronales multi-capa.

Tratando con datos

En machine learning, los datos son la base de todo; no habrá aprendizaje si no hay suficientes datos, o éstos no son representativos o presentan información sesgada. Cuando la cantidad de datos es insuficiente, los algoritmos de machine learning no pueden generalizar los resultados: simplemente aprenden los patrones específicos de las muestras existentes. Si un niño solo ha visto cinco vehículos a motor, podrá reconocerlos, pero probablemente no podrá generalizarlo y clasificar como vehículo a motor los diferentes tipos de coches, camiones, motos, etc. Este concepto es muy importante en machine learning: se denomina sobreajuste (overfitting) y los ingenieros de datos deben prevenirlo.

Incluso si disponemos de suficiente cantidad de datos, éstos podrían no ser aceptables para algunos propósitos específicos de machine learning si no son representativos o están sesgados. Como ejemplo: no podremos predecir qué canción le gustará escuchar a una mujer de edad avanzada que acabe de conectarse a un servicio de música online, sobre todo si este servicio es usado normalmente por personas jóvenes: simplemente, los datos están sesgados por las preferencias musicales de los jóvenes. Sin embargo, en este contexto, machine learning puede hacer un gran trabajo recomendando música a usuarios jóvenes. De la misma manera, si ajustamos un modelo para clasificar imágenes de perros y gatos, probablemente funcionará adecuadamente clasificando perros y gatos, pero no podemos esperar que clasifique correctamente leones o tigres: es más, si casi todas las imágenes son de perros pastores alemanes, será muy difícil que clasifique de manera adecuada a los perros chihuahua. Esto es debido a que los datos están sesgados hacia los perros pastores alemanes.

Incluso si vamos a usar algún conjunto de datos que contiene información representativa y no sesgada, machine learning podría presentar fallos si la información no es de calidad. Ejemplos de información de mala calidad son:

Cuando hay muchas muestras con valores vacíos en alguna característica (feature): por ejemplo, personas que no rellenan su edad, o falta el código postal en los formularios, etc.

Valores atípicos (outliers): datos incorrectos provenientes de errores humanos, sensores de IoT que funcionan incorrectamente, errores en los programas: p. ej. Mezcla de medidas entre sistema métrico internacional y sistema métrico anglosajón.

Datos incorrectos e inconsistentes: direcciones de correo sin el símbolo @, direcciones postales sin el número del portal, nombres de calles que no se corresponden con el código postal, etc.

También las características irrelevantes pueden estropear un proceso de machine learning. Para poder obtener resultados adecuados necesitamos datos relevantes. Si solo se recogen datos basados en características psicológicas será muy difícil predecir la existencia de un tumor cancerígeno. Lo mismo puede ocurrir si se predice la venta de pañales en base a información del tiempo atmosférico.

Cuando se trabaja en el campo de machine learning debemos diferenciar entre características de tipo continuo y características de tipo categórico (categorical) (características discretas). Habitualmente resulta equivalente a la división previamente presentada: clasificación vs. regresión, pero aplicado a los datos de entrada. Ejemplos de características de entrada continuas son: la intensidad de color en un pixel, la presión en un sensor, el tiempo de ejecución, precios, etc. Las características categóricas clasifican muestras en grupos: sexo, color (negro, rojo,…), departamento (música, deportes, etc.),

¿Disfrutas la vista previa?

Página 1 de 1

Machine Learning y Deep Learning

Información de este libro electrónico

Jesús Bobadilla

Relacionado con Machine Learning y Deep Learning

Libros electrónicos relacionados

Inteligencia (IA) y semántica para usted

Episodios de podcast relacionados

Artículos relacionados

Comentarios para Machine Learning y Deep Learning

¿Qué te pareció?

Vista previa del libro

Machine Learning y Deep Learning - Jesús Bobadilla

acerca del autor

1

introducción

Tipos de machine learning

Tratando con datos