Libro electrónico223 páginas

Introducción a Apache Spark

Name: Introducción a Apache Spark
Author: VVAA
ISBN: 9788491160496

Por VVAA

Calificación: 0 de 5 estrellas

()

Leer la vista previa

Información de este libro electrónico

Hay mucha excitación en relación con el análisis del big data, pero también mucha confusión en decidir por dónde empezar para aquellos que quieren iniciarse en la programación en este apasionante mundo. Este libro proporciona al lector una oportunidad para empezar a programar y manejar datos a través del ecosistema Apache Spark. Spark es actualmente uno de los paquetes de código abierto más importantes en el espacio del big data y por el que importantes empresas, como IBM, SAP, Oracle o Amazon, han apostado, al tiempo que son también grandes contribuidoras. Este libro, que puede utilizarse como texto de autoestudio o de soporte a cursos que requieran una introducción a Apache Spark, contiene unaexcelente visión introductoria de Apache Spark, una descripción de su ecosistema y de sus características básicas e incluye ejemplos de código para que el lector los pueda probar en su propio PC si lo desea y así tener una comprensión de primera mano de algunas de sus posibilidades.

Saltar el carrusel

Programación

IdiomaEspañol

EditorialUOC

Fecha de lanzamiento30 jun 2016

ISBN9788491160496

Autor

VVAA

Lee más de Vvaa

Saltar el carrusel

Millennials: Nueve poetas
Libro electrónico
Millennials: Nueve poetas
deVVAA
Calificación: 1 de 5 estrellas
1/5
La semilla y el corazón: Antología de poesía japonesa
Libro electrónico
La semilla y el corazón: Antología de poesía japonesa
deTeresa Herrero
Calificación: 5 de 5 estrellas
5/5
El Vurdalak y otros bebedores de sangre
Libro electrónico
El Vurdalak y otros bebedores de sangre
deVVAA
Calificación: 0 de 5 estrellas
0 calificaciones
La escuela poética de Nueva York
Libro electrónico
La escuela poética de Nueva York
deJuan Fernández Rivero
Calificación: 0 de 5 estrellas
0 calificaciones
Cuentos de brujas de escritoras victorianas (1839-1920)
Libro electrónico
Cuentos de brujas de escritoras victorianas (1839-1920)
deVVAA
Calificación: 0 de 5 estrellas
0 calificaciones
Carmilla y otras vampiras
Libro electrónico
Carmilla y otras vampiras
deVVAA
Calificación: 0 de 5 estrellas
0 calificaciones
Pedagogía de la palabra (Volumen II) Enseñar lenguaje para aprender a comunicar(se)
Libro electrónico
Pedagogía de la palabra (Volumen II) Enseñar lenguaje para aprender a comunicar(se)
deCarlos Lomas García
Calificación: 0 de 5 estrellas
0 calificaciones
Antología de las poetas estadounidenses: De Emily Dickinson a Sylvia Plath
Libro electrónico
Antología de las poetas estadounidenses: De Emily Dickinson a Sylvia Plath
deVVAA
Calificación: 0 de 5 estrellas
0 calificaciones
Vampiros. Drácula y otros relatos sangrientos (Trilogía)
Libro electrónico
Vampiros. Drácula y otros relatos sangrientos (Trilogía)
deVVAA
Calificación: 3 de 5 estrellas
3/5
Antología de poetas inglesas del siglo XIX
Libro electrónico
Antología de poetas inglesas del siglo XIX
deXandru Fernández
Calificación: 0 de 5 estrellas
0 calificaciones
Cuerpo, comunicación y emociones: Reflexiones teóricas y experiencias empíricas
Libro electrónico
Cuerpo, comunicación y emociones: Reflexiones teóricas y experiencias empíricas
deMarta Rizo García
Calificación: 0 de 5 estrellas
0 calificaciones
Comportamiento del consumidor
Libro electrónico
Comportamiento del consumidor
deAlejandro Mollá Descals
Calificación: 0 de 5 estrellas
0 calificaciones
Psicología de la Salud y de la Calidad de Vida
Libro electrónico
Psicología de la Salud y de la Calidad de Vida
deVVAA
Calificación: 0 de 5 estrellas
0 calificaciones
La animación sociocultural: Una estrategia para el desarrollo y el empoderamiento de comunidades
Libro electrónico
La animación sociocultural: Una estrategia para el desarrollo y el empoderamiento de comunidades
dePere Soler Masó
Calificación: 0 de 5 estrellas
0 calificaciones
Pedagogía de la palabra (Volumen I): La educación lingüística y el aprendizaje de las competencias comunicativas
Libro electrónico
Pedagogía de la palabra (Volumen I): La educación lingüística y el aprendizaje de las competencias comunicativas
deCarlos Lomas García
Calificación: 0 de 5 estrellas
0 calificaciones
Investigación educativa: Una competencia profesional para la intervención. Análisis de casos
Libro electrónico
Investigación educativa: Una competencia profesional para la intervención. Análisis de casos
deVVAA
Calificación: 0 de 5 estrellas
0 calificaciones
Neuropsicología
Libro electrónico
Neuropsicología
deMercè Jodar Vicente
Calificación: 0 de 5 estrellas
0 calificaciones
Precursores de América: Los grandes poetas del continente americano
Libro electrónico
Precursores de América: Los grandes poetas del continente americano
deVVAA
Calificación: 0 de 5 estrellas
0 calificaciones
Etología: La ciencia del comportamiento animal
Libro electrónico
Etología: La ciencia del comportamiento animal
deSònia Sànchez López
Calificación: 0 de 5 estrellas
0 calificaciones
Psicoterapias humanistas: Una mirada actual
Libro electrónico
Psicoterapias humanistas: Una mirada actual
deJordi Segura Bernal
Calificación: 0 de 5 estrellas
0 calificaciones
Estudios foucaultianos y educación: Pensar de otro modo
Libro electrónico
Estudios foucaultianos y educación: Pensar de otro modo
deVVAA
Calificación: 0 de 5 estrellas
0 calificaciones
Ideas para aprender a aprender: Manual de innovación educativa y tecnología
Libro electrónico
Ideas para aprender a aprender: Manual de innovación educativa y tecnología
deJosé Manuel Pérez Tornero
Calificación: 0 de 5 estrellas
0 calificaciones
La escuela incluida: Redes comunitarias para el cambio educativo
Libro electrónico
La escuela incluida: Redes comunitarias para el cambio educativo
deJoan Andrés Traver Martí
Calificación: 0 de 5 estrellas
0 calificaciones
Masats/Buñuel en Viridiana
Libro electrónico
Masats/Buñuel en Viridiana
deAntonio Ansón
Calificación: 0 de 5 estrellas
0 calificaciones
Tecnopolítica y 15M: La potencia de las multitudes conectadas
Libro electrónico
Tecnopolítica y 15M: La potencia de las multitudes conectadas
deJavier Toret Medina
Calificación: 0 de 5 estrellas
0 calificaciones
Introducción a la psicología forense: Principios para la evaluación
Libro electrónico
Introducción a la psicología forense: Principios para la evaluación
deVVAA
Calificación: 0 de 5 estrellas
0 calificaciones

Autores relacionados

Saltar el carrusel

Relacionado con Introducción a Apache Spark

Programación para usted

Saltar el carrusel

GuíaBurros Microsoft Excel: Todo lo que necesitas saber sobre esta potente hoja de cálculo
Libro electrónico
GuíaBurros Microsoft Excel: Todo lo que necesitas saber sobre esta potente hoja de cálculo
deMiguel Antúnez
Calificación: 4 de 5 estrellas
4/5
Excel para principiantes: Aprenda a utilizar Excel 2016, incluyendo una introducción a fórmulas, funciones, gráficos, cuadros, macros, modelado, informes, estadísticas, Excel Power Query y más
Libro electrónico
Excel para principiantes: Aprenda a utilizar Excel 2016, incluyendo una introducción a fórmulas, funciones, gráficos, cuadros, macros, modelado, informes, estadísticas, Excel Power Query y más
deGreg Shields
Calificación: 3 de 5 estrellas
3/5
Python a fondo
Libro electrónico
Python a fondo
deÓscar Ramírez Jiménez
Calificación: 5 de 5 estrellas
5/5
Aprende a Programar en Python Para Principiantes: La mejor guía paso a paso para codificar con Python, ideal para niños y adultos. Incluye ejercicios prácticos sobre análisis de datos, aprendizaje automático y más.
Libro electrónico
Aprende a Programar en Python Para Principiantes: La mejor guía paso a paso para codificar con Python, ideal para niños y adultos. Incluye ejercicios prácticos sobre análisis de datos, aprendizaje automático y más.
deFlynn Fisher
Calificación: 3 de 5 estrellas
3/5
Python Paso a paso: PROGRAMACIÓN INFORMÁTICA/DESARROLLO DE SOFTWARE
Libro electrónico
Python Paso a paso: PROGRAMACIÓN INFORMÁTICA/DESARROLLO DE SOFTWARE
deÁngel Pablo Hinojosa Gutiérrez
Calificación: 4 de 5 estrellas
4/5
Lógica de programación: Solucionario en pseudocódigo – Ejercicios resueltos
Libro electrónico
Lógica de programación: Solucionario en pseudocódigo – Ejercicios resueltos
deOmar Ivan Trejos Buriticá
Calificación: 4 de 5 estrellas
4/5
Python Aplicaciones prácticas
Libro electrónico
Python Aplicaciones prácticas
deJorge Santiago Nolasco Valenzuela
Calificación: 4 de 5 estrellas
4/5
115 Ejercicios resueltos de programación C++
Libro electrónico
115 Ejercicios resueltos de programación C++
deJorge Fernando Betancourt Uscátegui
Calificación: 3 de 5 estrellas
3/5
Aprende a programar: Crea tu propio sitio web
Libro electrónico
Aprende a programar: Crea tu propio sitio web
deClyde Hatter
Calificación: 4 de 5 estrellas
4/5
Fundamentos De Programación
Libro electrónico
Fundamentos De Programación
deDr. Miguel S. Solares Riachi
Calificación: 5 de 5 estrellas
5/5
Ortografía para todos: La tabla periódica de la ortografía
Libro electrónico
Ortografía para todos: La tabla periódica de la ortografía
deJuan Romeu
Calificación: 5 de 5 estrellas
5/5
HTML para novatos
Libro electrónico
HTML para novatos
deJose M Sepulveda
Calificación: 5 de 5 estrellas
5/5
Arduino. Edición 2018 Curso práctico
Libro electrónico
Arduino. Edición 2018 Curso práctico
deAlfredo Moreno Muñoz
Calificación: 4 de 5 estrellas
4/5
VBA Excel Guía Esencial
Libro electrónico
VBA Excel Guía Esencial
deLuis Brito
Calificación: 5 de 5 estrellas
5/5
Aprende a Programar con Java
Libro electrónico
Aprende a Programar con Java
deÁngel Arias
Calificación: 4 de 5 estrellas
4/5
Python para principiantes
Libro electrónico
Python para principiantes
deJames Tudor
Calificación: 5 de 5 estrellas
5/5
Aprende a programar en C#
Libro electrónico
Aprende a programar en C#
deÁngel Arias
Calificación: 5 de 5 estrellas
5/5
Diseño Web con CSS
Libro electrónico
Diseño Web con CSS
deAlicia Durango
Calificación: 5 de 5 estrellas
5/5
Curso básico de Python: La guía para principiantes para una introducción en la programación con Python
Libro electrónico
Curso básico de Python: La guía para principiantes para una introducción en la programación con Python
deM.Eng. Johannes Wild
Calificación: 0 de 5 estrellas
0 calificaciones
JavaScript: Guía completa
Libro electrónico
JavaScript: Guía completa
deAlessandra Salvaggio
Calificación: 4 de 5 estrellas
4/5
Aprender a programar con Excel VBA con 100 ejercicios práctico
Libro electrónico
Aprender a programar con Excel VBA con 100 ejercicios práctico
deMEDIAactive
Calificación: 5 de 5 estrellas
5/5
Arduino para Principiantes
Libro electrónico
Arduino para Principiantes
deAntonio Caicedo Pedrera
Calificación: 4 de 5 estrellas
4/5
Aplicaciones web con Php
Libro electrónico
Aplicaciones web con Php
deHéctor Flórez Fernández
Calificación: 5 de 5 estrellas
5/5
Aprende a Programar en C++
Libro electrónico
Aprende a Programar en C++
deJoaquín Ramón Reyes Sandler
Calificación: 5 de 5 estrellas
5/5
Curso de Programación y Análisis de Software
Libro electrónico
Curso de Programación y Análisis de Software
deÁngel Arias
Calificación: 4 de 5 estrellas
4/5
Aprender HTML5, CSS3 y Javascript con 100 ejerecios
Libro electrónico
Aprender HTML5, CSS3 y Javascript con 100 ejerecios
deMEDIAactive
Calificación: 5 de 5 estrellas
5/5
Aprende a programar con pseudocódigo, diagramas de flujo y ejercicios de ejemplo resueltos en C: Algoritmos y lógica para aprender programación desde cero
Libro electrónico
Aprende a programar con pseudocódigo, diagramas de flujo y ejercicios de ejemplo resueltos en C: Algoritmos y lógica para aprender programación desde cero
deMario Rodríguez Rancel
Calificación: 0 de 5 estrellas
0 calificaciones
Programación Orientada a Objetos
Libro electrónico
Programación Orientada a Objetos
deJuan Carlos Moreno Pérez
Calificación: 3 de 5 estrellas
3/5
Aprender PHP, MySQL y JavaScript
Libro electrónico
Aprender PHP, MySQL y JavaScript
deRobin Nixon
Calificación: 4 de 5 estrellas
4/5
El gran libro de Python
Libro electrónico
El gran libro de Python
deMarco Buttu
Calificación: 5 de 5 estrellas
5/5

Categorías relacionadas

Saltar el carrusel

Comentarios para Introducción a Apache Spark

Calificación: 0 de 5 estrellas

0 calificaciones

0 clasificaciones0 comentarios

Vista previa del libro

Introducción a Apache Spark - VVAA

C_9788491160458.jpg

Introducción a Apache Spark

Introducción

a Apache Spark

Para empezar a programar

el big data

Mario Macías

Mauro Gómez

Rubèn Tous

Jordi Torres

Diseño de la colección: Editorial UOC

Diseño de la cubierta: Natàlia Serrano

Primera edición en lengua castellana: Noviembre 2015

Primera edición digital: mayo 2016

Rambla del Poblenou 156, 08018 Barcelona

http://www.editorialuoc.com

Realización editorial: Oberta UOC Publishing, SL

Maquetación: Maria García

ISBN: 978-84-9116-049-6

Ninguna parte de esta publicación, incluyendo el diseño general y de la cubierta, no puede ser copiada, reproducida, almacenada o transmitida de ninguna forma ni por ningún medio, ya sea eléctrico, químico, mecánico, óptico, de grabación, de fotocopia o por otros métodos, sin la autorización previa por escrito de los titulares del copyright.

Autores

Mario Macías

Doctor en Arquitectura de Computadores por la Universidad Politécnica de Cataluña, donde compagina su trabajo de profesor con el de investigador en el Barcelona Supercomputing Center-Centro Nacional de Supercomputación (BSC-CNS). Durante la última década ha trabajado en proyectos de investigación relacionados con cloud computing y eficiencia energética. Como actividad independiente, ha autopublicado dos libros de divulgación científica.

Mauro Gómez Parada

Graduado en Ingeniería Informática por la Universidad de Vigo. Actualmente está finalizando el máster de Ingeniería informática en la UPC (Universidad Politécnica de Cataluña) y trabaja como investigador sobre Spark con el grupo de Autonomic Systems del BSC-CNS. Como actividad independiente, ha colaborado en la creación de los Premios Galegos da Musica, nacidos en el año 2013 en Galicia.

Rubèn Tous

Doctor en Informática por la Universidad Pompeu Fabra. En la actualidad es profesor contratado doctor en el Departamento de Arquitectura de Computadores de la Universidad Politécnica de Cataluña e investigador colaborador en el Barcelona Supercomputing Center. Es experto en indexación, búsqueda y clasificación de información multimedia. Ha publicado más de cincuenta artículos de investigación en revistas y conferencias internacionales. Es coeditor de múltiples estándares de los grupos MPEG y JPEG de ISO, y ha sido codirector del Metadata Subgroup de JPEG.

Jordi Torres

Catedrático de la UPC y lidera un grupo de investigación en el BSC. Actualmente su investigación se centra en la convergencia de la computación de altas prestaciones con el big data y su aplicación a los retos que plantea la analítica del big data o la computación cognitiva. Dada su extensa carrera profesional en diferentes roles, también realiza actividades de consultoría y estrategia relacionadas con las tecnologías de próxima generación y su impacto, y actúa como experto para varias organizaciones y empresas o mentorizando a emprendedores. Una de sus pasiones es la divulgación científica, que lo ha llevado a escribir un par de libros, dar conferencias y colaborar con medios de comunicación como La Vanguardia. Mantiene un blog sobre tecnología en www.JordiTorres.eu.

El verdadero progreso es el que pone la tecnología al alcance de todos.

Henry Ford

Las fuentes y ejemplos de este libro pueden descargarse en el repositorio GitHub del libro: https://github.com/SparkBarcelona/libro y a través de la web: http://www.sparkbarcelona.es, donde el lector podrá encontrar material de apoyo a su aprendizaje, material suplementario de nuevos temas que vayan apareciendo y que los autores creamos conveniente poner a disposición del lector, posible lista de fe de erratas que puedan aparecer en el libro con su correspondiente corrección, material de apoyo a profesores que imparten docencia en este tema, así como enlaces a sitios web de cursos que emplean este libro (rogamos a los profesores que lo empleen que nos lo notifiquen, con su URL, para incluirlos en esta lista).

Prólogo

Nos encontramos en un momento muy emocionante a la hora de trabajar en computación paralela y big data. El gran volumen de datos que hoy en día se genera en todos los campos de la industria y la ciencia está revolucionando la forma como interactuamos con las aplicaciones, creamos productos y estudiamos el mundo a nuestro alrededor. Al mismo tiempo, las herramientas necesarias para trabajar con estos datos se han vuelto más fáciles de usar que nunca, puesto que los desarrolladores las han hecho accesibles a más y más usuarios, requiriéndoles menos y menos esfuerzo para adoptarlas. Espero que Apache Spark termine siendo una de estas herramientas para ti, que te aporte un nuevo medio para trabajar con datos de manera fácil, potente, e incluso a veces divertida de usar.

Por ello estoy encantado de ver este primer libro sobre Spark escrito en lengua española –hasta ahora todos los libros eran en lengua inglesa–, escrito por un fantástico equipo de autores. Mario, Mauro, Rubén y Jordi son destacados miembros de la comunidad con gran experiencia en Spark y la computación paralela en general por sus investigaciones y desarrollos en Barcelona. Sin duda, han elaborado un libro completo y fácil de seguir, con muchos ejemplos, y no solo cubren los fundamentos de Spark, sino también las bibliotecas más utilizadas del ecosistema que conforma Apache Spark.

Espero que este libro sea solo una introducción a tu viaje al procesado paralelo de datos en el mundo big data. Las ideas aquí tratadas representan algunos de los mejores métodos ideados para trabajar con datos hoy en día. El procesado avanzado de datos sigue siendo una de las áreas de investigación más activas dentro de las ciencias de la computación, y estoy seguro de que están por llegar muchas nuevas ideas de otros campos de la informática para abrirse paso dentro de este campo. Espero que Spark siga aportándote alguna de estas ideas y que este libro te permita empezar a aprender sobre esta nueva y emocionante área.

Matei Zaharia, CTO en Databricks y vicepresidente de Apache Spark

Agradecimientos

Escribir un libro requiere motivación pero también mucho tiempo, por ello los autores de este libro queremos empezar agradeciendo a nuestro entorno personal más próximo el soporte y la comprensión por el tiempo que hemos dejado de compartir con ellos para poder escribir este libro durante fines de semana y parte de las vacaciones de verano. ¡Gracias!

A Matei Zaharia le queremos agradecer muy sinceramente su disponibilidad y entusiasmo por escribir el prólogo de este libro, que ha sido para nosotros el primer gran reconocimiento al esfuerzo realizado. Además de Matei, también queremos agradecer a Holden Karau, Andy Konwinski y Patrick Wendell que escribieran el libro Learning Spark a principios de este año porque, aunque nuestro libro tiene un enfoque y formato diferente, haber visto el planteamiento de su libro ha sido de gran ayuda.

Nos gustaría mostrar también nuestro agradecimiento a todos los miembros de Databricks con quienes hemos tenido la oportunidad de intercambiar personalmente nuestras impresiones, y que de una manera u otra han influido en esta obra y nos permiten sentir un poco más autorizados a escribir sobre Apache Spark desde Barcelona: Reynold Xin, Xiangrui Meng, Pat Donough, Reza Yazdi, Aaron Davidson y Anthony Joseph. Una especial mención se merece nuestro amigo Paco Nathan, un gran divulgador de Apache Spark de quien aprendimos cómo se puede explicar Apache Spark de manera sencilla.

Expresamos nuestro agradecimiento a los muchos cursos de estudiantes de la Universidad Politécnica de Cataluña-UPC Barcelona Tech, cuyas contribuciones en los seminarios y disertaciones nos han ayudado a aprender más sobre este apasionante mundo del big data y en particular de Apache Spark.

Han sido muchos los compañeros y compañeras que nos han ayudado en este proyecto, contrastando ideas, revisando textos de este libro o compartiendo códigos. Entre ellos recordamos a Gonzalo Pericacho, Ferran Gali, Jordi Nin, Jordi Aranda, Joan Capdevila, Carlos Tripiana, Cesare Cugnasco, Anastasios Gounaris, Albert Calvo, Alessio Conese, Jorge Quimi, Omar Sulca, Dani Mora, Sana Imtiaz, Marc-Oriol Crespí, David Vicente, Diana Moise, Aleix Ruiz de Villa y Ian Bird entre otros.

Nuestro gran agradecimiento al Barcelona Supercomputing Center, que ha sido el entorno de trabajo que nos ha permitido realizar investigación sobre Spark y acumular los conocimientos que aquí queremos compartir. Especial mención a nuestros colegas investigadores de la UPC y BSC con quien hemos escrito el primer artículo de investigación con las experiencias de Spark con nuestro supercomputador Marenostrum en Barcelona: Anastasios Gounaris, Carlos Tripiana, Sergi Girona, Eduard Ayguade, Jesús Labarta, Yolanda Becerra, David Carrera y Mateo Valero.

Nos gustaría mostrar también nuestro agradecimiento a todos y cada uno de los más de mil sparkers miembros del Spark Barcelona Meetup por dar vida a esta fantástica iniciativa que en cierta medida es el embrión de esta obra, y en especial a todos los conferenciantes que hasta el momento han participado en uno de los meetups por habernos regalado nuevos y actuales conocimientos sobre esta apasionante tecnología. Y muchas gracias a las entidades que nos apoyan, como son la Facultad de Informática de Barcelona (FIB), el Barcelona Supercomputing Center (BSC), la UPC Barcelona Tech, la aceleradora de proyectos tecnológicos ITNIG, el Col·legi Oficial d’Enginyers Informàtics (COEINF), la Associació d’Antics Alumnes de la FIB (FIBAlumni) y el portal de tecnología TECNONEWS, Centre d’Excel·lencia en Big Data a Barcelona (Big Data CoE de Barcelona).

Y finalmente nuestro agradecimiento a todos los que nos dejamos, que seguro que son muchos, y que han aportado algo valioso al proyecto.

Prefacio

En el marco de los cambios tecnológicos que estamos viviendo en pleno siglo XXI, el crecimiento exponencial de la información disponible representará

¿Disfrutas la vista previa?

Página 1 de 1

Introducción a Apache Spark

Información de este libro electrónico

VVAA

Lee más de Vvaa

Autores relacionados

Relacionado con Introducción a Apache Spark

Programación para usted

Categorías relacionadas

Comentarios para Introducción a Apache Spark

¿Qué te pareció?

Vista previa del libro

Introducción a Apache Spark - VVAA

Introducción a Apache Spark

Introducción

a Apache Spark

Para empezar a programar

el big data

Prólogo

Agradecimientos

Prefacio