Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Data grids : descubre qué esconden los datos

Data grids : descubre qué esconden los datos

La cantidad de información a nuestro alcance va en aumento a un ritmo frenético. No solo queremos recuperar esos datos, sino analizarlos y extraer lo relevante lo más rápido posible.

El ecosistema java y la JVM son una buena plataforma para ello. En esta charla os mostraremos una de las tecnologías disponibles para este uso: las data grid.
Infinispan (JBoss Datagrid), no solo puede ser utilizada como caché de datos distribuida, sino también para el análisis de datos gracias a varias de sus APIs: Java 8 Streams y Spark/Hadoop.

A través de demostraciones en vivo podréis ver las capacidades de varias de estas APIs y descubrir fácilmente todo lo que esconden vuestros datos!

Galder Zamarreño

November 23, 2017
Tweet

More Decks by Galder Zamarreño

Other Decks in Programming

Transcript

  1. DATA GRIDS : Descubre qué esconden los datos Madrid JUG

    Galder Zamarreño Arrizabalaga
 @galderz
 23 noviembre 2017
  2. INSERT DESIGNATOR, IF NEEDED (EDIT ON MASTER SLIDE) 2 Desde

    2006 INGENIERO @galderz Desarrollador y responsable de la comunidad COFUNDADOR DE INFINISPAN (2009) ME GUSTA EL QUESO PUES!
  3. INSERT DESIGNATOR, IF NEEDED (EDIT ON MASTER SLIDE) EL PROBLEMA

    3 Datos, datos, datos, datos y mas datos... Recuperar los datos no es suficiente Analizar y extraer lo más relevante
  4. INSERT DESIGNATOR, IF NEEDED (EDIT ON MASTER SLIDE) 6 COMO

    USAR JAVA STREAMS PARA ANALIZAR DATOS?
  5. INSERT DESIGNATOR, IF NEEDED (EDIT ON MASTER SLIDE) 7 Click

    to add subtitle Ejecutar operaciones de Java Stream para en un entorno distribuido JAVA STREAMS DISTRIBUIDO
  6. INSERT DESIGNATOR, IF NEEDED (EDIT ON MASTER SLIDE) 8 DATA

    GRIDS PARA ANALIZAR DATOS DISTRIBUIDOS CON JAVA STREAMS
  7. INSERT DESIGNATOR, IF NEEDED (EDIT ON MASTER SLIDE) 11 Cada

    nodo mantiene una porción de datos Algoritmos de hash consistente para decidir quien guarda cada elemento N copias de cada elemento CÓMO SE DISTRIBUYEN LOS DATOS?
  8. INSERT DESIGNATOR, IF NEEDED (EDIT ON MASTER SLIDE) 14 Platform-as-a-Service

    (PaaS) Plataforma para el desarrollo y ejecución de aplicaciones Publica o privada y multi lenguaje Es una distribución de Kubernetes con extras OPENSHIFT
  9. INSERT DESIGNATOR, IF NEEDED (EDIT ON MASTER SLIDE) 17 CUAL

    ES LA HORA DEL DIA EN LA QUE HAY EL MAYOR % DE RETRASOS DE TRENES?
  10. INSERT DESIGNATOR, IF NEEDED (EDIT ON MASTER SLIDE) 18 ARQUITECTURA

    Data Grid Replication Delay Calculator Server Task Delay Calculator Server Task Delay Calculator Server Task Analytics Verticle Injector Verticle Analytics Jupyter Laptop HTTP
  11. INSERT DESIGNATOR, IF NEEDED (EDIT ON MASTER SLIDE) 21 Click

    to add subtitle Difícil de programar para el usuario APIs y MOTOR QUE MEJORAN LAS LIMITACIONES DE HADOOP Más fácil de usar y más eficiente Puede leer datos almacenados en Hadoop APIs y MOTOR DE ANALISIS BASADO EN MAP/REDUCE PLATAFORMAS ANALISIS DE DATOS EN JVM
  12. INSERT DESIGNATOR, IF NEEDED (EDIT ON MASTER SLIDE) 25 DATA

    GRIDS PARA ANALISIS DE DATOS JAVA STREAMS | SPARK/HADOOP