Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Explorando Gemini Nano: Integración de IA en Ap...

Explorando Gemini Nano: Integración de IA en Apps Android

Sumérgete en el fascinante mundo de Gemini Nano, la solución de inteligencia artificial de Google diseñada específicamente para dispositivos Android.

Discutiremos cómo los desarrolladores pueden integrar esta tecnología en sus aplicaciones mediante el AI Edge SDK, permitiendo funcionalidades avanzadas como la transcripción de audio y la generación de texto sin necesidad de conexión a Internet.

También abordaremos las limitaciones actuales, como la compatibilidad de dispositivos y las restricciones de funcionalidad, y cómo estas pueden influir en el desarrollo de aplicaciones.

Además, compararemos Gemini Nano con otras soluciones de inteligencia artificial disponibles para Android, destacando sus ventajas y desventajas.

Únete a esta sesión para descubrir cómo Gemini Nano puede revolucionar el desarrollo de aplicaciones Android y llevar tus proyectos al siguiente nivel.

Antonio Leiva

April 08, 2025
Tweet

More Decks by Antonio Leiva

Other Decks in Programming

Transcript

  1. Explorando Gemini Nano Integración de IA en Apps Android Antonio

    Leiva (Formador, GDE Android, Partner JetBrains)
  2. 📅 Agenda 1. ­ ✨ Introducción a Gemini 2. ­

    🧠 Fundamentos de los LLMs 3. ­ ⚖️ Ventajas y desventajas de la IA en dispositivo
  3. 📅 Agenda 1. ­ ✨ Introducción a Gemini 2. ­

    🧠 Fundamentos de los LLMs 3. ­ ⚖️ Ventajas y desventajas de la IA en dispositivo 4. ­ 🛠️ Casos de uso y aplicaciones prácticas
  4. 📅 Agenda 1. ­ ✨ Introducción a Gemini 2. ­

    🧠 Fundamentos de los LLMs 3. ­ ⚖️ Ventajas y desventajas de la IA en dispositivo 4. ­ 🛠️ Casos de uso y aplicaciones prácticas 5. ­ 💻 Arquitectura e integración
  5. 📅 Agenda 1. ­ ✨ Introducción a Gemini 2. ­

    🧠 Fundamentos de los LLMs 3. ­ ⚖️ Ventajas y desventajas de la IA en dispositivo 4. ­ 🛠️ Casos de uso y aplicaciones prácticas 5. ­ 💻 Arquitectura e integración 6. ­ 👨‍💻 Demo práctica
  6. ✨ 1. Introducción a Gemini ­ IA generativa de Google

    ­ Suite de modelos con diferentes capacidades
  7. ✨ 1. Introducción a Gemini ­ IA generativa de Google

    ­ Suite de modelos con diferentes capacidades ­ Competidor directo de OpenAI (GPT) y Anthropic (Claude)
  8. Gemini Nano ­ Primera versión de IA generativa de Google

    diseñada para entornos locales ­ Integrado en Chrome y dispositivos Android
  9. Gemini Nano ­ Primera versión de IA generativa de Google

    diseñada para entornos locales ­ Integrado en Chrome y dispositivos Android ­ Disponible inicialmente en dispositivos Pixel y gama alta
  10. 🧠 2. Fundamentos de los LLMs ¿Qué es un Modelo

    de Lenguaje de Gran Escala (LLM)?:
  11. 🧠 2. Fundamentos de los LLMs ¿Qué es un Modelo

    de Lenguaje de Gran Escala (LLM)?: ­ Red neuronal entrenada con enormes cantidades de texto
  12. 🧠 2. Fundamentos de los LLMs ¿Qué es un Modelo

    de Lenguaje de Gran Escala (LLM)?: ­ Red neuronal entrenada con enormes cantidades de texto ­ Predice secuencias de palabras basándose en patrones aprendidos
  13. 🧠 2. Fundamentos de los LLMs ¿Qué es un Modelo

    de Lenguaje de Gran Escala (LLM)?: ­ Red neuronal entrenada con enormes cantidades de texto ­ Predice secuencias de palabras basándose en patrones aprendidos ­ Genera texto coherente y contextualmente relevante
  14. 🧠 Los Parámetros ­ Son principalmente los pesos ­ 32B

    -> 32.000 millones de parámetros ­ Ej: Deepseek R1 -> 671B
  15. 🧠 Los Parámetros ­ Son principalmente los pesos ­ 32B

    -> 32.000 millones de parámetros ­ Ej: Deepseek R1 -> 671B ­ En general, a mayor número de parámetros, mayor precisión en entrenamiento
  16. 🧠 Cuantización ­ Precisión numérica de los parámetros ­ Permite

    reducir significativamente el tamaño del modelo
  17. 🧠 Cuantización ­ Precisión numérica de los parámetros ­ Permite

    reducir significativamente el tamaño del modelo ­ Niveles comunes: 32 bits, 16 bits, 8 bits, 4 bits
  18. 🧠 Cuantización ­ Precisión numérica de los parámetros ­ Permite

    reducir significativamente el tamaño del modelo ­ Niveles comunes: 32 bits, 16 bits, 8 bits, 4 bits ­ A menor cuantización: menor tamaño, menor precisión
  19. 🧠 Cuantización Impacto de la cuantización: Modelo de 7B a

    32 bits: ~28GB Modelo de 7B a 16 bits: ~14GB Modelo de 7B a 8 bits: ~7GB Modelo de 7B a 4 bits: ~3.5GB Un smartphone de gama alta tiene ~12-16GB de RAM total
  20. 🧠 Gemini Nano: Especificaciones Nano 1: 1.8B parámetros (texto) Nano

    2: 3.25B parámetros (multimodal) Cuantización probablemente de 4-8 bits Diseñado específicamente para ejecutarse en RAM de dispositivos
  21. 🧠 2. Fundamentos de los LLMs Comparativa de tamaño: GPT-4:

    ~1800B (estimación) Deepseek R1: 671B Llama 3.2: 1B, 3B, 11B, 90B Gemini Nano: 1.8-3.25B Gemini Nano es ~50-100 veces más pequeño que modelos más potentes
  22. ⚖️ 3. Ventajas de la IA en dispositivo ­ Reducción

    de latencia ­ Reducción de costes
  23. ⚖️ 3. Ventajas de la IA en dispositivo ­ Reducción

    de latencia ­ Reducción de costes ­ Privacidad mejorada
  24. ⚖️ 3. Ventajas de la IA en dispositivo ­ Reducción

    de latencia ­ Reducción de costes ­ Privacidad mejorada ­ Funcionamiento offline
  25. ⚖️ 3. Desventajas de la IA en dispositivo Consumo de

    recursos ­ RAM: Requiere mantener el modelo en memoria
  26. ⚖️ 3. Desventajas de la IA en dispositivo Consumo de

    recursos ­ RAM: Requiere mantener el modelo en memoria ­ Almacenamiento: Descarga del modelo en el dispositivo
  27. ⚖️ 3. Desventajas de la IA en dispositivo Consumo de

    recursos ­ RAM: Requiere mantener el modelo en memoria ­ Almacenamiento: Descarga del modelo en el dispositivo ­ Batería: Mayor consumo durante la generación
  28. ⚖️ 3. Desventajas de la IA en dispositivo Consumo de

    recursos ­ RAM: Requiere mantener el modelo en memoria ­ Almacenamiento: Descarga del modelo en el dispositivo ­ Batería: Mayor consumo durante la generación ­ CPU/GPU: Utilización intensiva durante el procesamiento
  29. ⚖️ 3. Desventajas de la IA en dispositivo Consumo de

    recursos ­ Limitaciones de disponibilidad: dipositivos nuevos de gama alta
  30. ⚖️ 3. Desventajas de la IA en dispositivo Consumo de

    recursos ­ Limitaciones de disponibilidad: dipositivos nuevos de gama alta ­ Menor precisión de las respuestas
  31. 🛠️ 4. Tareas optimizadas para Gemini Nano Nano 1 ­

    Reformulación de texto: Modificar el tono y estilo del texto (ej. casual a formal).
  32. 🛠️ 4. Tareas optimizadas para Gemini Nano Nano 1 ­

    Reformulación de texto: Modificar el tono y estilo del texto (ej. casual a formal). ­ Respuesta inteligente: Generar respuestas contextualmente relevantes en una conversación.
  33. 🛠️ 4. Tareas optimizadas para Gemini Nano Nano 1 ­

    Reformulación de texto: Modificar el tono y estilo del texto (ej. casual a formal). ­ Respuesta inteligente: Generar respuestas contextualmente relevantes en una conversación. ­ Corrección: Identificar y corregir errores ortográficos y gramaticales.
  34. 🛠️ 4. Tareas optimizadas para Gemini Nano Nano 1 ­

    Reformulación de texto: Modificar el tono y estilo del texto (ej. casual a formal). ­ Respuesta inteligente: Generar respuestas contextualmente relevantes en una conversación. ­ Corrección: Identificar y corregir errores ortográficos y gramaticales. ­ Resumen: Condensar documentos extensos en resúmenes concisos (párrafos o viñetas).
  35. 🛠️ 4. Tareas optimizadas para Gemini Nano Nano 1 Reformulación

    de texto Respuesta inteligente Corrección Resumen Nano 2
  36. 🛠️ 4. Tareas optimizadas para Gemini Nano Nano 1 Reformulación

    de texto Respuesta inteligente Corrección Resumen Nano 2 ­ Comprensión de imágenes: Interpretar y describir contenido visual.
  37. 🛠️ 4. Tareas optimizadas para Gemini Nano Nano 1 Reformulación

    de texto Respuesta inteligente Corrección Resumen Nano 2 ­ Comprensión de imágenes: Interpretar y describir contenido visual. ­ Voz a texto: Transcripción de audio a texto.
  38. 💻 5. Arquitectura de Gemini Nano AI Core: ­ Capa

    de abstracción para acceder a modelos de IA
  39. 💻 5. Arquitectura de Gemini Nano AI Core: ­ Capa

    de abstracción para acceder a modelos de IA ­ Gestiona la carga y ejecución de modelos
  40. 💻 5. Arquitectura de Gemini Nano AI Core: ­ Capa

    de abstracción para acceder a modelos de IA ­ Gestiona la carga y ejecución de modelos ­ Optimiza el rendimiento según el hardware
  41. 💻 5. Arquitectura de Gemini Nano AI Core: ­ Capa

    de abstracción para acceder a modelos de IA ­ Gestiona la carga y ejecución de modelos ­ Optimiza el rendimiento según el hardware ­ Mantiene el modelo centralizado para todas las apps
  42. 💻 5. Arquitectura de Gemini Nano Beneficios de la arquitectura

    centralizada: ­ El modelo se descarga una única vez
  43. 💻 5. Arquitectura de Gemini Nano Beneficios de la arquitectura

    centralizada: ­ El modelo se descarga una única vez ­ Todas las aplicaciones comparten la misma instancia
  44. 💻 5. Arquitectura de Gemini Nano Beneficios de la arquitectura

    centralizada: ­ El modelo se descarga una única vez ­ Todas las aplicaciones comparten la misma instancia ­ Menor huella de almacenamiento y memoria
  45. 💻 5. Arquitectura de Gemini Nano Beneficios de la arquitectura

    centralizada: ­ El modelo se descarga una única vez ­ Todas las aplicaciones comparten la misma instancia ­ Menor huella de almacenamiento y memoria ­ Actualizaciones centralizadas del modelo
  46. 💻 5. Arquitectura de Gemini Nano LoRAs (Low-Rank Adaptations): ­

    Técnica para personalizar modelos pre-entrenados
  47. 💻 5. Arquitectura de Gemini Nano LoRAs (Low-Rank Adaptations): ­

    Técnica para personalizar modelos pre-entrenados ­ Permite adaptar el modelo a casos de uso específicos
  48. 💻 5. Arquitectura de Gemini Nano LoRAs (Low-Rank Adaptations): ­

    Técnica para personalizar modelos pre-entrenados ­ Permite adaptar el modelo a casos de uso específicos ­ Requiere muchos menos parámetros que reentrenar completamente
  49. 💻 5. Arquitectura de Gemini Nano LoRAs (Low-Rank Adaptations): ­

    Técnica para personalizar modelos pre-entrenados ­ Permite adaptar el modelo a casos de uso específicos ­ Requiere muchos menos parámetros que reentrenar completamente ­ Optimización para tareas concretas sin perder capacidades generales
  50. 💻 5. Privacidad y seguridad Principios de funcionamiento: ­ Ejecución

    100% local de las peticiones ­ Eliminación de llamadas al servidor para inferencia
  51. 💻 5. Privacidad y seguridad Principios de funcionamiento: ­ Ejecución

    100% local de las peticiones ­ Eliminación de llamadas al servidor para inferencia ­ Datos sensibles nunca salen del dispositivo
  52. 💻 5. Privacidad y seguridad Principios de funcionamiento: ­ Ejecución

    100% local de las peticiones ­ Eliminación de llamadas al servidor para inferencia ­ Datos sensibles nunca salen del dispositivo ­ Aislamiento de solicitudes entre aplicaciones
  53. 💻 5. Privacidad y seguridad Mecanismos de protección: ­ AI

    Core aísla cada solicitud individualmente
  54. 💻 5. Privacidad y seguridad Mecanismos de protección: ­ AI

    Core aísla cada solicitud individualmente ­ No se almacenan registros de datos de entrada
  55. 💻 5. Privacidad y seguridad Mecanismos de protección: ­ AI

    Core aísla cada solicitud individualmente ­ No se almacenan registros de datos de entrada ­ Resultados no persisten después del procesamiento
  56. 💻 5. Privacidad y seguridad Mecanismos de protección: ­ AI

    Core aísla cada solicitud individualmente ­ No se almacenan registros de datos de entrada ­ Resultados no persisten después del procesamiento ­ Separación entre apps que utilizan el modelo
  57. 💻 5. Disponibilidad actual Dispositivos compatibles con Nano 1 (1.8B):

    Pixel 8 (incl. 8a y 8 Pro) Samsung S24 series Xiaomi 14T y MIX Flip Motorola Edge y Razr 50 Ultra Otros dispositivos de gama alta lanzados posteriormente
  58. 💻 5. Disponibilidad actual Dispositivos compatibles con Nano 2 (3.25B):

    Pixel 9 series Requisitos generales: Android 12 o superior (API 31+) Procesador de gama alta/media-alta Mínimo 8GB de RAM recomendados
  59. 💻 5. Integración en apps: Primeros pasos Importante: Actualmente el

    acceso es experimental y no se pueden publicar Apps con esta dependencia. // Configuración en build.gradle dependencies { implementation("com.google.ai.edge.aicore:aicore:0.0.1-exp01") } android { minSdk = 31 }
  60. 💻 5. Integración en apps: Configuración val generationConfig = generationConfig

    { context = ApplicationProvider.getApplicationContext() temperature = 0.2f topK = 16 maxOutputTokens = 256 } val generativeModel = GenerativeModel( generationConfig = generationConfig )
  61. 💻 5. Integración en apps: Descarga del modelo val downloadConfig

    = DownloadConfig(downloadCallback) downloadConfig = downloadConfig 1 val generativeModel = GenerativeModel( 2 generationConfig = generationConfig, 3 4 ) 5
  62. 💻 5. Integración en apps: Petición scope.launch { // Un

    único prompt val response = generativeModel.generateContent(prompt) // Varios mensajes val response = generativeModel.generateContent( content { text(message1) text(message2) ... } ) }
  63. 📝 Resumen: puntos clave Gemini Nano: IA generativa para dispositivos

    Android Dos variantes: 1.8B (texto) y 3.25B (multimodal) Optimizado para tareas específicas en dispositivo Ventajas: privacidad, latencia, funcionamiento offline Desventajas: requisitos hardware, precisión limitada Aplicaciones prácticas: resúmenes, transcripción, sugerencias de respuesta
  64. 📝 Resumen: aspectos técnicos Arquitectura: basada en AI Core con

    modelo centralizado Integración: SDK mínimo 31 (Android 12) Dependencia: aicore:0.0.1-exp01 Configuración personalizable del modelo Disponibilidad: Dispositivos gama alta/media-alta Exclusivamente dispositivos Android
  65. 📝 Resumen: futuro de IA en dispositivo Evolución esperada: Modelos

    más eficientes y potentes Mayor disponibilidad en dispositivos de gama media Ampliación de casos de uso multimodales Oportunidades para desarrolladores: Diferenciación en privacidad y funcionamiento offline Experiencias de usuario más rápidas y naturales Integración profunda con funcionalidades del dispositivo