Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AgentCon 2025- Córdoba, Argentina

AgentCon 2025- Córdoba, Argentina

Avatar for Lautaro Carro

Lautaro Carro

September 16, 2025
Tweet

More Decks by Lautaro Carro

Other Decks in Technology

Transcript

  1. Modelos de IA open source: qué son, cómo usarlos y

    por qué importan Lautaro Carro Microsoft MVP – AI Researcher
  2. ¿Qué significa que un modelo sea OSS? ¿Dónde se encuentran

    estos modelos OSS? Tamaños y tipos de modelos Modelos Audiovisuales OSS SML y su impacto en el futuro Agenda
  3. • Su arquitectura y variantes de distintos tamaños están disponibles

    para que cualquiera los use, estudie o modifique. • La comunidad puede mejorarlos, corregir errores y crear variantes adaptadas a diferentes necesidades. • Se pueden entrenar o ajustar con datos propios para aplicaciones específicas. • Permiten entender cómo funcionan internamente y evitar depender totalmente de proveedores cerrados. Modelo de IA Open Source Open Source
  4. Tipos de Modelo de IA Tipos y Tamaños LLM Large

    Language Models con más de 100 millones de parámetros (100M) Alta capacidad de generalización Requieren mayores recursos Ejemplos: Mistral, Llama 2, DeepSeek SML Small Language Models con menos de 10 mil millones de parámetros (10B) Eficientes en recursos Especializados en tareas concretas Ejemplos: Phi-3.5, Gemma 2
  5. Característica HuggingFace OLlama Tipo de plataforma Ecosistema completo de IA:

    hosting, entrenamiento, despliegue y comunidad Runtime para ejecutar modelos LLM en tu máquina Modelos disponibles +500k modelos (LLM, visión, audio, multimodal, embeddings, etc.) Enfocado en LLMs populares (Llama, Mistral, Gemma, Phi, etc.) Facilidad de uso APIs, SDKs en Python, integración con PyTorch, TensorFlow y Transformers Instalar cliente y usar comandos ollama run <modelo> Y su propia API local
  6. • Modelo para investigación en síntesis de voz, diseñado para

    crear audio conversacional expresivo y de larga duración • Soporta hasta 4 voces distintas de manera consistente (más que los 1–2 típicos de otros TTS). • Ofrece diálogos con emociones, música de fondo, cantos y conversaciones multi-idioma. VIbeVoice: Texto a Audio Texto a Imagen
  7. • Alta calidad visual, especialmente en rostros, iluminación, composición, detalles

    finos. • Compiten bastante seriamente con modelos comerciales/populares como DALL-E 3 o Midjourney. • Hay distintas versiones, algunas de uso libre y otras requieren licencias. FLUX: Texto a Imagen Texto a Imagen
  8. • Wan es una suite de modelos de generación de

    desarrollada por Alibaba. • Hay varias versiones con modelos de hasta 14B parámetros. • Ideales para prototipos rápidos y contenido visual creativo donde no se necesite producción cinematográfica completa. WAN: Texto a Video Texto a Video
  9. Modelos SML: el futuro de los agentes de IA SML

    Futuro Priorizar SLMs para un despliegue rentable Diseñar sistemas de agentes modulares Aprovechar SLMs para una especialización rápida Phi 4: Extraer información y matemáticas Qwen/Gemma: Para traducciones Llama: Chats de redes sociales
  10. Conclusiones Conclusiones Los modelos OSS reducen significativamente los gastos de

    infraestructura y despliegue. Los modelos OSS ofrecen mayor privacidad y control. La inteligencia artificial no es solo para gigantes tecnológicos. Es para vos también.