Upgrade to Pro — share decks privately, control downloads, hide ads and more …

[Agentforce World Tour Paris 2026] Sans tests, ...

[Agentforce World Tour Paris 2026] Sans tests, vos agents ne sont pas fiables

Avatar for Nathan Abondance

Nathan Abondance

May 16, 2026

More Decks by Nathan Abondance

Other Decks in Programming

Transcript

  1. Agenda /nabondance - Think2 Pourquoi tester les agents Comment tester

    les agents C'est pas headless du coup ? Le futur 1 2 3 4
  2. Pourquoi tester les agents Pour les mêmes raisons qu'on teste

    l'Apex /nabondance - Think2 🔧 Valider le fonctionnement 🛡 Éviter les régressions 🚀 Déployer sereinement 📖 Documenter le comportement attendu
  3. Pourquoi tester les agents Ce qu'on veut vérifier /nabondance -

    Think2 🎯 Le bon topic et subagent est déclenché ⚡ La bonne action est appelée 📦 Avec les bons paramètres 💬 La réponse reste dans les clous (ton, format, guardrails)
  4. Comment tester les agents En quelques clics /nabondance - Think2

    🚫 Pas besoin de framework externe 🧰 Outil fourni par Salesforce : Testing Center 🤖 Créer les jeux de tests avec Agentforce ou un import csv 📋 Choisir ce qu'on vérifie
  5. Comment tester les agents ? Le Les testing centers Setup

    Agentforce Studio 🟢 Dédié aux tests d'agents 🟢 Métadonnée AiEvaluationDefinition 🟢 Possible d'interagir via la CLI ❌ Impossible de modifier un jeu de test 🟢 Construit sur Agentforce Grid 🟢 Plus de fonctionnalités: ➕ Modification des jeux de test ➕ Bouchonnage de la donnée ➕ Meilleur debuggage ➕ Scoring personnalisable ➕ Historique des tests ❌ Pas de Métadonnée récupérable ❌ Invisible via CLI /nabondance - Think2 Celui du futur → Compatible avec la CLI →
  6. C'est pas headless du coup ? Tester sans clic grâce

    à l'agentforce CLI /nabondance - Think2 🔎 Pour les scripts CI/CD complets et la logique 👉 🔎 Explication approfondie de l'agentforce CLI 👉 󰳕 Gérer les tests depuis un terminal 🔁 Répétable, versionnable (git) 📄 Sortie machine-readable (JSON, JUnit) ⌨ sf agent test run --api-name=MyTest
  7. C'est pas headless du coup ? ⚙ Se base sur

    la Agentforce CLI 🚨 Lancé sur chaque PR ✔ Assertions : "bonne action" vs "exception levée" 📊 Seuil d'évaluation (pas juste pass/fail) ⚠ Seuls les tests du Testing Center Setup sont déployables ⚠ Chaque run = appels LLM = €€ Intégrer les tests d'agents dans une CI/CD /nabondance - Think2 🔎 Pour les scripts CI/CD complets et la logique 👉
  8. Mais du coup c'est quoi la suite ? Ce qui

    arrive (ou pas) /nabondance - Think2 ✅ Testing Center in Agentforce Studio — GA Juin ✅ Custom Scoring Evals : Définir ses propres critères (ton de marque, conformité, qualité de résolution), le Testing Center score automatiquement ✅ Multi-turn Conversation Testing : Tester des conversations complètes, avec simulation voix et historique de runs 🧪 A/B Testing API — Pilote : Splitter le trafic prod entre deux versions d'agent, promouvoir la gagnante via API ⛔ Métadonnée de Testing Center in Agentforce Studio : Aucune info 😢
  9. Si vous avez des sueurs froides à mettre en prod

    de l'apex pas testé, pourquoi le faire avec des agents ?
  10. Conclusion Et le QR code /nabondance - Think2 1⃣ Tester

    ses agents comme son code 2⃣ Deux Testing Center avec leurs qualités et défauts 3⃣ On peut intégrer les tests d'agents dans une CI slides