Agentic RAG: das beste aus zwei (AI) Welten

#WISSENTEILEN powered by Lars Röwekamp | open knowledge GmbH Agentic
RAG Das Beste aus zwei (AI) Welten !?

(Architecture, Cloud, AI & ML) Lars Röwekamp LinkedIn: lars_roewekamp CIO
New Technologies OPEN KNOWLEDGE

RAG-Systeme Was sind RAG-Systeme? Und warum brauchen wir sie überhaupt?

Liebe KI, ich habe da mal ne Frage: … ?

„Was ist das schönste Reiseziel der Welt?“ GEN AI MODEL
USER PROMPT „Es gibt viele schöne Orte auf der Welt, … .“

USER PROMPT SYSTEM PROMPT: „Du bist ein Reiseberater Assistent …“ + CONTEXT + „Das schönste Reiseziel für Dich ist … .“

Wie generiert das LLM die Antwort? Die Idee: Frage und
Antwort liegen SEMANTISCH dicht beieinander.

Die Idee: Frage und Antwort liegen SEMANTISCH dicht beieinander. Die
semantische Nähe wird MATHEMATISCH mit Hilfe von Vektoren abgebildet. Wie generiert das LLM die Antwort?

Hund Katze Tiger Maus Hamburg Berlin Madrid Amazonas Embedding Model
0.6 0.3 0.1 … 0.8 0.5 0.3 … 0.4 0.2 0.9 … Embeddings (semantische Vektoren)

Hund Katze Tiger Maus Hamburg Berlin Madrid Amazonas Embedding Model
0.6 0.3 0.1 … 0.8 0.5 0.3 … 0.4 0.2 0.9 … Embeddings (semantische Vektoren) Berlin: Stadt, Europa, Hauptstadt von Deutschland, …

Hund Katze Maus Tiger Hamburg Berlin Madrid Amazonas Embedding Model
0.6 0.3 0.1 … 0.8 0.5 0.3 … 0.4 0.2 0.9 … Hund Katze Tiger Maus Hamburg Berlin Madrid Amazonas Berlin: Stadt, Europa, Hauptstadt von Deutschland, …

0.6 0.3 0.1 … 0.8 0.5 0.3 … 0.4 0.2 0.9 … Hund Katze Tiger Maus Hamburg Berlin Madrid Amazonas

Hund Katze Maus Tiger Hamburg Berlin Madrid Amazonas „Kannst du
mir ein paar europäische Hauptstädte nennen?“ Embedding Model 0.8 0.5 0.4 … „Kannst du mir …“: Stadt, Europa, Hauptstadt, … FRAGE:

0.8 0.5 0.4 … „Kannst du mir …“: Stadt, Europa, Hauptstadt, … „Kannst du mir ein paar europäische Hauptstädte nennen?“ FRAGE:

0.8 0.5 0.4 … „Kannst du mir …“: Stadt, Europa, Hauptstadt, … Unser Ziel? „Kannst du mir ein paar europäische Hauptstädte nennen?“ FRAGE:

Hamburg Berlin Madrid Amazonas Unser Ziel? Alles dafür tun, dass
„Frage“ und „Antwort“ möglichst dicht beieinander liegen!

Source: http://vectors.nlpl.eu/explore/embeddings/en/MOD_enwiki_upos_skipgram_300_2_2021/cat_NOUN/

man woman king queen Ok, aber was ist jetzt das
Tolle daran?

man woman king queen queen – woman + man =
king Ok, aber was ist jetzt das Tolle daran? Wir können damit rechnen und „verstehen“.

Tolle daran? Wir können damit rechnen und „verstehen“. doctor – man + woman = ?

Tolle daran? Wir können damit rechnen und „verstehen“. doctor – man + woman = nurse

USER PROMPT SYSTEM PROMPT: „Du bist ein Reiseberater Assistent …“ + CONTEXT „Das schönste Reiseziel der Welt ist … !“ +

GEN AI MODEL USER PROMPT + CONTEXT SYSTEM PROMPT +
Und das funktioniert wirklich auch für REAL LIFE PROBLEME?

GEN AI MODEL USER PROMPT + CONTEXT SYSTEM PROMPT +
Ja, wenn du deine HAUSAUFGABEN machst!

GEN AI MODEL USER PROMPT Welches Model? Welche Parameter? Welche
Infrastruktur? Welche Lizenz? Welches Preismodell? Welche Governance? 2 1 Parts of a Prompt System vs User Prompt Principles of Prompting Patterns of Prompting Context Window Query vs Chat + CONTEXT SYSTEM PROMPT + Deine HAUSAUFGABEN

GEN AI MODEL USER PROMPT „Was ist das schönste Reiseziel
der Welt?“ „Du bist ein Human Resources Assistent …“ +

GEN AI MODEL USER PROMPT „Wie beantrage ich Urlaub bei
open knowledge?“ „Das wüsste ich auch gerne… !“ „Du bist ein Human Resources Assistent …“ +

open knowledge?“ „Du musst das Formular A123 ausfüllen.“ + „Du bist ein Human Resources Assistent …“

open knowledge?“ „ok HR-Assistent via https://... aufrufen und …“ + Urlaubsregelung von open knowledge + „Du bist ein Human Resources Assistent …“

GEN AI MODEL USER PROMPT „Wie aktiviere ich die Alarmanlage
bei open knowledge?“ Urlaubsregelung von open knowledge + + „Du bist ein Human Resources Assistent …“

GEN AI MODEL USER PROMPT „Wie aktiviere ich die Alarmanlage
bei open knowledge?“ Urlaubsregelung & Alarmanlage von open knowledge + + „Du bist ein Human Resources Assistent …“

GEN AI MODEL USER PROMPT „Wie mache ich was auch
immer bei open knowledge?“ Alles „Wissen“ von open knowledge + + „Du bist ein Human Resources Assistent …“

immer bei open knowledge?“ Alles „Wissen“ von open knowledge + ERROR: Token-Limit Exception Context Window

immer bei open knowledge?“ Alles „Wissen“ von open knowledge + ERROR: Out-of-Budget Exception Context Window

immer bei open knowledge?“ Alles „Wissen“ von open knowledge + WARNING: Lost-in-the-Middle Context Window

immer bei open knowledge?“ Alles „Wissen“ von open knowledge + WARNING: Self-fulfilling Prophecy Small Context Window

immer bei open knowledge?“ Alles „Wissen“ von open knowledge Hmm, was jetzt?

immer bei open knowledge?“ Alles „Wissen“ von open knowledge Alles „Wissen“ von open knowledge What if … ?

OK GEN AI MODEL USER PROMPT „Wie mache ich was
auch immer bei open knowledge?“ Alles „Wissen“ von open knowledge Option 1: Eigenes Modell von Grund auf bauen ERROR: Way-to-complex ERROR: Way-to-expensive

auch immer bei open knowledge?“ Alles „Wissen“ von open knowledge WARNING: kind-of-complex WARNING: out-of-sync Option 2: Bestehendes Modell fine-tunen

auch immer bei open knowledge?“ Model Enrichment Prompt Enrichment Hmm, was jetzt v2?

USER PROMPT GEN AI MODEL „Wie mache ich was auch
immer bei open knowledge?“ SOME MAGIC Some „Magic“ in the Middle

USER PROMPT GEN AI MODEL „Wie mache ich was auch
immer bei open knowledge?“ SOME MAGIC Generation R etrieval A ugmented

Retrieval … … suche die Textfragmente aus der Wissensbasis heraus,
die für die Beantwortung der Ausgangsfrage hilfreich sein könnten. Augmented … … ergänze ein vorgegebenes Prompt-Template um den originären User Prompt und die gefundenen Textfragmente. Generation … … generiere mit Hilfe eines LLMs aus dem angereicherten Prompt-Template die passende Antwort auf die originäre Anfrage.

RAG-Systeme II Wie funktionieren RAG-Systeme unter der Haube?

USER PROMPT GEN AI MODEL „Wie mach ich XYZ bei
open knowledge?“ SOME MAGIC Generation R etrieval A ugmented

RETRIEVAL PIPELINE (verantwortlich dafür, dass etwa gefunden wird) LLM USER
QUERY RETRIEVAL PIPELINE (verantwortlich dafür, dass etwa gefunden wird) INGESTING PIPELINE (verantwortlich dafür, dass etwa gefunden werden kann)

RETRIEVAL PIPELINE (verantwortlich dafür, dass etwa gefunden wird) LLM USER
QUERY RETRIEVAL PIPELINE (verantwortlich dafür, dass etwa gefunden wird) INGESTING PIPELINE (verantwortlich dafür, dass etwa gefunden werden kann) Database (Vector + Meta Data)

Chunking Embedding via Chunking Strategy (fixed, semantic, paragraph) via Embedding
Model (Text -> Vector) INGESTING PIPELINE LLM 1 2 3 RETRIEVAL PIPELINE

RETRIEVAL PIPELINE (verantwortlich dafür, dass etwa gefunden wird) RETRIEVAL PIPELINE
Top-k Fetching Result Reranking Query Embedding Prompt Augmenting LLM 1 2 3 4 5 Chunking Embedding via Chunking Strategy (fixed, semantic, paragraph) via Embedding Model (Text -> Vector) INGESTING PIPELINE

Top-k Fetching Result Reranking Query Embedding Prompt Augmenting Chunking Embedding via Chunking Strategy (fixed, semantic, paragraph) via Embedding Model (Text -> Vector) INGESTING PIPELINE „Oha, das sieht aber kompliziert aus - und das ist es leider auch!“* *außer im ‚Hello World‘ Beispiel aus dem Internet.

Top-k Fetching Result Reranking Query Embedding Prompt Augmenting Chunking Embedding via Chunking Strategy (fixed, semantic, paragraph) via Embedding Model (Text -> Vector) INGESTING PIPELINE 1 Missing Data 1

Top-k Fetching Result Reranking Query Embedding Prompt Augmenting Chunking Embedding via Chunking Strategy (fixed, semantic, paragraph) via Embedding Model (Text -> Vector) INGESTING PIPELINE 1 Missing Data 2 Unsuitable Strategy 1 2

Top-k Fetching Result Reranking Query Embedding Prompt Augmenting Chunking Embedding via Chunking Strategy (fixed, semantic, paragraph) via Embedding Model (Text -> Vector) INGESTING PIPELINE 1 Missing Data 2 Unsuitable Strategy 3 Inappropriate Model 1 2 3 3

Top-k Fetching Result Reranking Query Embedding Prompt Augmenting Chunking Embedding via Chunking Strategy (fixed, semantic, paragraph) via Embedding Model (Text -> Vector) INGESTING PIPELINE 1 Missing Data 2 Unsuitable Strategy 3 Inappropriate Model 4 Chunk(s) not found 1 2 3 4 3

Top-k Fetching Result Reranking Query Embedding Prompt Augmenting Chunking Embedding via Chunking Strategy (fixed, semantic, paragraph) via Embedding Model (Text -> Vector) INGESTING PIPELINE 1 Missing Data 2 Unsuitable Strategy 3 Inappropriate Model 4 Chunk(s) not found 5 Unprofitable Ranking 1 2 3 4 5 3

Top-k Fetching Result Reranking Query Embedding Prompt Augmenting LLM Chunking Embedding via Chunking Strategy (fixed, semantic, paragraph) via Embedding Model (Text -> Vector) INGESTING PIPELINE 6 6 6 Chunk(s) not relevant 1 Missing Data 2 Unsuitable Strategy 3 Inappropriate Model 4 Chunk(s) not found 5 Unprofitable Ranking 1 2 3 3 4 5

Top-k Fetching Result Reranking Query Embedding Prompt Augmenting LLM Chunking Embedding via Chunking Strategy (fixed, semantic, paragraph) via Embedding Model (Text -> Vector) INGESTING PIPELINE 6 6 1 2 3 3 4 5 … und ACTION! 7 „Sorry, aber ich kann leider nur Fragen beantworten!“

Zwischenfazit: RAG Pros & Cons: Gut Lösung zur Abfrage „interner“
Daten aller Art. Herausforderung bei großer, heterogener Datenbasis. Ausschließlich für Content Retrieval nutzbar.

Daten aller Art. Herausforderung bei großer, heterogener Datenbasis. Ausschließlich für Content Retrieval nutzbar. Idee: Dedizierte Ingestors / Retriever je Datenpool. Zusätzlich Aktionen via Function Calling anstoßen. ! !

Daten aller Art. Herausforderung bei großer, heterogener Datenbasis. Ausschließlich für Content Retrieval nutzbar. Idee: Dedizierte Ingestors / Retriever je Datenpool. Zusätzlich Aktionen via Function Calling anstoßen. ! ! ?

Zwischenfazit: RAG Lösung: Datenpool wird auf optimierte Retriever verteilt. RAG-System
wird um AI Agent(en) erweitert. Agenten übernehmen die Workflow-Steuerung. > > Idee: Dedizierte Ingestors / Retriever je Datenpool. Zusätzlich Aktionen via Function Calling anstoßen. ! ! > ?

Zwischenfazit: RAG Lösung: Datenpool wird auf optimierte Retriever verteilt. RAG-System
wird um AI Agent(en) erweitert. Agenten übernehmen die Workflow-Steuerung. > > Idee: Dedizierte Ingestors / Retriever je Datenpool. Zusätzlich Aktionen via Function Calling anstoßen. ! ! > -> Agentic RAG ?

AGENTIC AI Was sind Agenten und wozu sind sie gut?

Agentic AI von GenAI zu Agentic AI APPLICATION MODEL LLM
System + User Prompt Model Response User

APPLICATION Agentic AI von GenAI zu Agentic AI MODEL LLM
System + User Prompt Model Response User SERVICES Content Data Devices Code Services Human ?

AGENT SERVICES Execution Loop in out Plan Action Memory [ST]
Tools Content Data Devices Code Services Human APPLICATION Agentic AI unter der Haube MODEL Function Calling LLM

AGENT MODEL SERVICES Execution Loop in out Plan Action Memory
[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube „Wie beantrage ich Urlaub bei open knowlege?“

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube 1 1 Planing: „Du bist ein HR-Assistent für Mitarbeiter von ok. Führe folgende Schritte durch, um die Aufgabe […] zu erfüllen: […].“ „Wie beantrage ich Urlaub bei open knowlege?“

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube 2 Reasoning: „Ich sollte zunächst schauen, ob und wo ich weitere Informationen zum Thema Urlaubsantrag abfragen kann.“ 2 3 3 „Wie beantrage ich Urlaub bei open knowlege?“

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube Act: „Ich nutze das HR-Retriever Tool, um Informationen zu Urlaubsanträgen aus dem internen HR RAG (Vector DB) des Unternehmens abzufragen.“ 4 4 5 5 „Wie beantrage ich Urlaub bei open knowlege?“

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube Mission Completed? „Ist die Aufgabe erledigt? Wenn nicht drehe ich einfach noch eine Runde. D.h. ich schaue, welches Tool mich weiter Richtung Ziel bringt.“ „Wie beantrage ich Urlaub bei open knowlege?“

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube „Wie beantrage ich Urlaub bei open knowlege?“ „Bitte einfach den ok HR-Assistent via [LINK] aufrufen und …“ Mission Completed!

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube „Beantrage bitte vom … bis zum … Urlaub für mich, danke.“ Waiting for Mission …

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube 1 1 Planing: „Du bist ein HR-Assistent für Mitarbeiter von ok. Führe folgende Schritte durch, um die Aufgabe […] zu erfüllen: […].“ „Beantrage bitte vom … bis zum … Urlaub für mich, danke.“

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube „Beantrage bitte vom … bis zum … Urlaub für mich, danke.“ „Um Urlaub zu beantragen, rufe ich am besten die open knowledge HR API mit den Parametern [from_date]und [to_date] auf.“ 2 2 3 3 Reasoning:

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube „Beantrage bitte vom … bis zum … Urlaub für mich, danke.“ „Ich nutze Function Calling und rufe die open knowledge HR API mit den Parametern ma_id=…, from_date= … und to_date= ... auf.“ Act: 4 4 5 5

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube Mission Completed? „Ist die Aufgabe erledigt? Wenn nicht drehe ich einfach noch eine Runde. D.h. ich schaue, welches Tool mich weiter Richtung Ziel bringt.“ „Beantrage bitte vom … bis zum … Urlaub für mich, danke.“

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube „Dein Urlaub ist beantragt. Dein Rest- urlaub beträgt X Tage…“ Mission Completed! „Beantrage bitte vom … bis zum … Urlaub für mich, danke.“

[ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube

AGENT MODEL SERVICES Long-Term Memory Vector Datastore Execution Loop in
out Plan Action Memory [ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube

out Plan Action Memory [ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube FLIGHTWHEEL

out Plan Action Memory [ST] Tools Content Data Devices Code Services Human APPLICATION Function Calling LLM Agentic AI unter der Haube A #2 A #n . . . FLIGHTWHEEL

Zwischenfazit: Agentic AI AI Agenten können … Tools verwenden zwischen
Optionen „entscheiden“ Ergebnisse von Aktionen bewerten aus Aktion und Ergebnis lernen im Team zusammenarbeiten > > > > >

AGENTIC RAG Wie spielen RAG-Systeme und Agenten zusammen?

Vanilla RAG … Frage? LLM (Vector) DB Vector Query Engine
… Antwort! Retrieval Tools Result Handling: Re-Ranking Augmenting …

… Frage? LLM … Antwort! Retrieval Tools (Vector) DB A
(Vector) DB B Vector Query Engine A Vector Query Engine B ? Agentic RAG

… Frage? Retrieval Agent LLM (Vector) DB B Vector Query
Engine A Vector Query Engine B … Antwort! Retrieval Tools Result Handling: Re-Ranking Augmenting … Agentic RAG (Vector) DB A

… Frage? Retrieval Agent LLM (Vector) DB B Vector Query
Engine A Vector Query Engine B eMail Search Web Search … Antwort! Retrieval Tools Result Handling: Re-Ranking Augmenting … Agentic RAG (Vector) DB A

… Frage? Retrieval Agent LLM HR V-DB Controlling V-DB Human
Resources Query Engine Controlling Data Query Engine eMail Search Web Search … Antwort! Retrieval Tools Agentic RAG Result Handling: Re-Ranking Augmenting …

Controlling Data Query Engine Human Resources Query Engine Retrieval Agent
1

2 1

1 3 2

1 3 4 2

„How to apply for holiday leave?“

„What was the turnover in 2024?“

… Frage? Retrieval Agent LLM HR V-DB Controlling V-DB Human
Resources Query Engine Controlling Data Query Engine eMail Search Web Search … Antwort! Retrieval Tools Agentic RAG Result Handling: Re-Ranking Augmenting …

… Frage? Retrieval Agent LLM HR V-DB Human Resources Summary
Engine Human Resources Retrieval Engine eMail Search Web Search … Antwort! Retrieval Tools Agentic RAG Result Handling: Re-Ranking Augmenting …

Human Resources Retrieval Engine Human Resources Summary Engine Retrieval Agent
1

1 2

1 3 2

1 3 4 2

„What is the hr guide about?“

„How to apply for holiday leave?“

… Frage? Retrieval Agent LLM HR V-DB Human Resources Summary
Engine Human Resources Retrieval Engine eMail Search Web Search … Antwort! Retrieval Tools Agentic RAG Result Handling: Re-Ranking Augmenting …

… Aktion! Manager Agent LLM HR V-DB Human Resources Summary
Engine Human Resources Retrieval Engine Human Resource Platform Engine Web Search … Resultat. Agentic Tools Agentic RAG Result Handling: Re-Ranking Augmenting … HR APP

Human Resources Retrieval Engine Human Resources Summary Engine Manager Agent
Human Resources Platform Engine 1

Human Resources Platform Engine 1 2

Human Resources Platform Engine 1 2 3

„Dear agent, I‘ve a question.“ Human Resources Platform Engine

„How to apply for holiday?“ Human Resources Platform Engine

„Apply for holiday from … to … !“ Human Resources Platform Engine

„Get info about employee Lars!“ Human Resources Platform Engine

Financial Report Retrieval Engine Financial Report Summary Engine Manager Agent
„Summarize the financial report.“ Human Resources Platform Engine

Financial Report Retrieval Engine Financial Report Summary Engine Manager Agent
„What was the turnover in 2024?“ Human Resources Platform Engine

… Aktion! Manager Agent LLM HR V-DB Human Resources Query
Engine Human Resources Query Engine Human Resource Platform Engine Web Search … Resultat. Agentic RAG Result Handling: Re-Ranking Augmenting … HR APP Agentic Tools

… Aktion! Manager Agent LLM HR V-DB Human Resources Query
Engine Human Resources Query Engine Human Resource Platform Engine Web Search … Resultat. Agentic RAG Result Handling: Re-Ranking Augmenting … HR APP Das ist mir etwas zu viel! Agentic Tools

… Frage? LLM eMail Slack … Antwort? Management Retrieval Agent
HR Platform Agent Channel Agent Manager Agent Controlling Data Query Engine Sales Resources Query Engine Human Resources Platform Engine Agentic RAG

Remote Fn Calling Wie greife ich auf „externe“ Ressourcen, Tools
oder Prompts zu?

Manager Agent „Apply for holiday from X to Y!“ Human
Resources Platform Engine Function Calling unter der Haube ?

Function Calling unter der Haube Application Model 1 apply_holiday(from_date, to_date)
„Apply for holiday from 01.07.25 to … .“ Tool Definition + Prompt 1 Initialer Modell-Call mit Prompt & Functions.

Function Calling unter der Haube 1 Initialer Modell-Call mit Prompt
& Functions. 2 Rückgabe eines passenden Tools. Application Model 1 2 apply_holiday(from_date, to_date) „Apply for holiday from 01.07.25 to … .“ Tool Calls Tool Definition + Prompt apply_holiday(01.07.2025, 15.07.2025)

Function Calling unter der Haube 1 Initialer Modell-Call mit Prompt
& Functions. 2 Rückgabe eines passenden Tools. 3 Aufruf des Tools aus der Anwendung heraus. Application Model 1 2 apply_holiday(from_date, to_date) „Apply for holiday from 01.07.25 to … .“ Tool Calls Tool Definition + Prompt apply_holiday(01.07.2025, 15.07.2025) 3 Execute Function Code apply_holiday(01.07.25, …) {“status“: “APPROVED: …“}

Zweiter Modell-Call mit Context & Fn Output. Function Calling unter
der Haube 1 Initialer Modell-Call mit Prompt & Functions. 2 Rückgabe eines passenden Tools. 3 Aufruf des Tools aus der Anwendung heraus. 4 Application Model 1 2 4 apply_holiday(from_date, to_date) „Apply for holiday from 01.07.25 to … .“ all prior messages Tool Calls Tool Definition + Prompt Function Call Results apply_holiday(01.07.2025, 15.07.2025) {“status“: “APPROVED: …“} 3 Execute Function Code apply_holiday(01.07.25, …) {“status“: “APPROVED: …“}

Zweiter Modell-Call mit Context & Fn Output. Function Calling unter
der Haube 1 Initialer Modell-Call mit Prompt & Functions. 2 Rückgabe eines passenden Tools. 3 Aufruf des Tools aus der Anwendung heraus. 4 Rückgabe der finalen Antwort vom Modell. 5 Application Model 1 2 4 5 apply_holiday(from_date, to_date) „Apply for holiday from 01.07.25 to … .“ all prior messages Holiday approved from 01.07.2025 to … . Tool Calls Tool Definition + Prompt Function Call Results Final Response apply_holiday(01.07.2025, 15.07.2025) {“status“: “APPROVED: …“} 3 Execute Function Code apply_holiday(01.07.25, …) {“status“: “APPROVED: …“}

Function Calling unter der Haube Application Model 1 2 4
5 apply_holiday(from_date, to_date) „Apply for holiday from 01.07.25 to … .“ all prior messages Holiday approved from 01.07.2025 to … . Tool Calls Tool Definition + Prompt Function Call Results Final Response apply_holiday(01.07.2025, 15.07.2025) {“status“: “APPROVED: …“} 3 Execute Function Code apply_holiday(01.07.25, …) {“status“: “APPROVED: …“} { "type": "function", "name": "apply_for_holiday", "description": "Apply for holiday for an employee for a given period of time..", "strict": true, "parameters": { "type": "object", "properties": { "firstname": { "type": "string", "description": "Firstname of the employee." }, "lastname": { "type": "string", "description": "Lastname of the employee." }, "from_date": { "type": "string", "description": "Start date of holiday request." }, "to_date": { "type": "string", "description": "End date of holiday request." } }, "required": ["firstname, lastname, from_date, to_date"], "additionalProperties": false }, "strict": true } apply_for_holiday.json for open AI API

Function Calling unter der Haube Application Model 1 2 4
5 apply_holiday(from_date, to_date) „Apply for holiday from 01.07.25 to … .“ all prior messages Holiday approved from 01.07.2025 to … . Tool Calls Tool Definition + Prompt Function Call Results Final Response apply_holiday(01.07.2025, 15.07.2025) {“status“: “APPROVED: …“} 3 Execute Function Code apply_holiday(01.07.25, …) {“status“: “APPROVED: …“} { "type": "function", "name": "apply_for_holiday", "description": "Apply for holiday for an employee for a given period of time..", "strict": true, "parameters": { "type": "object", "properties": { "firstname": { "type": "string", "description": "Firstname of the employee." }, "lastname": { "type": "string", "description": "Lastname of the employee." }, "from_date": { "type": "string", "description": "Start date of holiday request." }, "to_date": { "type": "string", "description": "End date of holiday request." } }, "required": ["firstname, lastname, from_date, to_date"], "additionalProperties": false }, "strict": true } apply_for_holiday.json for gemini API

Function Calling Herausforderung e.g. OpenAI GenAI Model 1 e.g. Function
API e.g. Cloud Storage e.g. Database e.g. Gemini GenAI Model 2 e.g. Anthropic GenAI Model 3 Service A Service B Service C N*M Connections Jedes Modell muss mit jedem Service individuell integriert werden.

Function Calling Herausforderung e.g. OpenAI GenAI Model 1 e.g. Function
API e.g. Cloud Storage e.g. Database e.g. Gemini GenAI Model 2 e.g. Anthropic GenAI Model 3 Service A Service B Service C MCP (Standardized Protocp) N+M MCP Connections Modelle und Services müssen je nur einmalig mit MPC integrieren.

Function Calling Herausforderung MCP (Standardized Protocp) AI Applications Data Sources
& Tools bidirectional Flow PostgreSQL, SQLite, GDrive Data & File Systems Sentry, Git, Fetch … Development Tools Google Maps, Slack, … Productivity Tools YOUR App, Sire, … AI Applications Claude Code, Goose, … IDEs Claude Desktop, LibreChat, … Chat Interfaces

Function Calling via Model Context Protocol (MCP) AI APPLICATION SOME
API FILESYSTEM DATABASE

Function Calling via Model Context Protocol (MCP) AI APPLICATION SOME
API MCP Host MCP Client MCP Client MCP Client MCP Sever MCP Sever FILESYSTEM DATABASE MCP Sever

Function Calling MCP Server in Action

Function Calling MCP Client Call via MCP Inspector

Function Calling MCP Client Call via Claude Desktop

LESSONS LEARNED Was Du aus dem aus dem Vortrag über
Agentic RAG mitnehmen solltest.

RAG … … gute Lösung zu Abfrage interner Daten. Allerdings
ausschließlich für Content Retrieval gedacht, mit Schwächen bei großen / heterogenen Datenpools. AGENTIC AI … … kann je nach Task „passende“ Tools auswählen und nutzen. Mittels Observation werden Aktionen / Ergebnisse ausgewertet und über den nächsten Schritt entschieden. Agenten können lernen und in Teams zusammenarbeiten. AGENTIC RAG … … ist das beste aus zwei Welten! Es erlaubt ein „intelligentes“ Retrieval, das auch bei großen / heterogenen Datenpools sehr gute Ergebnisse liefern kann. Neben dem Retrieval erlauben die Agenten darüber hinaus auch die Ausführung von Aktionen via Functions Calls.

AGENTIC RAG … … ist das beste aus zwei Welten!
Es erlaubt ein „intelligentes“ Retrieval, das auch bei großen / heterogenen Datenpools sehr gute Ergebnisse liefern kann. Neben dem Retrieval erlauben die Agenten darüber hinaus auch die Ausführung von Aktionen via Functions Calls. „REAL LIFE“ AGENTIC RAG … … ist leider noch etwas komplizierter: • ACL / Security für Retrieval und Function Calls • I18N für Retrieval und Function Calls • Guardrails zur Absicherung von Input / Output • Response Quality Monitoring via LLM & RAG Metriken • Aufrufprotokolle à la MCP und A2A … aber trotzdem machbar. Wenn man weiß, was und wie ;-)

Zeit für Fragen? Immer!

#WISSENTEILEN by open knowledge GmbH @_openKnowledge | @mobileLarson Lars Röwekamp,
CIO New Technologies Vielen Dank!

BILDNACHWEISE Folie 1: © Buch und Bee - shutterstock.com Alle
anderen Bilder, , Zeichnungen und Icons stammen aus den folgenden freien Quellen • pexels.com, • pixabay.com, • unsplash.com, • flaticon.com oder wurden von mir selbst erstellt.

Function Calling via Model Context Protocol (MCP)

GenAI Basics Function Calling via MCP

Agentic RAG: das beste aus zwei (AI) Welten

Agentic RAG: das beste aus zwei (AI) Welten

More Decks by Lars Roewekamp

Other Decks in Technology

Featured

Transcript