Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Künstliche Intelligenz: Technologie der Zukunft...

Künstliche Intelligenz: Technologie der Zukunft – und warum Open Source die Karten neu mischt

Heise KI-Woche 2025: Wie sich KI in Zukunft in Europa entwickeln könnte - und warum Open Source die Karten neu mischt: Deep Seek hat vor einigen Wochen mit aufsehenerregenden Benchmarks den KI-Markt durcheinandergewirbelt. Ist das ein Vorbildmodell für Europa und wo entwickelt sich KI, vor allem Open Source, möglicherweise hin?

Ines Montani

March 06, 2025
Tweet

Resources

Explosion: Developer tools for AI, Machine Learning and NLP

https://explosion.ai

Softwarefirma für KI-Entwicklertools, u.a. die Open-Source-Bibliothek spaCy für Natural Language Processing, und das moderne Annotationstool Prodigy für Machine-Learning-Entwickler

The Window-Knocking-Machine-Test

https://ines.io/blog/window-knocking-machine-test/

Wann immer wir also damit konfrontiert sind, eine menschliche Aufgabe mit Technologie zu lösen, sollten wir uns fragen: entwickele ich hier gerade eine Fensterklopfmaschine oder einen Wecker?

What the history of the web can teach us about the future of AI

https://explosion.ai/blog/history-web-future-ai

Was können wir von einer anderen bahnbrechenden Technologie, dem Web, über die Zukunft von KI lernen?

The AI Revolution Will Not Be Monopolized

https://speakerdeck.com/inesmontani/the-ai-revolution-will-not-be-monopolized-how-open-source-beats-economies-of-scale-even-for-llms

Warum Open Source gegen Economies of Scale gewinnt, selbst für Generative KI und LLMs

A practical guide to human-in-the-loop distillation

https://explosion.ai/blog/human-in-the-loop-distillation

Praktische Lösungen für die Destillation von LLMs, um so bessere, kleinere, schnellere und komplett private Komponenten zu erstellen

How S&P Global is making markets more transparent with NLP, spaCy and Prodigy

https://explosion.ai/blog/sp-global-commodities

Fallstudie zu einem System für strukturierte Commodities-Trading-Insights von S&P Global mit Hilfe von LLMs und Human-in-the-Loop-Destillation

More Decks by Ines Montani

Other Decks in Technology

Transcript

  1. Ines Montani Gründerin und CEO von Explosion Open-Source-Bibliothek für Natural

    Language Processing spacy.io 340m+ Downloads explosion.ai
  2. Ines Montani Gründerin und CEO von Explosion Open-Source-Bibliothek für Natural

    Language Processing spacy.io 340m+ Downloads Modernes Annotationstool für Machine-Learning-Entwickler prodigy.ai 10.000+ Nutzer explosion.ai
  3. ines.io/blog/window-knocking-machine-test Hallo, ich bin Tonis virtueller Assistent und helfe bei

    der Terminbuchung. Hast du Montag um 13 : 00 Zeit? Nein, aber Dienstag würde passen. Okay, bitte bestätige: Dienstag um 13 : 00? 13 Uhr ist schlecht, aber 15 Uhr geht. Toni hat leider keine Zeit um 15 : 00, aber ich könnte dir einen Slot um 16 : 00 oder 17 : 30 anbieten. Moment, welche Zeitzone ist das? Ich bin in CET.
  4. ines.io/blog/window-knocking-machine-test Hallo, ich bin Tonis virtueller Assistent und helfe bei

    der Terminbuchung. Hast du Montag um 13 : 00 Zeit? Nein, aber Dienstag würde passen. Okay, bitte bestätige: Dienstag um 13 : 00? 13 Uhr ist schlecht, aber 15 Uhr geht. Toni hat leider keine Zeit um 15 : 00, aber ich könnte dir einen Slot um 16 : 00 oder 17 : 30 anbieten. Moment, welche Zeitzone ist das? Ich bin in CET. Calendly
  5. ines.io/blog/window-knocking-machine-test Hallo, ich bin Tonis virtueller Assistent und helfe bei

    der Terminbuchung. Hast du Montag um 13 : 00 Zeit? Nein, aber Dienstag würde passen. Okay, bitte bestätige: Dienstag um 13 : 00? 13 Uhr ist schlecht, aber 15 Uhr geht. Toni hat leider keine Zeit um 15 : 00, aber ich könnte dir einen Slot um 16 : 00 oder 17 : 30 anbieten. Moment, welche Zeitzone ist das? Ich bin in CET. Calendly “Fensterklopfmaschine” “Wecker”
  6. 2024 Jahr Services Kategorie ACME Inc. FooBar GmbH NLPCorp XKCD

    Ltd. Python AG 432.032 82.000 1.500 193.000 91.320 2.625.032 € Kunden (28) Umsatz Was ist der Gesamtumsatz für Services in 2024? 2.923.531 € Wie viele Kuden sind das insgesamt? 29
  7. 2024 Jahr Services Kategorie ACME Inc. FooBar GmbH NLPCorp XKCD

    Ltd. Python AG 432.032 82.000 1.500 193.000 91.320 2.625.032 € Kunden (28) Umsatz Was ist der Gesamtumsatz für Services in 2024? 2.923.531 € Wie viele Kuden sind das insgesamt? 29 Modell Datenbank Agents Abfrage Retrieval-Augmented Generation (RAG)
  8. 2024 Jahr Services Kategorie ACME Inc. FooBar GmbH NLPCorp XKCD

    Ltd. Python AG 432.032 82.000 1.500 193.000 91.320 2.625.032 € Kunden (28) Umsatz Was ist der Gesamtumsatz für Services in 2024? 2.923.531 € Wie viele Kuden sind das insgesamt? 29 Modell Datenbank Agents Abfrage Retrieval-Augmented Generation (RAG) KI braucht nach wie vor Produktentscheidungen!
  9. lokales Geschäft richtet eigenständig Webseite ein +10% Kunden und Umsatz

    explosion.ai/blog/history-web-future-ai DECKE BODEN
  10. To-Do-Listen-App fügt automatische Übersetzung mit Hilfe von API hinzu +5%

    internationales Nutzerwachstum lokales Geschäft richtet eigenständig Webseite ein +10% Kunden und Umsatz explosion.ai/blog/history-web-future-ai DECKE BODEN
  11. Streaming-Anbieter macht Web-Player 1ms schneller +3% Zeit in der App

    pro Nutzer To-Do-Listen-App fügt automatische Übersetzung mit Hilfe von API hinzu +5% internationales Nutzerwachstum lokales Geschäft richtet eigenständig Webseite ein +10% Kunden und Umsatz explosion.ai/blog/history-web-future-ai DECKE BODEN
  12. Streaming-Anbieter macht Web-Player 1ms schneller +3% Zeit in der App

    pro Nutzer Hotelbuchungsplattform verbessert Empfehlungssystem +0.5% Click-Through-Rate, +1 Mio. € Umsatz To-Do-Listen-App fügt automatische Übersetzung mit Hilfe von API hinzu +5% internationales Nutzerwachstum lokales Geschäft richtet eigenständig Webseite ein +10% Kunden und Umsatz explosion.ai/blog/history-web-future-ai DECKE BODEN
  13. Streaming-Anbieter macht Web-Player 1ms schneller +3% Zeit in der App

    pro Nutzer Hotelbuchungsplattform verbessert Empfehlungssystem +0.5% Click-Through-Rate, +1 Mio. € Umsatz To-Do-Listen-App fügt automatische Übersetzung mit Hilfe von API hinzu +5% internationales Nutzerwachstum lokales Geschäft richtet eigenständig Webseite ein +10% Kunden und Umsatz explosion.ai/blog/history-web-future-ai DECKE BODEN hohe Verbreitung
  14. Streaming-Anbieter macht Web-Player 1ms schneller +3% Zeit in der App

    pro Nutzer Hotelbuchungsplattform verbessert Empfehlungssystem +0.5% Click-Through-Rate, +1 Mio. € Umsatz To-Do-Listen-App fügt automatische Übersetzung mit Hilfe von API hinzu +5% internationales Nutzerwachstum lokales Geschäft richtet eigenständig Webseite ein +10% Kunden und Umsatz explosion.ai/blog/history-web-future-ai hoher Wert DECKE BODEN hohe Verbreitung
  15. OPEN-SOURCE MODELLE aufgabenspezifische Modelle klein, meist schnell, günstig zu hosten,

    generalisieren nicht immer gut, benötigen Daten zum Finetuning
  16. OPEN-SOURCE MODELLE Encoder-Modelle ELECTRA T5 aufgabenspezifische Modelle klein, meist schnell,

    günstig zu hosten, generalisieren nicht immer gut, benötigen Daten zum Finetuning
  17. OPEN-SOURCE MODELLE Encoder-Modelle ELECTRA T5 aufgabenspezifische Modelle klein, meist schnell,

    günstig zu hosten, generalisieren nicht immer gut, benötigen Daten zum Finetuning relativ klein und schnell, erschwinglich zu hosten, generalisieren gut, benötigen Daten zum Finetuning
  18. OPEN-SOURCE MODELLE Encoder-Modelle ELECTRA T5 aufgabenspezifische Modelle klein, meist schnell,

    günstig zu hosten, generalisieren nicht immer gut, benötigen Daten zum Finetuning relativ klein und schnell, erschwinglich zu hosten, generalisieren gut, benötigen Daten zum Finetuning große generative Modelle Falcon MIXTRAL
  19. OPEN-SOURCE MODELLE Encoder-Modelle ELECTRA T5 aufgabenspezifische Modelle klein, meist schnell,

    günstig zu hosten, generalisieren nicht immer gut, benötigen Daten zum Finetuning relativ klein und schnell, erschwinglich zu hosten, generalisieren gut, benötigen Daten zum Finetuning große generative Modelle Falcon MIXTRAL sehr groß, meist langsamer, teuer zu hosten, generalisieren sehr gut, benötigen keine oder kaum spezifische Daten
  20. ECONOMIES OF SCALE Größenvorteile Produktion Kosten OpenAI Google Zugang zu

    Fachkräften, Rechenleistung etc. spacy.fyi/ai-revolution
  21. ECONOMIES OF SCALE Größenvorteile Produktion Kosten OpenAI Google Zugang zu

    Fachkräften, Rechenleistung etc. Batch-Verarbeitung von API-Anfragen spacy.fyi/ai-revolution
  22. ECONOMIES OF SCALE Größenvorteile Produktion Kosten OpenAI Google Zugang zu

    Fachkräften, Rechenleistung etc. Batch-Verarbeitung von API-Anfragen hoher Tra ff ic niedriger Tra ff ic Batch … spacy.fyi/ai-revolution
  23. ECONOMIES OF SCALE Größenvorteile Produktion Kosten OpenAI Google du Zugang

    zu Fachkräften, Rechenleistung etc. Batch-Verarbeitung von API-Anfragen hoher Tra ff ic niedriger Tra ff ic Batch … spacy.fyi/ai-revolution
  24. statische Seiten WEB dynamische Seiten statische Seiten kompiliere statische Daten

    im Build-Prozess explosion.ai/blog/history-web-future-ai
  25. statische Seiten WEB eigene Modelle KI dynamische Seiten statische Seiten

    kompiliere statische Daten im Build-Prozess explosion.ai/blog/history-web-future-ai
  26. statische Seiten WEB eigene Modelle KI dynamische Seiten statische Seiten

    vortrainierte Modelle kompiliere statische Daten im Build-Prozess explosion.ai/blog/history-web-future-ai
  27. statische Seiten WEB eigene Modelle KI dynamische Seiten statische Seiten

    eigene Modelle vortrainierte Modelle kompiliere statische Daten im Build-Prozess explosion.ai/blog/history-web-future-ai
  28. statische Seiten WEB eigene Modelle KI dynamische Seiten statische Seiten

    eigene Modelle destilliere Modelle in kleinere, schnellere und private Komponenten vortrainierte Modelle kompiliere statische Daten im Build-Prozess explosion.ai/blog/history-web-future-ai
  29. S&P Global: Extraktion von strukturierten Attributen aus Commodities-Trading-Insights in Echtzeit

    6mb Dateigröße 16k+ Wörter/Sek. 99% F-Score explosion.ai/blog/sp-global-commodities
  30. S&P Global: Extraktion von strukturierten Attributen aus Commodities-Trading-Insights in Echtzeit

    Hochsicherheitsumgebung 6mb Dateigröße 16k+ Wörter/Sek. 99% F-Score explosion.ai/blog/sp-global-commodities
  31. S&P Global: Extraktion von strukturierten Attributen aus Commodities-Trading-Insights in Echtzeit

    Hochsicherheitsumgebung Lösung nutzt LLMs für Annotation 6mb Dateigröße 16k+ Wörter/Sek. 99% F-Score explosion.ai/blog/sp-global-commodities
  32. S&P Global: Extraktion von strukturierten Attributen aus Commodities-Trading-Insights in Echtzeit

    Hochsicherheitsumgebung Lösung nutzt LLMs für Annotation 10× schnellere Datenentwicklung mit Hilfe von Menschen und Modell 6mb Dateigröße 16k+ Wörter/Sek. 99% F-Score explosion.ai/blog/sp-global-commodities
  33. S&P Global: Extraktion von strukturierten Attributen aus Commodities-Trading-Insights in Echtzeit

    Hochsicherheitsumgebung Lösung nutzt LLMs für Annotation 10× schnellere Datenentwicklung mit Hilfe von Menschen und Modell 6mb Dateigröße 16k+ Wörter/Sek. 99% F-Score explosion.ai/blog/sp-global-commodities
  34. modular testbar flexibel kein Lock-In günstig zu hosten erweiterbar laufen

    intern programmierbar DESTILLIERTE AUFGABENSPEZIFISCHE MODELLE
  35. modular testbar flexibel berechenbar kein Lock-In günstig zu hosten erweiterbar

    laufen intern programmierbar DESTILLIERTE AUFGABENSPEZIFISCHE MODELLE
  36. modular testbar flexibel berechenbar transparent kein Lock-In günstig zu hosten

    erweiterbar laufen intern programmierbar DESTILLIERTE AUFGABENSPEZIFISCHE MODELLE
  37. modular testbar flexibel berechenbar transparent kein Lock-In günstig zu hosten

    erweiterbar laufen intern programmierbar DESTILLIERTE AUFGABENSPEZIFISCHE MODELLE
  38. Entwickle selbst. Der Entwicklungsprozess gibt uns die Kontrolle zurück. LLM

    Denke weiter. KI kann mehr als nur Chatbots. Vorsicht vor Fensterklopfmaschinen!
  39. Entwickle selbst. Der Entwicklungsprozess gibt uns die Kontrolle zurück. LLM

    Bleib ehrgeizig. Es gibt keinen Grund für Kompromisse bei Best Practices, E izienz und Privatsphäre. NLP Denke weiter. KI kann mehr als nur Chatbots. Vorsicht vor Fensterklopfmaschinen!
  40. Entwickle selbst. Der Entwicklungsprozess gibt uns die Kontrolle zurück. LLM

    Bleib ehrgeizig. Es gibt keinen Grund für Kompromisse bei Best Practices, E izienz und Privatsphäre. NLP Denke weiter. KI kann mehr als nur Chatbots. Vorsicht vor Fensterklopfmaschinen! Wir sind nach wie vor am Anfang!