1. Tag: 09:00 – 17:00 Uhr; 2 Tag: 08:30 – 16:30 Uhr
Anbindung & Auslesen von Datenquellen
- Datenintegration optimieren: Techniken und Best Practices für das Einlesen und Strukturieren von Daten
- Erstellen von Vektordatenbanken
++ Hands-On: Importieren und Verarbeiten von mindestens drei verschiedenen Dateiformaten. Experimentiere mit unstrukturierten Daten und analysieren Sie deren Anwendbarkeit.
++ Übung: Passe die Parameter eines Datenverarbeitungsprozesses an, um eine optimale Performance zu erreichen.
Effiziente Wissensverwaltung mit verschiedenen Datenbanken
- Speichern und Auslesen von Daten mit Vektordatenbanken
- Speichern und Auslesen von Daten mit Graphdatenbanken
- Optimierung der Datenpipeline je Datenbank
- Ausblick zu hybriden Datenbanksystemen
++ Übung: Entwickle eine Datenpipeline, die eine Vektordatenbank für schnelle Abfragen von embeddings nutzt.
++ Übung: Implementiere ein Wissensgraphmodell mit einer Graphdatenbank und evaluiere die Performance für verschiedene Abfrage-Szenarien.
++ Gruppenprojekt: Diskutiert Vor- und Nachteile hybrider Datenbanksysteme und entwickelt ein Konzept für deren Einsatz.
Fortgeschrittenes Prompt Engineering
- Mehrsprachigkeit
- Kontextoptimierung: Optimierung der Antworten auf die Fragestellung
- Begrenzter Zugriff des LLM auf globales Wissen
- Einbeziehen der Chat-Historie zur Antwortoptimierung
- Ausgabe von Referenzen und Quellen
++ Übung: Erstelle Prompts in verschiedenen Sprachen und optimiere die Antworten für spezifische Kontexte.
++ Übung: Integriere eine Methode, die vergangene Chat-Verläufe für die Kontextverarbeitung nutzt.
++ Herausforderung: Entwickle ein Modell, das beim Antworten Referenzen und Quellen korrekt anführt.
Methoden der RAG-Evaluierung
- Nutzung automatisierter Bewertungsmethoden
- Menschliche Evaluierung für verbesserte Qualitätssicherung
- Durchführung von A/B-Tests
- Robustheitsanalyse
++ Workshop: Entwickle ein Bewertungsskript für automatisierte Tests und führe eine menschliche Evaluation durch, um qualitative Unterschiede zu erkennen.
++ Übung: Setze einen A/B-Test auf, um zwei verschiedene RAG-Implementierungen zu vergleichen.
++ Diskussion: Nutzen und Grenzen von quantitativen und qualitativen Bewertungsansätzen im Kontext von RAG.
Ausblick
- LLMs auf eigenen Datensätzen nachtrainieren
++ Case Study: Implementiere ein einfaches Training eines LLM auf einem kleinen Datensatz und analysiere die Veränderungen der Modellleistung.
++ Gruppenprojekt: Entwickelt eine Strategie, wie ein Modell auf den eigenen Unternehmensdaten nachtrainiert werden könnte und diskutiert die Herausforderungen.