Agentic RAG auf Basis von Claude Haiku und Sonnet mit MCP und AWS Bedrock_00_hero-2

Agentic RAG auf Basis von Claude Haiku und Sonnet mit MCP und AWS Bedrock

Um Marketing-Spezialisten im Unternehmen dabei zu unterstützen, große und verteilte Informationsmengen einfacher und schneller zu nutzen, hat Vention ein internes agentic RAG-System entwickelt, das auf Modellen von Anthropic AI basiert und auf AWS betrieben wird.

Hintergrund

Das Projekt ist eine interne Initiative von Vention mit dem Ziel, den Zugriff auf Daten aus unterschiedlichen Quellen zu vereinheitlichen und zu beschleunigen – darunter Salesforce, interne Speicher und verschiedene Marketing-Systeme.

Im Marketing fallen täglich große Mengen verteilter Informationen an, was es erschwert, schnell und zuverlässig genau die relevanten Daten zu finden. Um dieses Problem zu lösen, hat das KI-Team von Vention ein bewusst konzipiertes agentic RAG-System auf Basis von Claude entwickelt.

Die Plattform soll es ermöglichen, Informationen deutlich schneller und präziser zu finden und zu nutzen, sodass Anfragen nach Marketing-Materialien effizienter beantwortet werden können.

Projektdetails

Das Marketing-Team von Vention arbeitet mit großen Datenmengen aus unterschiedlichen Quellen, darunter:

  • „Bragging Lists“, die die wichtigsten Erfolge des Unternehmens dokumentieren
  • proprietäre Research-Daten zu Kunden-Personas und Märkten
  • Richtlinien für spezifische Aufgaben und Marketing-Funktionen
  • interne und externe Events
  • bestehende Marketing-Materialien

Wenn eine Anfrage für neue Marketing-Materialien eingeht, liegt die zentrale Herausforderung darin, aktuelle und faktisch korrekte Informationen zu finden und zusammenzuführen. Die relevanten Inhalte sind über verschiedene Boards verteilt und werden von unterschiedlichen Teams und Beitragenden gepflegt, was den schnellen Zugriff auf die passenden Informationen zusätzlich erschwert.

KI-Agent für Ihr Team?

Vention entwickelt agentic RAG-Systeme auf Basis von Claude und AWS Bedrock, die verteiltes Wissen in nutzbare Ergebnisse überführen – von der ersten Proof-of-Concept-Phase bis zur Produktion.

Sprechen Sie mit unserem KI-Engineering-Team

Unsere Lösung

Die KI-Experten von Vention arbeiteten eng mit der Marketing-Abteilung zusammen, um ein RAG-System zu entwickeln, das den langfristigen Anforderungen des Marketingteams gerecht wird.um ein RAG-System zu entwickeln, das den langfristigen Anforderungen des Marketingteams gerecht wird.

Die Lösung bestand aus folgenden Modulen:

  • Eine Webanwendung für interne Nutzer, über die Marketer Anfragen stellen und Ergebnisse abrufen können
  • Eine Orchestrierungsschicht auf Basis von AWS Bedrock Agents, die Anfragen zwischen Claude Haiku und Sonnet verteilt und die Nutzung von Tools koordiniert
  • Eine auf AWS gehostete Datenebene mit Data Lake, Vektordatenbank und MCP-Server für präzise Datenabfragen
  • Ein zweimodelliger RAG-Core (Haiku und Sonnet), der effiziente und zuverlässige Informationsretrieval-Prozesse ermöglicht
  • AWS-Lambda-Funktionen zur Automatisierung und zum Routing von Anfragen innerhalb des Systems

Web-App

Die Web-App diente als zentrale Schnittstelle zwischen dem System und den Marketing-Spezialisten. Die Oberfläche war als chatbasiertes Arbeitsumfeld gestaltet, in dem Nutzer mit Claude Haiku in natürlicher Sprache interagierten, den Gesprächsverlauf einsehen konnten und bei Bedarf Dateien anhängten.

Request Processing über Haiku

Als leichtestes Modell innerhalb der Claude-Familie wurde Haiku für die Aufbereitung und das Routing von Anfragen im System eingesetzt.

Nach Eingang einer Nutzeranfrage zerlegte Haiku diese in konkretere Bestandteile, um einen präziseren Prompt zu erstellen, identifizierte die benötigten Informationen zur Bearbeitung der Anfrage und holte relevante Daten aus dem Storage.

Je nach Anwendungsfall ergaben sich zwei mögliche Pfade:

  • Bei faktenorientierten Anfragen (z. B. „Haben wir eine Case Study mit Unternehmen X?“) lieferte Haiku direkt eine Antwort zurück.
  • Bei anforderungsreicheren, kreativen Aufgaben (z. B. „Hilf mir, eine faktenbasierte Grundlage für ein Y-Deck zu erstellen“) sammelte Haiku zunächst die relevanten Informationen aus dem internen Storage, verfolgte die Anfrage weiter und übergab sie anschließend zusammen mit Kontext und Nutzereingabe an Sonnet zur Generierung. Nach der Erstellung durch Sonnet wurde das Ergebnis wieder von Haiku an die Nutzer zurückgegeben.

Interne Datenhaltung, MCP, Caching und API-Integrationen

Um die Transparenz und Effizienz zu verbessern, wurde das System so konzipiert, dass es sich in die internen Monday-Boards des Marketings integriert und häufig abgefragte Inhalte – etwa „Bragging Lists“ oder aktuelle Case Studies – für schnelleren Zugriff zwischenspeichert.

Eine lokale SQLite-Datenbank dient als Cache für wiederkehrende Anfragen und kann Antworten direkt aus dem Zwischenspeicher bereitstellen, sofern sie dort verfügbar sind. Dadurch werden API-Aufrufe reduziert und die Antwortzeiten deutlich verkürzt.

Über die Integration von Monday mittels eines MCP-Gateways erhält das agentic RAG-System eine zusätzliche Kontextebene innerhalb der Marketing-Workflows. Wenn beispielsweise Informationen zu Security-Services für ein Deck angefragt werden, kann der Agent nicht nur die aktuellsten Materialien bereitstellen, sondern auch verwandte Inhalte anzeigen, die sich noch in Bearbeitung befinden und voraussichtlich bald verfügbar sein werden. So können Teams fundiertere Entscheidungen darüber treffen, welche Inhalte in die jeweilige Präsentation aufgenommen werden.

In Zahlen

4

Wochen für die Entwicklung eines PoC

15%

weniger Nachbearbeitung

40%

weniger Zeit für die interne Informationssuche

Ergebnisse

Die Arbeit des Vention-Teams hat zu einer 40 % Reduktion der Zeit geführt, die für das Abrufen von Informationen aus internen Quellen benötigt wird. Dadurch konnte sich Marketing-Team stärker auf kreative Aufgaben konzentrieren.

Der verbesserte Informationszugang erhöhte die Übersicht über relevante Inhalte und reduzierte den Zeitaufwand für die Anpassung von Inhalten in Marketing-Materialien um rund 15 %. Die gesteigerte Effizienz wirkte sich auch auf die täglichen Workflows aus, in denen relevante Informationen über verschiedene Aufgaben hinweg leichter gefunden und genutzt werden konnten.

Auf Basis dieser Ergebnisse ging das Team in die PoC-Entwicklung und das Testing über. Die nächsten Schritte konzentrieren sich auf die Validierung der Monday-Integration sowie die Vorbereitung der MVP-Phase und eines breiteren Rollouts.

Tools & Technologien

Frontend

Next.js

Cloud

AWS

AWS Lambda

Bedrock Agents

KI

Claude Haiku

Claude Sonnet auf AWS Bedrock

Architektur des Agenten

MCP Server

Speicher und Datenbanken

Amazon S3

OpenSearch Serverless

Integrationen

Monday.com

API

MCP

Authentifizierung/Sicherheit

Amazon Cognito

Amazon Secrets Manager

FAQs

Was ist ein agentic RAG-System?

Ein agentic RAG-System kombiniert Retrieval-Augmented Generation mit einer Orchestrierungsschicht, die Nutzeranfragen in einzelne Schritte zerlegen, relevante Daten abrufen und entscheiden kann, wie diese verarbeitet werden. Statt eines einfachen Prompt-Response-Ansatzes werden Aufgaben über verschiedene Modelle, Tools und Datenquellen hinweg gesteuert, um präzisere und kontextbezogene Ergebnisse zu erzeugen.

Warum werden zwei Claude-Modelle statt eines verwendet?

Im System von Vention übernehmen Claude Haiku und Sonnet unterschiedliche Rollen. Haiku ist für das Zerlegen von Anfragen, das Routing und die Datenabfrage zuständig, wo Geschwindigkeit und Kosteneffizienz entscheidend sind. Sonnet übernimmt komplexere Schlussfolgerungen und die Generierung von Inhalten. Diese Aufgabenteilung sorgt dafür, dass das System reaktionsschnell bleibt und gleichzeitig eine hohe Ausgabequalität liefert.

Wie funktioniert MCP in dieser Architektur?

MCP (Model Context Protocol) fungiert als Schnittstelle zwischen dem Modell und externen Systemen. Es definiert, wie der Agent auf Tools wie APIs, Datenbanken und interne Plattformen wie Monday zugreift. In der Architektur von Vention ermöglicht MCP eine strukturierte Datenabfrage sowie eine konsistente Interaktion zwischen dem RAG-System und den angebundenen Services.

Kontaktieren Sie uns

0 / 2048