Vor rund eineinhalb Jahren haben wir gemeinsam mit you.com damit begonnen, einen KI-gestützten Rechercheassistenten auf Basis unseres Archivs und des aktuellen News-Feeds zu entwickeln. Heute können wir sagen: Diese Zusammenarbeit war für uns ein wichtiger Beschleuniger. Sie hat uns ermöglicht, sehr früh mit einem marktfähigen Produkt Erfahrungen zu sammeln, echtes Kundenfeedback zu erhalten und die technischen wie redaktionellen Anforderungen an ein journalistisches RAG-System präzise zu verstehen. Jetzt bauen wir auf diesen Erfahrungen auf und übernehmen den Betrieb auf unserer eigenen KI-Infrastruktur dpa-iq selbst.
Ab sofort und bis Sommer 2026 migrieren wir den dpa-KI-Rechercheassistenten auf unsere eigene Infrastruktur und betreiben ihn selbst. Unsere Kundinnen und Kunden sowie unsere eigene Redaktion werden davon so gut wie nichts mitbekommen. Die Arbeiten dazu laufen bereits seit einiger Zeit, dank unseres KI-Teams (siehe Bild oben), das seit Januar 2025 bei dpa am Start ist und das wir beständig ausbauen wollen.
Der Anfang: Schnell ins Tun kommen
Herbst 2024: Gemeinsam mit you.com, einem vom deutschen KI-Wissenschaftler Richard Socher im Silicon Valley gegründeten Generative-KI-Pionier-Startup, starten wir ein ambitioniertes Projekt: ein Retrieval Augmented Generation System (RAG), das das dpa-Text-Archiv ab 2020 für Journalistinnen und Journalisten per Sprachbefehl durchsuchbar macht und Zusammenfassungen generiert inklusive Quellenverweis. Und schon im ersten gemeinsamen Workshop in Hamburg wurde klar: Das wird funktionieren. Über Nacht integrierte das you.com-Team die ersten Daten. Innerhalb von 24 Stunden waren erste Antworten auf Basis echter dpa-Meldungen sichtbar.

Was wir in 18 Monaten gelernt haben
Was folgte, war eine intensive Lernkurve – technisch, redaktionell und strategisch. In fünf Entwicklungsschritten haben wir aus einem Prototyp ein Produkt gemacht:
- API-Anbindung und erste Datenintegration: Nach dem Kick-off-Workshop wurden die Schnittstellen verknüpft und erste Antworten auf Basis von dpa-Daten generiert. Der Grundstein war gelegt.
- Archiv-Erweiterung und Finetuning: Wir integrierten das dpa-Archiv bis zurück ins Jahr 2020. Entscheidend war nicht nur die Datenmenge, sondern auch das Finetuning: Das System lernte, mit den unterschiedlichen Meldungstypen der dpa umzugehen, zum Beispiel auch mit den eher seltenen Blitzmeldungen, die nur aus einer Headline bestehen. Und es lernte, was Journalismus von einer KI-Antwortmaschine unterscheiden muss: keine Halluzinationen!
- Echtzeit-Daten als Qualitätsmerkmal: Über das Echtzeit-Produkt Digital Wires werden neue Nachrichten seither nahezu in Echtzeit – innerhalb einer Minute – in die Datenbank aufgenommen. Auch der Umgang mit korrigierten oder zurückgezogenen Meldungen haben wir sauber gelöst.
- Vom Prototyp zum nutzbaren Produkt: Das dpa-Team baute eine intuitive Benutzeroberfläche, die jede Antwort transparent mit den zugrunde liegenden dpa-Quellen verknüpft. Nutzerinnen und Nutzer können Antworten per Daumen-hoch/-runter bewerten.
- Systematisches Testen, Evaluieren, Guardrails definieren: KI-affine Redakteurinnen und Redakteure aus verschiedenen Ressorts haben das System von Anfang an getestet, mit klaren Qualitätskriterien. So haben wir unser RAG kontinuierlich verbessert und dabei gelernt, wie man KI-Systeme journalistisch bewertet. Auch haben wir viel darüber gelernt, wie wichtig das umsichtige Definieren von Guardrails ist.
RAG als Kernkompetenz – die entscheidende Erkenntnis
All diese Erfahrungen haben uns zu einer zentralen Erkenntnis geführt: Aus dem Projekt ist für uns eine strategische Kernkompetenz entstanden. Ab Januar 2025 haben wir mit KI-Team-Lead Yannick Franke ein eigenes KI-Team aufgebaut mit mittlerweile drei AI Engineers, die von Anfang an mit you.com zusammengearbeitet haben. Schnell wurde klar: Ein RAG auf Basis des dpa-Archivs ist mehr als ein nützliches Tool. Es ist ein Herzstück unseres KI-Angebots für Redaktionen.
Denn die Kunden haben uns schnell wertvolles Feedback gegeben: Sie wollen solche Anwendungen direkt ins eigene Redaktionssystem integrieren, wünschen sich mehr Datenquellen bis hin zu dem Wunsch, dass eigene Kundendaten mit integriert werden sollten. In Summe bedeutet das für uns: Daten, Infrastruktur und Produktentwicklung wollen wir noch enger selbst steuern.
Das versetzt uns künftig in die Lage, schneller neue Datenquellen einzubinden, die Qualität der Ausgaben gezielt zu verbessern – und das alles in engem Austausch mit unseren Kundinnen und Kunden. Deshalb haben wir die Entscheidung getroffen, den dpa-KI-Rechercheassistenten zum Teil unserer neuen KI-Infrastruktur dpa iQ werden zu lassen. Wir migrieren das Angebot über den Sommer in unseren eigenen Betrieb.
Was wir mit you.com erreicht haben
Die Zusammenarbeit mit you.com war für uns außerordentlich wertvoll. Sie hat uns ermöglicht, in kürzester Zeit von der Idee zur Realität zu gelangen, mit hoher Geschwindigkeit, klarer Lernkurve und überschaubarem Risiko. Statt an der Seitenlinie zu stehen und theoretisches Wissen zu analysieren, sind wir in die Mitte des Spielfelds gerückt und haben angefangen, sofort mitzuspielen. Nur so konnten wir schnell lernen und realisieren, was ein RAG-System für einen Nachrichtenanbieter wie dpa ausmacht.
Einfach anfangen, Erfahrungen sammeln, ins Handeln kommen – gemeinsam mit einem Partner wie you.com war genau das für uns möglich. Genauso werden wir es auf dem sich rasant entwickelnden Spielfeld der generativen KI weiter handhaben. Das passt zu Erkenntnissen aus der Innovationsforschung: Tradierte Unternehmen sind innovativer, wenn sie gerade in der Test-Phase neuer Technologien mit Startups kooperieren.

Eigene KI-Infrastruktur
Die KI gestützte dpa-Recherche bleibt, was sie ist: eine Antwortmaschine für den redaktionellen Nachrichtenalltag, der Journalistinnen und Journalisten hilft, schneller in Themen zu kommen und den berühmten „Weiße-Blatt-Papier-Moment“ schneller zu überwinden. Jetzt wird sie Teil der dpa-eigenen KI-Infrastruktur.
Interesse an dpa-Recherche? Sprechen Sie uns an: ki@dpa.com
Fotos: Aufmacher und KI-Recherche-Test (Michael Kappeler), Richard Socher (Annette Riedl).
NOTIZBLOCK: