KI-Tool erleichtert Journalisten die Recherche
TH-Köln-Chatbot unterstützt bei der Auswertung umfangreicher und komplexer Datenbestände
![]() |
KI-Assistent: Wirtschaftsjournalisten profitieren von Chatbot (KI-Bild: RALPH_GERMANY, pixabay.com) |
Köln (pte014/23.01.2026/12:30)
Forscher der Technischen Hochschule Köln (TH Köln) haben einen KI-basierten Chatbot für Wissenschaftsjournalisten entwickelt. Dieser unterstützt bei der Auswertung umfangreicher und komplexer Datenbestände. Einige Teile der Open-Source-Software sind frei zugänglich.
Hochspezifische Suche
"Klassische Suchsysteme liefern einfache Trefferlisten, die mühselig einzeln geprüft werden müssen. Das macht die Recherche zeitintensiv. Und da sie zudem meist nur den Volltext durchsuchen, können wichtige Daten, beispielsweise in Tabellen, unentdeckt bleiben", so Entwickler Philipp Schaer.
Die Software-Bibliothek ermöglicht es im Rahmen des Projekts "Journalistic Information Extraction", Inhalte aus wissenschaftlichen Dokumenten mithilfe definierter Regeln zu extrahieren und durchsuchbar zu machen. In einem darauffolgenden Schritt wird ein modernerer Ansatz auf Basis von semantischen Textrepräsentationen und "Large Language Models" genutzt, um Texte und Tabellen auch inhaltlich zu verarbeiten.
Test mit COVID-19-Daten
Um die Software zu evaluieren, haben die Experten Suchanfragen mit einer standardisierten Testkollektion zur COVID-19-Pandemie mit über 160.000 Dokumenten durchgeführt. Ein erweiterter Suchzugang mit Tabellen und nichttextlichen Infos hat bei dem System zu deutlich besseren Ergebnissen geführt als klassische Keyword-Suchen, heißt es.
"Dies kann zu einer qualitativ besseren und schnelleren journalistischen Aufbereitung wissenschaftlicher Erkenntnisse beitragen", unterstreicht Schaer. Das Science Media Center Germany wird die Software für interne Zwecke weiterentwickeln, sagen die Wissenschaftler. Einzelne Bausteine sind auf der Entwicklungsplattform GitHub frei verfügbar.
Dazu gehören die zielgruppenspezifische Evaluation von Text-Komplexität, die kontextsensitive Simulation von Suchverhalten, die Simulation von Tabellensuche sowie die Extraktion und RAG System mit Evaluation.
(Ende)| Aussender: | pressetext.redaktion |
| Ansprechpartner: | Florian Fügemann |
| Tel.: | +43-1-81140-313 |
| E-Mail: | fuegemann@pressetext.com |
| Website: | www.pressetext.com |


