ChatGPT bewertet Hypothesen nach Zufall
Washington State University: Bei stiegendem Komplexitätsgrad fallen Antworten zweideutig aus
|
|
Interaktion: Bei komplizierten Fragen ist die KI oftmals ratlos (Bild: Mohamed Hassan, pixabay.com)
|
Pulman (pte001/18.03.2026/06:00)
Mit der in den USA gebräuchlichen Note D, die dem deutschen "Ausreichend", also "gerade noch bestanden" entspricht, bewertet Mesut Cicek von der Washington State University ChatGPT. Die Künstliche Intelligenz (KI) sollte in einem groß angelegten Test Hypothesen aus wissenschaftlichen Artikeln prüfen und sagen, ob diese durch allgemein anerkannte Forschungsergebnisse gestützt werden. Jede Abfrage wiederholten sie zehnmal.
Profitieren Sie von
unabhängigem Journalismus!
Lesen Sie mit pressetext Abo+ weiter und unterstützen Sie
Qualitätsberichterstattung für nur 1 EUR pro Woche!
Das Angebot beläuft sich auf 1 EUR pro Woche bzw. 49 EUR im Jahr
– und das, solange Sie wollen. Sie bleiben flexibel, denn Ihr pressetext Abo+
passt sich an Ihre Lesegewohnheiten an und ist jederzeit kündbar
