pte20251027016 in Forschung

ChatGPT fast gut so wie menschlicher Prüfer

Freitextantworten von Studenten eines Makroökonomie-Kurses auf sechs Fragen genutzt


Johann Graf Lambsdorff: Forscher hält Menschen für unersetzbar (Foto: uni-passau.de)
Johann Graf Lambsdorff: Forscher hält Menschen für unersetzbar (Foto: uni-passau.de)

Passau (pte016/27.10.2025/11:30)

Laut einer neuen Studie der Universität Passau zeigt das Sprachmodell GPT von OpenAI eine zu menschlichen Prüfern ähnliche Leistung beim Einordnen von Freitextantworten. Trotzdem können sie Menschen nicht ersetzen, so die Forscher. Details sind in "Scientific Reports" nachzulesen.

Nur kritischer Zweitprüfer

"Musterlösungen und Nachprüfung müssen menschliche Eingriffe bleiben", resümiert der Passauer Experte Johann Graf Lambsdorff. Als kritische Zweitprüferin sei KI aber durchaus geeignet.

Für das Experiment haben die Forscher Freitextantworten von Studenten eines Makroökonomie-Kurses auf sechs Fragen genutzt. Pro Frage wählte das Team 50 Antworten aus. Die 300 Antworten ließ es von geschulten Korrekturassistenten bewerten. Parallel dazu erhielt GPT dieselbe Bewertungsaufgabe.

GPT-4 blieb weitgehend stabil

Kollege Abdullah Al Zubaer ergänzt: "In unseren Tests blieb die Qualität von GPT-4 auch bei unpräzisen oder fehlerhaften Instruktionen weitgehend stabil." Das zeigt dem Team zufolge, dass KI robust und vielseitig einsetzbar ist, auch wenn sie bei Punktbewertungen noch leicht schwächere Leistungen aufweist.

(Ende)
Aussender: pressetext.redaktion
Ansprechpartner: Florian Fügemann
Tel.: +43-1-81140-313
E-Mail: fuegemann@pressetext.com
Website: www.pressetext.com
|