ChatGPT fast gut so wie menschlicher Prüfer
Freitextantworten von Studenten eines Makroökonomie-Kurses auf sechs Fragen genutzt
![]() |
Johann Graf Lambsdorff: Forscher hält Menschen für unersetzbar (Foto: uni-passau.de) |
Passau (pte016/27.10.2025/11:30)
Laut einer neuen Studie der Universität Passau zeigt das Sprachmodell GPT von OpenAI eine zu menschlichen Prüfern ähnliche Leistung beim Einordnen von Freitextantworten. Trotzdem können sie Menschen nicht ersetzen, so die Forscher. Details sind in "Scientific Reports" nachzulesen.
Nur kritischer Zweitprüfer
"Musterlösungen und Nachprüfung müssen menschliche Eingriffe bleiben", resümiert der Passauer Experte Johann Graf Lambsdorff. Als kritische Zweitprüferin sei KI aber durchaus geeignet.
Für das Experiment haben die Forscher Freitextantworten von Studenten eines Makroökonomie-Kurses auf sechs Fragen genutzt. Pro Frage wählte das Team 50 Antworten aus. Die 300 Antworten ließ es von geschulten Korrekturassistenten bewerten. Parallel dazu erhielt GPT dieselbe Bewertungsaufgabe.
GPT-4 blieb weitgehend stabil
Kollege Abdullah Al Zubaer ergänzt: "In unseren Tests blieb die Qualität von GPT-4 auch bei unpräzisen oder fehlerhaften Instruktionen weitgehend stabil." Das zeigt dem Team zufolge, dass KI robust und vielseitig einsetzbar ist, auch wenn sie bei Punktbewertungen noch leicht schwächere Leistungen aufweist.
(Ende)| Aussender: | pressetext.redaktion |
| Ansprechpartner: | Florian Fügemann |
| Tel.: | +43-1-81140-313 |
| E-Mail: | fuegemann@pressetext.com |
| Website: | www.pressetext.com |


