Evaluationsstruktur ‚Lernen mit GMLS‘

Derzeit werden allerorten empirische Untersuchungen durchgeführt, wie gut generative Machine-Learning-Systeme (Biblionetz:w02833) sich zum Lernen eignen. Zur Einordnung: GMLS in der Bildung (Biblionetz:w03434), Lernen MIT GMLS. Da viele dieser Untersuchungen ähnlich aufgebaut …

 

Derzeit werden allerorten empirische Untersuchungen durchgeführt, wie gut generative Machine-Learning-Systeme (Biblionetz:w02833) sich zum Lernen eignen. Zur Einordnung: GMLS in der Bildung (Biblionetz:w03434), Lernen MIT GMLS.

Da viele dieser Untersuchungen ähnlich aufgebaut sind, habe ich mir die Grundstruktur solcher Evaluationen aufgezeichnet :

In vielen Untersuchungen wird ein speziell fürs Lernen oder gar speziell für ein Thema gebautes oder konfiguriertes GMLS untersucht. Es werden meist drei Gruppen von Proband:innen gebildet:

  • Gruppe A: Lernende ohne GMLS-Unterstützung (die Kontrollgruppe)
  • Gruppe B: Lernende mit adaptierter GMLS-Unterstützung (die Treatment-Gruppe)
  • Gruppe C: Lernen mit allgemeiner GMLS-Unterstützung

Es wird also nicht nur das Verhalten von Lernenden mit und ohne speziell erstelltem/konfiguriertem GMLS verglichen, sondern mit Hilfe der Gruppe C wird auch untersucht, ob Lernende mit einem speziell erstelltem/konfiguriertem GMLS besser abschneiden als mit einem allgemein verfügbaren Standardprodukt.

Die speziell erstellten/konfigurierten GMLS unterscheiden sich von Standardprodukten meist durch spezifische (zusätzliche) Trainingsdaten (z.B. fach- oder themenspezifisches Material) und/oder spezifische didaktische Anweisungen an das GMLS (z.B. die Aufforderung, nur Hinweise, nicht aber die Lösung für Probleme zu verraten).

Die Leistungen der Lernenden werden sodann in zwei oder drei Untersuchungen geprüft:

  • T1: Leistungsmessung vor der Versuchsphase (wo man im Idealfall identische Leistungen in allen drei Gruppen erhofft)
  • T2: Leistungsmessung nach der Versuchsphase unter Zuhilfenahme des GMLS (die Lernenden der Gruppen B und C dürfen also in ihrer Gruppe verfügbare Werkzeug weiterhin verwenden).
  • T3: Leistungsmessung nach der Versuchsphase, aber ohne Zuhilfenahme des GMLS (alle drei Gruppen lösen die Aufgaben ohne GMLS).

Eine Leistungsmessung T3 (die zeitlich durchaus praktisch zeitgleich wie T2 stattfinden kann) soll prüfen, ob die Lernenden auch bessere Leistungen als zum Zeitpunkt T1 zeigen, wenn sie das neue Werkzeug nicht mehr zur Verfügung haben. Damit soll meist geprüft werden, ob die Lernenden dank GMLS auch gelernt haben, entsprechende Probleme ohne GMLS zu lösen.

Beispiele solcher Untersuchungen

  • Peter Kießling, Florian Funke, Sven Hofmann (2024).
    Entwicklung und Evaluation einer KI-Assistenz zur didaktisch-pädagogischen Unterstützung des Lernprozesses mit Programmieraufgaben
    Biblionetz:t31890

 

Weitere Blogbeiträge aus dem zITBOx Netzwerk

img002 oOI1Gq

Was heisst eigentlich «Handyverbot»?

Ist die Rede von einem Handyverbot in der Schule (Biblionetz:w02202), so scheint die Sache klar: Handys sind halt verboten in der Schule. Doch so einfach ist es eben nicht und …

upc 01 NTBwj7

Niemand hat die Absicht den UKW-Empfang per Kabel abzuschalten

UPS.ch schreibt am 5.10.2025 auf ihrer Website: "Bei UPC gibt es keine Pläne, in nächster Zeit das bestehende UKW-Angebot über das eigene Glasfaserkabelnetz zu reduzieren oder ganz abzuschalten." …

eduslop 04 OhB95x

eduslop

Diese Woche wurde ein neues Wort erfunden, das mir sofort gefallen hat: workslop (Biblionetz:w03723). Geprägt haben dies Forschende am BetterUp Lab zusammen mit dem Stanford Social Media Lab. Analog zu …