Messfehler bei der Notenvergabe und Gegenmaßnahmen

Prüfungen stellen Messungen von Leistungen dar. Wie alle Messungen sind auch Prüfungen immer mit größeren oder kleineren Messfehlern verbunden. Diese Messfehler können z.B. dazu führen, dass eine mit der Note „3 = befriedigend“ bewertete Leistung eigentlich eine bessere oder schlechtere Note verdient hätte. Auch schon die Beurteilung, ob ein gestecktes Lernziel erreicht wurde oder nicht, ist mit Messfehlern behaftet.
Messfehler bei der Notenvergabe haben unterschiedliche Ursachen:
  • Leistungsüberprüfungen erfassen immer nur Ausschnitte der eigentlichen Leistungsfähigkeit der Schüler/innen, denn Prüfungen enthalten nur eine kleine Auswahl der möglichen Fragen und Aufgaben und testen kaum jemals ganze Bereiche.
  • Die Kinder und Jugendlichen haben in einer aktuellen Prüfungssituation eine Tagesform, die zu anderen Zeitpunkten ganz anders sein kann. Und auch die Rahmenbedingungen der Prüfungssituation (Lärm, Beleuchtung, Belüftung, vorausgehende Ereignisse usw.) können mehr oder weniger günstig sein.
  • Schüler/innen zeigen in Prüfungen immer nur ihr Prüfungskönnen (ihre Performanz) und nicht ihr eigentliches Können (ihr Grundkönnen bzw. ihre Kompetenz). Das eigentliche Können kann aufgrund des gezeigten Prüfungskönnens nur geschätzt werden. Solche Schätzungen sind mit größeren oder kleineren Fehlern verbunden.
  • Kurze Prüfungen mit wenigen Aufgaben haben besonders große Messfehler. Man erfasst nur einen kleinen Ausschnitt aus dem Grundkönnen (der Kompetenz) der Schüler/innen, so dass Zufallseffekte sich besonders stark auswirken können. Dass umfangreichere Prüfungen zu einer Verringerung der Messfehler führen, gilt aber nur eingeschränkt: Irgendwann wird ein Punkt erreicht, wo es zu stärkeren Ermüdungseffekten kommt, welche die Messfehler wieder vergrößern. Anzustreben ist folglich ein altersgerechtes Mittelmaß hinsichtlich des Prüfungsumfanges.
  • Die Anlage einer Benotungsskala (s.a. „Anlegen einer Benotungsskala„) hat Konsequenzen für die Größe der Messfehler: Je breiter man den Punktbereich für eine Note auf der Skala anlegt, umso kleiner sind die Messfehler und je schmäler man ihn wählt, umso größer sind die Messfehler.
  • Mit der Vergabe der Extremnoten Eins und Sechs sind stets geringere Messfehler verbunden.Messfehler können bei diesen Noten nur in einer Richtung auftreten: Eine tatsächliche Einserleistung kann fälschlich schlechter, aber nicht besser beurteilt werden, und eine tatsächliche Sechserleistung fälschlich besser, aber nicht schlechter. Das lässt es vertretbar erscheinen, die Bereiche für die Eins und Sechs auf einer Benotungsskala etwas schmäler anzulegen, um dadurch etwas Spielraum für eine Verbreiterung der übrigen Notenbereiche zu gewinnen.
  • Benotungs-Entscheidungen müssen immer in pädagogischer Verantwortung getroffen werden, da jede Beurteilung und Note mit Messfehlern behaftet ist. Der sog. pädagogische Ermessensspielraum sollte genutzt werden. Es sollten nie ausschließlich mathematische Prozeduren über Leistungsbeurteilungen bestimmen.
  • Um Messfehler bei Leistungsbeurteilungen vertretbar klein zu halten (z.B. die Wahrscheinlichkeit ihres Auftretens auf maximal 5% zu begrenzen), sollte jede Notendifferenzierung durch solide Messungen belegt werden können. Im Schulalltag ist es im Allgemeinen nicht möglich, mehr als sechs Leistungsniveaus verlässlich zu unterscheiden, bei mündlichen und praktischen Leistungen kann man in der Regel sogar nur zwei oder drei sicher auseinanderhalten. Die Vergabe von Zwischennoten oder von Noten mit Nachkommastellen ist daher meistens nicht sinnvoll. Dadurch wird zwar die Beurteilung differenzierter, aber nicht die Schätzung genauer, die ihr nach wie vor zugrunde liegt. Wenn nicht gleichzeitig die Messungen präzisiert werden, erzeugt man auf diese Weise nur eine Genauigkeitsillusion.