„Ihr habt ja jetzt ein Schulkind zu Hause, oder?“, frage ich eine andere Mutter am Freitag vor Beginn der Winterferien, „Gab es da heute das erste mal ein Zeugnis?“ „Ja, naja, so ähnlich wie ein Zeugnis… Ohne Noten… Nur so eine Beurteilung“, antwortet die Mutter. Ich höre eine Spur Enttäuschung in ihrer Stimme, während ich zuversichtlich bin. Denn qualitative Bewertungen, also solche mit Worten statt Zahlen, sind viel aussagekräftiger. Anders als eine 3 verrät eine schriftliche Ausführung wirklich etwas über das Lernen von Kindern.
Deutlich wurde mir das, als ich meine eigenen alten Zeugnisse durchlas.
In meinem Zeugnis aus Klasse 2 steht: „Den Zahlenaufbau bis 100 hat sie verstanden und rechnet Plus und Minus zügig und sicher. Die Einmaleinsreihen hat sie noch nicht vollständig gelernt. Sie fertigt gute geometrische Zeichnungen an“.
Ein Jahr später, in Klasse 3, habe ich eine 2 in Mathe.
Daran denkend antworte ich der Mutter: „Das ist doch gut, wenn du weißt, was dein Kind im letzten halben Jahr gelernt hat“. Die Mutter schüttelt den Kopf. „Es gibt so ein Raster mit Smileys“. Jetzt bin ich enttäuscht. Also doch Noten. Noten und Smileys sind statistisch gesehen sehr ähnlich, denn sie sind beides eine Messung. Beide messen die Leistung oder das Lernen des Kindes und sie tun es auf dem gleichen Niveau. In der Statistik werden vier Skalenniveaus unterschieden. Die Unterschiede liegen darin begründet, wie willkürlich Zahlen zu Worten zugeordnet werden.
Bei Smileys und Noten erfolgt die Zuordnung von Worten zu Zahlen gleich (un)willkürlich.
Smileys und Noten haben die gleiche Aussagekraft und man kann hinterher theoretisch die gleichen Rechnungen durchführen. Eigentlich darf man statistisch keinen Notendurchschnitt berechnen. Statistisch gesehen kann man genausogut bzw. genausoschlecht einen Smileydurchschnitt berechnen wie einen Notendurchschnitt. Beim Smileyschnitt fällt das aber eher als merkwürdig auf als beim Notendurchschnitt, den vermutlich jeder schon berechnet hat.
Warum sollte der Notendurchschnitt genauso merkwürdig klingen wie der Smileydurchschnitt?
Weil die Zahlen gleich (un)willkürlich zugeordnet werden. Diese Zuordnung nennt man kodieren. Mit Noten kodieren Lehrkräfte die Lernleistung von Kindern. Sie sind eine Abkürzung, eine griffige Zusammenfassung längerer Worte. Statt „Jenny schreibt zügig, mit genauen Buchstabenformen und sehr gutem Schriftbild. Beim Abschreiben macht sie keine Fehler. Sie schreibt auch schon längere eigene Texte. Jenny liest fließend und verständig und kann Gedichte schön aufsagen“ schreibt die Lehrkraft Deutsch = 1. Oder eben ein breit grinsendes Smiley oder einen ganz ausgefüllten Kuller… Und anstatt „Den Zahlenaufbau bis 100 hat sie verstanden und rechnet Plus und Minus zügig und sicher […]“. steht im Zeugnis Mathamatik = 2. Oder ein leicht lächelndes Smiley oder ein 3/4 oder 5/6 ausgefüllter Kuller. Die Zahlen und Ausprägung des Lächelns oder die Ausgemaltheit des Kullers sind nicht willkürlich diesen Bedeutungen zugeordnet. Die Note 1 soll eine bessere Lernleistung zeigen als die Note 2. Das breit lächelnde Smiley eine bessere Leistung als das leicht lächelnde Smiley. Ich kann hinterher die Noten in eine Rangfolge bringen, in eine Ordnung. Mit den Smileys und Kullern geht das genauso problemlos.
Deshalb heißt das Skalenniveau, auf dem Noten und Smileys die Leistung von Kindern messen, Rangskalenniveau oder Ordinalskalenniveau.
Einen Durchschnitt darf man erst ab dem nächst höheren Niveau berechnen, nämlich dann, wenn die Abstände zwischen den einzelnen Zahlen gleich sind (warum sie das bei Noten nicht sind, begründete ich hier). Dieses Skalenniveau heißt Intervallskala, weil die Intervalle (Abstände) zwischen den Werten gleich groß sein sollen. Das ist zum Beispiel bei der Temperatur Skala Grad Celsius der Fall. Der Abstand zwischen 5 und 6 Grad ist genauso groß wie der Abstand zwischen 9 und 10 Grad. Auch bei der IQ-Skala ist das so. Die Skala mit dem höchsten Niveau ist die Verhältnisskala oder Ratioskala. Hier gibt es zusätzlich zu gleichen Abständen noch einen natürlichen Nullpunkt. Das ist zum Beispiel bei der Größe oder bei Geschwindigkeit der Fall – nicht aber beim IQ, es gibt keinen IQ von Null. Brot z. B. hat einfach keinen IQ. Statistisch gibt es wenig Unterschiede zwischen Ratio- und Intervallskala, im Prinzip kann man mit einer Intervallskala alles machen, was einem mathematisch so einfällt.
Am unteren Ende gibt es ein Skalenniveau, das eigentlich gar keins ist.
Die Nominalskala bedeutet ein willkürliches Verhältnis zwischen Zahlen und Worten (Nomen = Name). Man kann die Zahlen, die den Worten zugeordnet werden, nicht in eine Rangfolge bringen, weil die Zahlen rein gar nichts bedeuten. Sie repräsentieren nur komplexe Namen. Sie sind nur dafür da, dass man diese Namen, diese Bezeichnungen, in statistische Berechnungen einbringen kann. Zum Beispiel den so genannten Migrationshintergrund. Oder das Geschlecht. Wenn das in Fragebögen gefragt wird, wird hinterher eine Zahl zugeordnet. Meistens 0 für männlich und 1 für weiblich. Die Zahlen sind jedoch willkürlich. Man könnte genausogut 789 für männlich und 6333 für weiblich kodieren. Nominalskalen werden haufig benutzt, um Kategorien zu bilden. Dies ist manchmal notwendig.
Was ist nun das Problem mit Smileys?
Im Prinzip keins. Ich finds gut, dass die Absurdität des Durschnittssmileys verrät, dass Notendurchschnitte unsinnig sind. Allerdings verzerrt die Debatte um Smileys und Raster die Diskussion von Schule ohne Noten. Denn Smileys sind Noten und das sollte so gesagt werden. Sie tragen die gleiche Information, sind genauso (nicht) aussagekräftig. Deshalb muss man nicht darüber debattieren, ob Noten oder Smileys oder Schnecken oder whatever. Das einizge, was wirklich einen Unterschied macht, ist eine Beschreibung dessen, was das Kind gelernt hat, gelernt haben hätte sollen und noch lernen muss. Erst dann können wir die Frage Noten oder keine Noten pädagogisch diskutieren. Sie wird dann zur Frage: Wie soll das Lernen von Kindern dokumentiert werden? Soll es gemessen werden? Und wenn ja, auf welchem Skalenniveau?