Wieso haben Testverfahren Normtabellen mit Prozenträngen und t-Werten?

Um die Leistung einer Person auf einem bestimmten Gebiet einzuschätzen, erweist es sich als sinnvoll, sie mit der Leistung einer Bezugsgruppe auf demselben Gebiet zu vergleichen. Anhand dieses Vergleichs wird die Bewertung einer Leistung erst möglich. Denken Sie etwa an die Zahl 35. Ist das viel oder ist das wenig? Diese Frage lässt sich erst sinnvoll beantworten, wenn die 35 mit ei­ner zusätzlichen Information in Beziehung gesetzt wird – es bedarf einer Relation. Die Größe einer Zahl erweist sich also immer als relativ.

Wie können wir Leistungen anschaulich bewerten und vergleichen? Gibt es einheitliche Darstellungsmöglichkeiten für unterschiedliche Leistungsformen?

Mit sogenannten Normwerten ist dies möglich. Mit Ihnen können Leistungen durch Zahlen ausgedrückt und miteinander verglichen werden. Zwar können wir auch allein anhand einer Fehleranzahl in einem Diktat bestimmen, in welchem Verhältnis sich bestimmte Leistungen zueinander befinden (etwa 3 Fehler ist besser als 9 Fehler), aber es erweist sich als anschaulicher, wenn wir die Leistungen losgelöst von der jeweiligen Aufgabenstellung einordenbar machen.
Einen solchen Vergleichsmaßstab stellt die sogenannte Prozentrangskala dar. Mit ihren Normwerten, den Prozenträngen (PR), kann man verschiedenste Leistungen, etwa die Fehler in einem Diktat oder einem Rechentest oder auch die Reaktionszeiten in einem Aufmerksamkeitstest so ausdrücken, dass sich jedermann etwas darunter vorstellen kann (anschaulicher Bezugsrahmen). Die bestmögliche Leistung entspricht dabei einem Prozentrang von PR = 100, das schlechteste Ergebnis wird entsprechend durch einen Prozentrang von PR = 0 ausgedrückt. Die Mitte befindet sich – wie selbstverständlich – bei Prozentrang 50.
Bei diesen Platzierungen oder Rängen können wir jedoch nur über die Reihenfolge der einzelnen Leistungen etwas aussagen, nicht jedoch über die genauen Abstände (Zeit, Fehler etc.) zwischen den Rängen. Man bezeichnet ein solches Merkmal als ordinalskaliert.

Um verlässlichere Aussagen über die verschiedenen Leistungen von Personen machen zu können, benötigen wir einen anderen Maßstab, eine Skala, bei der nicht nur die Reihenfolge der Rangplätze festgelegt ist, sondern auch die Abstände dazwischen. Eine solche Skala stellt zum Beispiel die Temperaturskala mit der Einheit °C (Grad Celsius), Jahreszahlen oder der Intelligenzquotient (IQ) dar. Solche Merkmale nennt man intervallskaliert. Auch der IQ ist ein Normwert.

 

IQ Wert

Abbildung 1. IQ-Wert-Verteilung

 

Oftmals finden sich in den Normtabellen neben den Prozenträngen auch die sogenannten t-Werte. Diese sind wie der IQ intervallskaliert und reichen in der Regel von 20 bis 80. Der wesentliche Unterschied zwischen Prozentrang einerseits und IQ und t-Wert andererseits besteht – neben den Abständen – in dem Bezugspunkt, der zur Leistungsbewertung herangezogen wird. Während bei einem Prozentrang die Leistung einer Person über die Platzierung innerhalb der Rangreihe bewertet wird, wird bei den sogenannten Standardwerten die Leistung mit der Durchschnittsleistung aller Personen in Beziehung gesetzt – also mit dem Mittelwert (t-Wert = 50, IQ = 100). So kann man auch die Leistungsdurchschnitte mehrerer Gruppen miteinander vergleichen. Da man mit den ordinalskalierten Prozenträngen keinen Mittelwert bilden kann, kann eine Leistung hier auch nicht mit einem Mittelwert verglichen werden. Aus statistischer Sicht erweist sich entsprechend auch die Berechnung eines Notendurchschnitts bei Zeugnissen oder Klassenarbeiten als falsch. Schulnoten sind wie die Platzierungen auf dem Siegertreppchen ordinalskaliert.

→ Prozentränge sind anschaulich, und mit t-Werten kann man Mittelwerte bilden und Mittelwertvergleiche anstellen.