Schulnoten, Abiturzeugnisse und Hochschulexamina – zwischen Noteninflation und mangelnder Vergleichbarkeit

Heinz-Peter Meidinger

Noten haben bei allem Bemühen um Objektivität immer auch eine subjektive Komponente, – diese Erkenntnis ist heute unbestritten und wohl so alt wie die Geschichte schulischer und universitärer Leistungsmessung insgesamt.

1970 erschien das Buch „Die ungerechte Aufsatzzensur“ des Kieler Pädagogikprofessors Gottfried Schröter, in dem dieser über 11 000 Zensuren für rund 600 verschiedene Deutschaufsätze von Lehrkräften und Didaktikprofessoren einsammelte und feststellen musste, dass es keinen einzigen Aufsatz gab, bei dem alle jeweils beteiligten 12 bis 18 Lehrer zum gleichen Notenurteil kamen. (Gottfried Schröter: Die ungerechte Aufsatzzensur. Bochum 1970; vgl. auch: „Eins gleich sechs“ Spiegel 44/1970; S. 114 – 117) In der Nachfolge der Studentenrevolte führte dies seinerzeit zu hitzigen Diskussionen in Lehrer- und Hochschulseminaren über die Ungerechtigkeit von Notenurteilen und das Versagen schulischer Leistungsbewertung generell, obwohl der Verfasser selbst die Noten nur vergleichbarer machen und nicht abschaffen wollte.

Aus der Schulforschung wissen wir, dass Noten immer abhängig von einer Reihe von Variablen sind, also beispielsweise von den Anforderungen, der durchschnittlichen Leistungsstärke der Referenzgruppe, aber auch von subjektiven Annahmen der Prüfer.

Die inzwischen abgelöste Kultusministerin von Schleswig-Holstein, Waltraud Wende, blieb so auch im Kreise ihrer Amtskollegen isoliert, als sie vor zwei Jahren ankündigte, in Schleswig-Holstein in der Grundschule auf Ziffernnoten generell zu verzichten, weil Noten ungerecht, unfair und oft Glücksache seien. („Brauchen Grundschüler Noten?“ In ZEIT, 15/2014 vom 3.4.2014).

Dass die Berechtigung von Notenvergaben heute weniger als noch in den 70er-Jahren grundsätzlich in Frage gestellt wird, hängt sicher auch damit zusammen, dass alle Versuche, alternative Bewertungssysteme zu entwickeln, z.B. Verbalbeurteilungen, Portfolios oder Kompetenzbeschreibungen, sich in der schulischen und gesellschaftlichen Praxis als nicht so aussagekräftig und praktikabel erwiesen haben wie die Vergabe von Ziffernnoten.

Wenn heute Noten wieder stärker in den Fokus schul- und bildungspolitischer Debatten rücken, dann sind dafür zwei andere Entwicklungen und Beobachtungen ursächlich.

Da geht es zum einen um das Phänomen der so genannten Noteninflation und zum anderen um die Frage, inwieweit Noten, insbesondere Abitur- und Examensnoten in Zeiten des Bildungsföderalismus und der Hochschulautonomie miteinander noch vergleichbar sind.

Noteninflation: Bessere Noten trotz stagnierender Leistungen

Nach gängiger Auffassung bezeichnet Noteninflation die Beobachtung, dass Prüflinge für die gleiche Leistung in späteren Jahren bessere Zensuren erhalten als in früheren Jahren. Thomas Gaens macht auf die Konsequenzen aufmerksam: „Werden die vergebenen Noten immer besser, obwohl die Leistungen von Studierenden konstant bleiben, wird damit das Prinzip der Vergleichbarkeit von Noten sowohl im Querschnitt als auch im Zeitverlauf ausgehebelt. Absolventen mit guten Leistungen erhalten weiterhin gute Noten, solche mit schlechten Leistungen dann ebenfalls, womit eine Differenzierung zwischen ihnen erschwert wird.“

(Thomas Gaens: Noteninflation an deutschen Hochschulen – Werden die Examensnoten überall immer besser? In: Beiträge zur Hochschulforschung 37, Jahrgang 4/2015, S. 8 – 35).

Diese Definition macht schon von vorneherein die grundsätzlichen methodischen Schwierigkeiten deutlich, sich mit diesem Sachverhalt argumentativ differenziert auseinanderzusetzen. Es reicht nämlich nicht allein der statistische Nachweis, dass die Noten an Hochschulen und Schulen besser geworden sind, sondern es muss auch geprüft werden, ob im Falle von statistisch signifikanten Trends zu besseren Noten über einen größeren Zeitraum nicht auch entsprechende Leistungsverbesserungen zugrunde liegen. Wäre dies der Fall, läge keine Noteninflation vor.

Während in Deutschland diese Diskussion um eine Noteninflation erst seit dem Jahre 2003 mit dem ersten entsprechenden Bericht des Wissenschaftsrats und den beiden Folgestudien von 2007 und 2014 mit Vehemenz eingesetzt hat, (Geschäftsstelle des Wissenschaftsrates: Prüfungsnoten an Hochschulen 1996, 1998 und 2000 nach ausgewählten Studienbereichen und Studienfächern – Arbeitsbericht Drs. 5526-03, Köln 2003. Geschäftsstelle des Wissenschaftsrates: Prüfungsnoten im Prüfungsjahr 2005 an Universitäten (einschließlich KH, PH, TH) sowie an Fachhochschulen einschließlich Verwaltungsfach-hochschulen nach ausgewählten Studienbereichen und Studienfächern – Arbeitsbericht Drs. 7769-07, Köln 2007. Geschäftsstelle des Wissenschaftsrates: Prüfungsnoten an Hochschulen im Prüfungsjahr 2010. Arbeitsbericht mit einem Wissenschaftspolitischen Kommentar des Wissenschaftsrates. Drs. 2627-12, Hamburg 2012) ist die Debatte um die „Grade inflation“ in angelsächsischen Ländern, insbesondere den Vereinigten Staaten, wesentlich älter,- sie reicht in die 70er-Jahre des letzten Jahrhunderts zurück (vgl. z.B. Prather, James E. u.a.: A Longitudinal Study of Grades in 144 Undergraduate Courses. In: Research in Higher Education. Vol.10-1, S. 11-24). Ende 2001 schaffte es der „Grade-Inflation-Skandal“ in Harvard sogar auf die Titelseiten der US-Medien. Der neu gewählte Harvard-Präsident Lawrence Summers ließ damals eine fakultätsübergreifende Kommission einen Maßnahmenkatalog erarbeiten, um der Bestnotenschwemme in Harvard entgegenzuwirken. Nach einer Studie der American Academy of Arts & Sciences beendeten damals 91 Prozent der „Senior Graduates“ in Harvard ihre Ausbildung mit Auszeichnung, in vergleichbaren Top-Unis wie Yale oder Princeton aber lediglich 40 bis 50 Prozent. (vgl. SPIEGEL vom 21.2.2002).

Entwicklung reicht bis in die 50er-Jahre zurück

Auch wenn die Statistiken des Wissenschaftsrates erst das Thema „Noteninflation“ in das öffentliche Bewusstsein in Deutschland rückten, gab es 1987 bereits eine große Vorläuferstudie von Josef Hitpass und Jürgen Trosien, deren erster Messpunkt bis in das Jahr 1953 zurückreicht. (Hitpass, Josef / Trosien, Jürgen: Leistungsbeurteilung in Hochschulabschlussprüfungen innerhalb von drei Jahrzehnten – Wandel von Prüfungsergebnis und Prüfungserlebnis an deutschen Hochschulen. Bad Honnef 1987). Sie analysierten Daten von sechs Diplomfächern sowie fächerübergreifend zusammengefasste Lehramtsprüfungen zu vier verschiedenen Messzeitpunkten, nämlich 1953, 1963, 1973 und 1983. Bei Zweidrittel der Fächer ließ sich eine signifikante Verbesserung über den gesamten Messzeitraum feststellen, lediglich im Fach Physik aber eine kontinuierliche über alle Erhebungszeitpunkte.

Tatsache ist also, dass die Tendenz zu besseren Noten lange vor den Erhebungen des Wissenschaftsrats eingesetzt hat. Vor allem dessen letzte Studie von 2012 hat nochmals vor Augen geführt, dass sich die Inflation guter Noten weiter fortgesetzt hat. Während im Jahr 2000 durchschnittlich 70 Prozent eines Abschlussjahrgangs eine gute oder sehr gute Note erhielten, waren es 10 Jahre später bereits über 80 Prozent. Bezieht man noch den durch die Hitpass-Untersuchung abgedeckten Zeiträume mit ein, ergibt sich tatsächlich eine eindrucksvolle Notenverbesserung in der Mehrzahl der erfassten Studiengänge bzw. von deren Abschlussprüfungen, die allerdings erst so richtig ab Mitte der 60er-Jahre einsetzt, – etwa in Chemie eine halbe Note seit 1960, in Deutsch mit Abschluss Lehramt sogar mehr als eine ganze Note seit 1963. Von 1950 bis 1966 hatten sich die Durchschnittsnoten noch eher verschlechtert (vgl. Abbildungen 4 und 5 bei Gaens, S. 15f). Insbesondere in Biologie (1,4 in 2010) und Psychologie (1,3 in 2010) stellt sich das Notenniveau inzwischen so dar, dass die Leistungsdifferenzierung in Folge der „grade compression“ massiv gefährdet ist. Gleichzeitig gibt es aber auch Studiengänge und Fachbereiche, die sich dieser Noteninflation weitgehend entzogen haben, dazu zählen insbesondere die juristischen Staatsprüfungen, die Magisterstudiengänge in Soziologie und Germanistik sowie das Fach Maschinenbau. Während 2010 im Diplomstudiengang Biologie 98 Prozent der Uniabsolventen mit einer Eins oder Zwei abschlossen, waren dies bei der ersten juristischen Staatsprüfung nur 7 Prozent.

Allerdings darf der Blick auf die Durchschnittsergebnisse nicht ausblenden, dass die Dokumentation des Wissenschaftsrats nicht nur krasse Notenniveauunterschiede zwischen einzelnen Studienfächern, sondern auch enorme Differenzen zwischen einzelnen Universitäten in den gleichen Studienfächern aufdeckt. In BWL lag etwa der Notenschnitt der Bachelorstudenten 2010 bei 2,3 – dabei reichte das Spektrum allerdings von 1,7 an der Frankfurt School, einer privaten Hochschule, bis zur TU Clausthal mit 2,8. Die Zahlen legen auch nahe, dass die Sportstudenten in Hamburg mit Abschlussnote 1,4 leistungsstärker (sportlicher?) sind als ihr Kommilitonen in Bochum, die es lediglich auf eine 2,3 brachten.

Einflüsse des sozialen Kontextes auf Hochschulprüfungen

Angesichts dieser extrem großen Noten-Spannweite in Bezug auf Fächer und Universitäten stellt sich die Frage der Vergleichbarkeit von Examensnoten mit umso größerem Nachdruck. Volker Müller-Benedict hat die Einflüsse des sozialen Kontextes auf Hochschulprüfungen anhand umfangreichen Datenmaterials analysiert und kommt zu dem ernüchternden Schluss: „Angesichts der Resultate scheint starke Vorsicht geboten, wenn Examensnoten vergleichend angewendet werden sollen.“ (Volker Müller-Benedict, Elenea Tsarouha: Können Examensnoten verglichen werden? In: Zeitschrift für Soziologie, Jg. 40, Heft 5, Oktober 2011, S. 407). Selbst wenn man unterstelle, dass alle Regeln einer guten Testpraxis eingehalten werden, was nicht von ungefähr viele Experten bezweifeln, würde demnach die Tatsache, welches Fach man studiert, welchen Abschluss man anstrebt, an welcher Hochschule man die Prüfung ablegt und in welcher Arbeitsmarktsituation man studiert, die Abschlussergebnisse erheblich beeinflussen. Durchschnittliche Unterschiede zwischen den Fächern reichen bis zu zwei ganzen Noten, zwischen Hochschulen im selben Fach bis zu einer halben Note, wobei die fachlichen Differenzen über Jahrzehnte stabil blieben, die zwischen den Hochschulen aber einer größeren Veränderlichkeit unterliegen.

Erklärungsversuche und Vermutungen

Mit der Analyse von Benedict verliert die sympathischste Erklärung für immer bessere Noten, nämlich dass die Leistungsfähigkeit der Studierenden seit Ende der 60er-Jahre (davor ja nicht!) kontinuierlich zugenommen habe, an Überzeugungskraft. Zwar liegen materielle, die wirkliche Qualität von Examensarbeiten im diachronen Vergleich erfassende Studien, kaum vor. Es gehört aber schon mehr als nur guter Wille dazu, zu glauben, dass trotz der Entwicklung zur Massenuniversität, trotz der sich zwischen 1970 und 2010 ständig verschlechternden Betreuungsrelation zwischen Professoren und Studierenden sowie der gleichzeitigen dramatischen Ausweitung der Jahrgangsquote an Hochschulzugangsberechtigten sich eine so signifikante Leistungssteigerung vollzogen habe. Es fiele auch schwer zu begründen, warum diese Leistungssteigerung sich so uneinheitlich hinsichtlich verschiedener Fächer und Hochschulen vollzogen hat.

Ein weiteres Erklärungsmuster besteht darin, die sehr guten Examensergebnisse gerade in naturwissenschaftlichen Fächern mit den hohen Abbrecherquoten zu erklären, so dass am Schluss eben nur die Besten übrig blieben. Erstens müsste dann mit der Verbesserung der Noten auch eine proportionale Steigerung der Abbruchzahlen einhergehen, wofür jegliche systematischen Belege fehlen und zweitens gibt es eben auch Fächer, die das Notenlifting nicht mitgemacht haben, wie etwa die Rechtswissenschaften, mit vergleichbar hohen Abbrecherquoten. Man könnte auch die zunehmenden Klagen von Universitäten über die mangelnde Qualität der Studienanfänger als Gegenargument einer wirklichen Leistungssteigerung anführen, denn mit schlechteren Studienanfängern ständig bessere Examensabschlüsse hinzukriegen, wäre wirklich ein Wunder, – aber angesichts dessen, dass aufnehmende Institutionen schon seit fast 200 Jahren über die Defizite der Neuanfänger klagen, kann man dem wohl keine empirische Evidenz zubilligen. Große Aufregung verursachte 2012 etwa eine Befragung von 135 Hochschulfakultäten zur Lese- und Schreibkompetenz von Studierenden. Erstsemester hätten demnach massive Lücken in Rechtschreibung und Orthographie, der Beherrschung von Grammatik und Syntax. Laut dem die Befragung durchführenden damaligen Vorsitzenden des Philosophischen Fakultätentages und Bayreuther Philologieprofessors Gerhard Wolf konstatierte das übereinstimmende Befragungsergebnis den Studierenden “mangelnde Fähigkeiten, selbständig zu formulieren und zusammenhängende Texte zu schreiben”. (http://www.deutschlandradiokultur.de/medienkompetenz-sehr-gut-deutsche-sprache-mangelhaft.954.de.html?dram:article_id=216137). Studienanfänger seien überwiegend nicht mehr in der Lage, den roten Faden eines Textes zu erkennen oder schlüssige Mitschriften aus Vorlesungen anzufertigen.

Wenn also gestiegene Leistungen als Ursache der Noteninflation – womit sie dann übrigens auch keine mehr wäre, weil hinter den Noten auch entsprechende Leistungen stünden – ausscheidet, dann bleibt man auf mehr oder minder plausible und begründbare Vermutungen angewiesen, wie sie etwa Leo Schubert zusammengefasst hat (Schubert Leo : Noteninflation, HTWG-Forum – Das Forschungsmagazin der Hochschule Konstanz, ISSN 1619-9812, 2014/2015, S. 56-63).

Einige seien herausgegriffen:

  • Mit der Umstellung vom Diplom zu Bachelor und Masterabschlüssen seien vermehrt Prüfungsformen wie Referate und Studienarbeiten implementiert worden, was oft mit besseren Bewertungen einhergegangen sei.
  • Durch die heute an den meisten Hochschulen verankerten Möglichkeiten, Dozenten und Lehrveranstaltungen zu bewerten, habe sich eine Art Agreement etabliert, gute Prüfungsergebnisse mit guten Bewertungen zu honorieren und umgekehrt.
  • Die personelle Überlastung führt teilweise zu sehr oberflächlichen und pauschalen Korrekturen der Prüfungsarbeiten.
  • Bessere Noten bedeuten auch – das betrifft übrigens Schulen und Hochschulen gleichermaßen – weniger Ärger und Diskussionen mit enttäuschten Prüflingen bzw. einen geringeren Mehraufwand für Wiederholungs-, Nach- und Zusatzprüfungen.

Was Schubert nicht erwähnt, was aber meiner Ansicht nach vor allem in den Sozial-, Geistes- und Sprachwissenschaften eine nicht geringe Rolle spielt, ist die Distanz vieler Hochschulprofessoren zur Notengebung generell. Eine Mitwirkung an diesem gesellschaftlichen Allokations- und Selektionsprozess wird nicht selten aus grundsätzlichen Erwägungen abgelehnt. Für diese Vermutung spricht, dass, wie oben erwähnt, der Beginn der fortschreitenden Noteninflation sich bei den meisten Fächern ziemlich genau auf den Zeitraum ab 1970 festmachen lässt, also die Zeit, da die „Selektions- und Reproduktionsmechanismen der bürgerlichen Gesellschaft“ verstärkt in den Fokus der Kritik rückten.

Sicher mag auch eine Rolle gespielt haben, dass sich seit den 70er-Jahren die Arbeitsmarktsituation auch für Akademiker verschärft hat und so mancher Dozent hoffte, durch gute Noten die Jobchancen seiner Studentinnen und Studenten zu verbessern.

Seit der Umstellung auf das gestufte Studiensystem kommen dazu spezielle Effekte, beispielsweise die Abhängigkeit der Zulassung zum Masterstudium von der Note beim Bachelorabschluss. Da gab es vor einigen Jahren an einzelnen Universitäten ein böses Erwachen, als die eigenen Studenten bei der Zulassung zum Masterstudium weitgehend leer ausgingen, weil sie ihnen die begehrten Studienplätze von besser benoteten Bachelorabsolventen aus benachbarten Hochschulen weggeschnappt wurden. Die Gegenreaktion war absehbar: Um nicht die eigenen Studierenden zu benachteiligen, glich man sich vielfach an das (bessere) Notenniveau anderer Hochschulen an.

Anders als in den angelsächsischen Ländern spielt aber ein Argument im Zusammenhang mit Noteninflation in Deutschland keine Rolle. So wird z.B. in den USA die „grade inflation“ auch darauf zurückgeführt, dass viele Universitäten hohe Studiengebühren (Harvard: 35 000 Dollar per annum) verlangen und damit quasi eine Verpflichtung eingegangen wird, die teuer bezahlenden „Kunden“ auch mit entsprechenden Dienstleistungen in Form guter und bester Noten zu versorgen. Mit Bayern hat vor wenigen Jahren bekanntlich das letzte Bundesland verpflichtende Studiengebühren abgeschafft.

Konsequenzen der aufgezeigten Entwicklungen

Was sind aber die Konsequenzen der aufgezeigten Entwicklung für Studierende, für Hochschulen, für die so genannte Abnehmerseite?

Für besonders leistungsfähige und klar überdurchschnittlich qualifizierte Studierende ergibt sich die Notwendigkeit, neben dem Uniabschluss andere und zusätzliche Felder der Profilierung zu finden, um sich von der Masse der Gutbewerteten abzuheben. Das kann eine Promotion sein oder eben Stipendien, Preise, Praktika oder auch Zusatzqualifikationen wie eine größere Sprachenvielfalt. Bezüglich Promotionen darf aber der Hinweis nicht fehlen, dass auch bei deren Bewertung Noteninflation und Bewertungsunterschiede zwischen Fakultäten und Universitäten eine große Rolle spielen. Beispielsweise ist der Anteil der Doktoranten mit der Höchstbewertung „summa cum laude“ in den Wirtschaftswissenschaften von 22 Prozent vor zehn Jahren auf heute über 34 Prozent gestiegen – allerdings mit riesigen Standortunterschieden. In Bamberg beispielsweise erreichten sogar 70 Prozent die Bestbewertung. (http://www.forschungsinfo.de/promotionsnoten/)

Für die Hochschulen hat der Wissenschaftsrat eine Reihe von Vorschlägen erarbeitet, die Noteninflation einzudämmen und die Objektivität und Vergleichbarkeit der Prüfungen zu verbessern, ohne dass diese Hinweise bislang zu nennenswerten Anstrengungen seitens der Hochschulen geführt haben. Dazu gehören anonymisierte Zweitbewertungen aber auch der Ausweis von Durchschnitten und Rangplätzen auf Abschlusszeugnissen.

Die Unternehmen und öffentlichen Arbeitsgeber stehen vor der Herausforderung, sich einerseits eine umfassende Informationsbasis beispielsweise über Bewertungsmaßstäbe und Notenniveaus verschiedener Fachrichtungen und Hochschulen zu verschaffen, um sich ein möglichst differenziertes und umfassendes Bild der Wertigkeit von Hochschulabschlüssen machen zu können bzw. gegebenenfalls eigene zusätzliche Auswahlverfahren zu entwickeln.

Es gibt aber einen großen Unterschied zum Problem der Vergleichbarkeit und Noteninflation bei Abiturzeugnissen. Während nämlich jeder Arbeitgeber frei darin ist, zu den reinen Examensnoten zusätzliche Kriterien und Erkenntnisse bei der Einstellung heranzuziehen, entscheidet bei zulassungsbeschränkten Studiengängen oft ausschließlich die erzielte Abinote bis hin zum Zehntel nach dem Komma, unabhängig davon, an welcher Schulart, an welcher konkreten Schule oder in welchem Bundesland diese Note erzielt wurde. Deshalb besitzt das Thema Vergleichbarkeit und Noteninflation bei Abiturzeugnissen eine in meinen Augen erheblich höhere Brisanz als es dieses Thema im universitären Sektor hat.

Noteninflation und Vergleichbarkeit von Abiturprüfungen

Von Noteninflation wird in den letzten Jahren nicht zuletzt verstärkt im Bereich der Schulen gesprochen. Auch da gilt es, sich einmal genauer anzuschauen, was Statistiken über eine Aufwärtsentwicklung von Noten sagen, um dann in einem zweiten Schritt zu prüfen, ob dies mit gestiegenen Leistungen zusammenhängt. Daten zu Notenentwicklungen in Zeugnissen an verschiedenen Schularten in den Bundesländern gibt es nicht bzw. wurden bislang nicht veröffentlicht. Woran man sich halten kann, sind die alljährlichen Statistiken, die das Sekretariat der Kultusministerkonferenz über die Abiturdurchschnittsnoten in den einzelnen Bundesländern veröffentlicht. (https://www.kmk.org/dokumentation-und-statistik/statistik/schulstatistik/abiturnoten.html)

Analysiert man dabei die Entwicklung von 2002 bis 2014, also den derzeit letzten dokumentierten Abiturjahrgang, dann fällt zunächst einmal auf, dass eine Notenverbesserung in den meisten Bundesländern festzustellen ist, diese aber insgesamt bundesweit mit rund 0,15 geringer ausfällt, als etwa im selben Zeitraum vom Wissenschaftsrat für die Universitäten ausgewiesen wurde. Allerdings stellt sich die Situation von Bundesland zu Bundesland sehr unterschiedlich dar. Während sich z.B. der Durchschnitt in Baden-Württemberg von 2002 zu 2014 von 2,35 (2002) zu 2014 (2,46) sogar um 0,11 Notengrade verschlechterte, haben sich die Abidurchschnittsnoten in Bayern (2002: 2,46 2014: 2,33), in Berlin (2002: 2,76 2014: 2,42) in NRW (2002: 2,68 2014: 2,50) und Thüringen (2002: 2,33 2014: 2,17) zum Teil deutlich nach oben bewegt. Noch auffallender ist die in diesem Zusammenhang gestiegene Zahl an Bestabiturnoten, also 1,0-Ergebnissen. Während diese Note beispielsweise laut den von der KMK veröffentlichten Statistiken im Jahr 2002 im Land Berlin nur 17 Mal erzielt wurde, stieg diese Zahl schon zehn Jahre später 2012 auf das Vierzehnfache (234) an. In anderen Bundesländern ist der Trend bei der Zunahme der Bestbewertungen ähnlich, wenn auch nicht so dramatisch. Im bevölkerungsreichsten Bundesland NRW verdreifachten sich beispielsweise die Zahl der 1,0 Abiturienten allein von 2006 (412) bis 2014 (1221).

Notenverbesserungen im Kontext schulpolitischer Reformen

Betrachtet man diesen Trend zu besseren Abiturnoten genauer, dann zeigt sich, dass diese Entwicklung über den dokumentierten Zeitraum hinweg nicht kontinuierlich, sondern teilweise sehr sprunghaft verläuft.

In Bayern und NRW, aber nicht nur dort, gibt es deutliche Anhaltspunkte dafür, dass bessere Abiturnoten mit bildungspolitischen bzw. schuladministrativen Maßnahmen zusammenhängen. Ein klar erkennbarer Notenanstieg erfolgte in Bayern nach dem Jahr 2010, als die für das G8 geltenden neuen Abiturregelungen in Kraft traten, die zwar eine verbindliche schriftliche Abiturprüfung in Deutsch und Mathematik, aber gleichzeitig auch eine bessere Bewertung mündlicher Leistungen, eine 5. Abiturleistung und Praxisseminare vorsahen. In NRW führte dagegen die Einführung des Zentralabiturs zu einem signifikanten positiven Noteneffekt. Ähnliches lässt sich auch für die Einführung des Zentralabiturs in den Nach-PISA-Jahren in anderen Bundesländern beobachten. Der Grund liegt auf der Hand: Alle Bildungsministerien sind eifrig darauf bedacht, dass Schulreformen nicht zu Notenverschlechterungen führen, weil dadurch die Akzeptanz dieser Reformen in der Bevölkerung beeinträchtigt würde. Es gibt inzwischen auch Studien, die belegen, dass die kompetenzorientierten Aufgabenstellungen beim Abitur in einigen Fächern weniger anspruchsvoll sind als vor Einführung des Landeszentralabiturs (vgl. z.B. Hans-Peter Klein: Die neue Kompetenzorientierung: Exzellenz oder Nivellierung? In ZfdB, Vol 1 (2010), S.15-26) und allein deshalb auch bessere Noten erwartet werden können.

Weitere Anzeichen für Notenlifting: Sinkende Sitzenbleiber- und Schulabbrecherquoten

Es gibt allerdings aber noch andere Anzeichen dafür, dass auch die Schulen von einem Notenlifting nach oben erfasst worden sind: Die Mehrheit der Bundesländer meldet Jahr für Jahr sinkende Sitzenbleiberquoten, die Zahl der Schulabbrecher ging in den letzten zehn Jahren um ein gutes Drittel zurück.

An der Hoffnung, dass hinter dem gestiegenen Notenniveau an Schulen, auch an Gymnasien, bessere Leistungen stehen, möchte man gerade als Lehrer und Bildungslobbyist gerne festhalten. In diesem Zusammenhang wird häufig auf die bundesdeutschen PISA-Ergebnisse verwiesen, die sich von 2000 bis 2012 deutlich verbessert hätten. Allerdings sind sich viele Bildungsforscher darüber uneinig, ob die Verbesserung bei PISA nicht mehr mit der Anpassung an die dortige Prüfungskultur und veränderten Kompositionseffekten (höherer Gymnasiastenanteil) zu tun hat als mit besseren Leistungen. Beispielsweise hat sich bei der Testung der 15-Jährigen im erfassten Zeitraum der letzten 15 Jahre auch nicht annähernd eine solche Leistungsexplosion im Spitzensektor der obersten Kompetenzstufen gezeigt, wie es der rasante Anstieg der 1,0-Abiture nahelegen würde. Zudem wurde darauf aufmerksam gemacht, dass der Rückgang der Schulabbrecher von 2003 zu 2013 von fast 9,8 auf 5,9 Prozent eigentlich hätte begleitet sein müssen mit einem entsprechenden Rückgang auch der sogenannten Risikoschüler, die bis zum Ende ihrer Schulzeit auf Grundschulniveau hängen bleiben. Laut Bildungsbericht 2014 sank deren Anteil aber nicht um 40 Prozent, sondern nur 25 Prozent. (vgl. Heike Schmoll: Schluss mit der zertifizierten Inkompetenz http://www.helmholtz.de/wissenschaftspolitik/schluss-mit-der-zertifizierten-inkompetenz-2751/).

Es gibt also tatsächlich klare Indizien dafür, dass der Anstieg der guten und sehr guten Abiturnoten, aber auch der Rückgang von Abbrecher- und Sitzenbleiberquoten nicht überwiegend auf Leistungssteigerungen zurückgeführt werden kann, man also auch im Schulbereich von einer Noteninflation sprechen kann.

Warum Noten immer besser werden

Bei der Ursachenforschung dafür ist man wie bei der Noteninflation an den Hochschulen in erster Linie auf Vermutungen angewiesen:

  • Die Politik verschafft sich Akzeptanz für Bildungsreformen durch Notenverbesserungen. Wie oft erklären Politiker heute, dass G8 zu weniger Sitzenbleibern und besseren Noten geführt habe? Das war aber wohl kein Zufallseffekt, sondern bewusst gewollt und einkalkuliert.
  • Als gute Schule gilt heute ein Gymnasium, das möglichst gute Abischnitte erreicht und möglichst alle Schulanfänger auch zum Abitur führt. Inzwischen gibt es Bundesländer, die solche Kennzahlen veröffentlichen und Zeitungen, die daraus ein Ranking entwickeln (z.B. Berliner Morgenpost vom 21.6.2013: Abitur 2013 – Das sind Berlins beste Schulen. Von Regina Köhler und Florentine Anders)
  • Schulen mit zu schlecht ausgefallenen Jahrgangsstufentests und zu hohen Sitzenbleiberquoten müssen sich in vielen Ländern zunehmend gegenüber der Kultusbürokratie rechtfertigen. Diesen Druck geben Schulleitungen oft direkt an die Lehrkräfte weiter
  • Es gibt zunehmende Bundesländer, in denen zu schlechte Klausurenschnitte dazu führen, dass Tests wiederholt werden müssen oder notenmäßig aufgebessert werden.
  • Die in den Bundesländern differierenden Vorschriften für die Erstellung von Noten wurden in den letzten Jahren deutlich schülerfreundlicher gestaltet, z.B. sind in NRW heute deutlich weniger Inhaltspunkte für eine 4 minus erforderlich als noch vor 10 Jahren
  • In einzelnen Fächern wurden die Anforderungen im Zuge von Lehrplankürzungen gesenkt, in den Fremdsprachen ist heute fast durchgängig die Benutzung von Wörterbüchern in der Oberstufe gestattet, fehleranfällige Übersetzungen wurden durch eine „mediation“ ersetzt.

Ein Abitur wird einem auch heute nicht geschenkt, aber …

Natürlich muss man sich auch heute noch für gute Noten an Gymnasien anstrengen, ein sehr gutes Abitur wird einem auch im Jahre 2016 nicht geschenkt. Aber die Chance, die sehr guten von den nur guten oder durchschnittlichen in und zwischen den Ländern zu unterscheiden und deutlich zu erkennen, ist schwieriger geworden.

Eine 1,0 ist keine Garantie auf einen bestimmten Studienplatz mehr. Berichtet wird über medizinische Fakultäten, die dreimal so viele Bewerber mit 1,0 haben als verfügbare Studienplätze. Konsequenz: Es muss gelost werden. Damit drohen schon fast amerikanische Verhältnisse, wo in Berkeley unlängst unter 31 000 Bewerbern auf 8200 Studienplätze rund 15 000 mit der Bestnote waren. (Reinhold Sackmann: Die Bedeutung institutioneller Auswahlprozesse für die Erzeugung von Bildungsungleichheit. S.40 In: W. Helsper, Heinz-Hermann Krüger Hrsg. Auswahl der Bildungsklientel. Wiesbaden 2015. S. 31 – 69).

Mehr Bildungsgerechtigkeit durch bessere Noten?

Es gibt auch eine moralische Rechtfertigung für bessere Noten und die besteht in der Hoffnung, dass dadurch das Bildungssystem gerechter werde, weil auch bildungsferne Schichten hiermit bessere Erfolgschancen z.B. am Gymnasium hätten. So wird beispielsweise der Essener Bildungsforscher Klaus Klemm folgendermaßen zitiert: „Wenn wir mehr Gruppen in die Hochschulen lassen, sinkt nicht das Niveau, sondern das System wird gerechter.“ (taz vom 18.6.14, Die Angst vor den Bildungsaufsteigern, von Anna Lehmann).

Dieser Frage, ob eine Absenkung von Prüfungsstandards zu mehr Bildungsgerechtigkeit führen kann, ist Robert Schwager nachgegangen, indem er ein in der Wirtschaftswissenschaft übliches spieltheoretisches Modell konstruiert hat, das die Zuordnung von Arbeitskräften mit verschiedenen Fähigkeiten auf unterschiedlich anspruchsvolle Arbeitsplätze auf der Basis verschiedener Benotungsniveaus abbildet. Sein Ergebnis ist eindeutig, wenn auch wenig überraschend. Er kommt zu dem Schluss, dass bei einer Noteninflationierung die attraktiven Arbeitsplätze denjenigen Absolventen vorbehalten werden, die nicht nur über eine gute Note, sondern auch eine privilegierte Herkunft verfügen. Eine solche Notenvergabe mache es nämlich Schülern aus sozial schwachen Verhältnissen unmöglich, ihre wirklichen Fähigkeiten auf dem Arbeitsmarkt zu signalisieren. Er hält abschließend fest: „Aus bildungspolitischer Sicht bedeuten diese Ergebnisse, dass nachsichtige Benotung und reduzierte Prüfungsanforderungen nicht geeignet sind, um gesellschaftliche Mobilität zu fördern. Im Gegenteil, fähige, aufstrebende Schüler aus schwierigem sozialen Umfeld haben in einem meritokratischen Schulsystem, das Leistungen ernsthaft prüft und die erzielten Ergebnisse ungeschönt dokumentiert, die besten Chancen.“ (Robert Schwager: Grade Inflation, Social Background, and Labour Market Matching. In: Journal of Economic Behavior Organization, January 2008, Zitat aus der deutschen Zusammenfassung in: ftp://ftp.zew.de/pub/zew-docs/dp/dp08070.pdf)

Interessant ist, dass der wohl renommierteste deutsche Moralphilosoph, Vittorio Hösle, in seinem Standardwerk „Moral und Politik“ aus moralphilosophischer und nicht wie bei Schwager aus wirtschaftsökonomischer Sicht exakt zu der gleichen Schlussfolgerung kommt:

„Es ist in jedem Fall unsinnig, wenn man meint, soziale Gerechtigkeit dadurch fördern zu können, dass man die Standards der Schulen und Hochschulen jedes Jahr senkt und eine ‚Noteninflation’ betreibt – das ist ein ebenso untaugliches bildungspolitisches Mittel wie die Bedienung der Notenpresse bei der Lösung sozialer Probleme.“ (Vittorio Hösle: Moral und Politik. Grundlagen einer politischen Ethik für das 21. Jahrhundert. München 1997, S. 1126)

Ein Verbesserungsvorschlag für mehr Vergleichbarkeit

Neben der generellen Fragwürdigkeit noteninflationärer Tendenzen bleibt bei den Abiturnoten das Gerechtigkeitsproblem der mangelnden Vergleichbarkeit. Wenn in einem Bundesland der Abidurchschnitt im Jahre 2014 2,17 beträgt und dort in Thüringen fast 3 Prozent der Abiturienten die Bestnote 1,0 erreichen, während es in Niedersachsen bei einem Schnitt von 2,61 nur 0,8 Prozent 1,0-Abiturienten gibt, dann ist angesichts der Tatsache, dass inzwischen fast 50 Prozent der Studiengänge zulassungsbeschränkt sind, diese Gerechtigkeitslücke mit Händen zu greifen.

Man darf aus den bereits zuvor erörterten Gründen auch sehr skeptisch sein, ob die Einführung von bundesweit einheitlichen Abiturbestandteilen ab dem Jahr 2017 zu mehr Vergleichbarkeit und Gerechtigkeit führen wird. Es wird mit großer Wahrscheinlichkeit auch weiterhin keine Landesregierung eine Schulreform durchführen, die ihren Abiturientinnen und Abiturienten eine Notenverschlechterung bescheren könnte.

Ich habe deshalb große Sympathie für einen Vorschlag, den Bijan Moini im SPIEGEL am 22.7.2015 gemacht hat (vgl. Stephanie Schiemann: Die Vergleichbarkeit von Abiturquoten und -noten. MDMV 23/2015/ S.186f), nämlich in allen Bundesländern eine relative Größe, den Rang des Abiturienten im Vergleich zu seinen Mitabsolventen, in das Abiturzeugnis aufzunehmen. Diese relative Größe soll die Platzierung im jeweiligen Bundesland erfassen, geteilt durch die Gesamtzahl aller Abiturienten seines Bundeslands mal 1000, anschließende Rundung auf eine ganze Zahl zwischen 0 und 1000. Moini wörtlich: „Der Rang wäre über die Landesgrenzen und Jahrgänge hinweg vergleichbar. Schüler würden künftig zunächst nur mit jenen vergleichen, deren Noten unter vergleichbaren Bedingungen entstanden. Dass ein Einser-Abitur in einem Bundesland oder Jahrgang leichter zu erreichen ist als in einem anderen, hätte dann auf die Studienzulassung keine Auswirkung mehr.“ (ebenda S.187)

Zwar würde dieser Vorschlag dazu führen, dass tatsächlich vorhandene Unterschiede zwischen den Ländern beim Leistungsniveau der Abiturienten weiterhin nicht erfasst werden. Das gelingt aber schon jetzt nicht einmal im Ansatz. Diese Zusatzinformation ermöglichte aber nicht nur eine bessere Vergleichbarkeit, sondern nähme auch der Bildungspolitik in den Ländern den Anreiz weg, durch ständige Noteninflationierung die Chancen der eigenen Landesabiturienten künstlich zu verbessern.

Noten erfüllen eine wichtige Funktion: Sie geben eine klare Rückmeldung, wo ein Schüler steht

Es gibt gute Gründe, warum in keinem Land der Welt auf Noten im Schulsystem verzichtet wird, auch in den angeblich so fortschrittlichen skandinavischen Ländern nicht, zumindest, was Abschlussprüfungen betrifft:

Zum einen hat sich gezeigt, dass Verbalbeurteilungen nicht objektiver, dafür aber kaum vergleichbar und damit für Schüler, Eltern, zukünftige Arbeitgeber und Universitäten schwer lesbar sind. Aus diesen Einschätzungen ist oft nicht erkennbar, ob Schüler im oberen Leistungsdrittel, in der Mitte oder eher darunter stehen. Da dabei manches sprachlich geglättet wird, nehmen außerdem Eltern solche Einschätzungen sehr selektiv wahr. Das heißt, sie sehen eher das Positive und nicht die leicht angedeuteten Schwächen.

Notenzeugnisse sind außerdem Grundlage für eine Lehrstellenbewerbung oder einen Studienplatz. Der Verzicht auf Noten in der Schule würde dazu führen, dass nicht Schulnoten, sondern andere Kriterien, Verbalisierungs- und Selbstdarstellungsfähigkeit, Beziehungen, Einfluss von Eltern, Zusatzqualifikationen wie Auslandsaufenthalte, die vor allem vermögende Eltern finanzieren können, zu den entscheidenden Kriterien werden, aufgrund derer Arbeitsplätze, Anstellungen und Studienplätze verteilt werden.

Natürlich haben auch Ziffernnoten eine subjektive Komponente, sie können von Vergleichsgruppen abhängig und daher letztlich im Einzelfall nicht völlig objektiv sein. Doch wissenschaftliche Studien zeigen: Die Einzelnote mag manchmal ungerecht sein, die Durchschnittsnoten in der Summe sind es nicht. So weist die Abiturdurchschnittsnote immer noch die höchste Prognosekraft dafür auf, ob – bezogen auf die Mehrzahl der Studienfächer – ein erfolgreicher Abschluss erzielt werden kann. Und im Übrigen: Auch die große Mehrzahl der Betroffenen, der Schüler und Eltern, lehnt Ziffernnoten nicht ab. Alles, was ich an Alternativen kenne, von der schriftlichen Beurteilung bis hin zum Eltern-Lehrer-Gespräch erfüllt nicht die Funktion von Noten, nämlich eine klare Rückmeldung zu geben, wo der Schüler in Bezug auf seine Leistungen steht.