Literaturnachweis - Detailanzeige
Autor/in | Birkel, Peter |
---|---|
Titel | Beurteilungsuebereinstimmung bei Mathematikarbeiten? Gefälligkeitsübersetzung: Scoring disparity for pupils test? |
Quelle | In: Journal für Mathematik-Didaktik, 26 (2005) 1, S. 28-51 |
Sprache | deutsch |
Dokumenttyp | gedruckt; Zeitschriftenaufsatz |
ISSN | 0173-5322 |
Schlagwörter | Empirische Untersuchung; Vergleich; Lehrer; Klassenarbeit; Leistungsbeurteilung; Mathematikunterricht |
Abstract | 131 Lehrer(innen) beurteilten vier Mathematikarbeiten von Viertklaesslern. Alle Lehrer verwendeten Punktesystem zur Auswertung. Der relative Anteil der erteilten Punkte konnte bei derselben Arbeit um bis zu 43 Prozentpunkte schwanken. Die abgegebenen Beurteilungen fuer dieselbe Arbeit differierten um bis zu 2.75 Notenstufen. Damit erscheint die Beurteilung von Mathematikarbeiten als nicht viel reliabler als die Aufsatzbeurteilung. Eine der verwendeten Arbeiten war im Original besonders unsauber in der Ausfuehrung. Von dieser wurde eine 'geschoente' Version erstellt und etwa der Haelfte der Beurteiler anstelle der Originalarbeit zur Beurteilung vorgelegt. Bei dieser Arbeit zeigte sich, dass die Auswertung der Arbeit von der Akkuratesse ihrer Ausfuehrung nicht abhaengig war, wohl aber die Beurteilung. Die von den Lehrern verwendeten Punktesysteme bei der Auswertung streuten zwischen 16.5 und 55 Punkten. Es zeigte sich, dass die Lehrer mit hoechsten maximalen Punktsystemen den Schuelern auch mehr Punkte gaben und entsprechend auch bessere Noten. (Zusammenfassung). 131 teachers scored the exercises of four pupils in mathematics which were originally written by forth graders of primary school. All teachers used scoring systems of different points. The relative amount of points given to the same exercise differed until 43 points on the 100%-scale. Marks given for the same exercise differed until 2.75 intervals on the 6-point-scale of marks used in Germany. So grading math exercises was not much more reliable than grading essays. One of the four exercises was rather slipshod in the original versions. About half of the teachers had to score the original and the others a neat copy written by astudent together with the other exercises. It could be shown that the neatness did not affect the measuring of the achievement, butinfluenced the teacher's marks. Measuring the achievement teachers used scoring systems, which differed from 16.5 to 55 points. It could be shown that teachers using systems with highest maximum of points gave a higher percentage of points and better grades to the pupils. (Summary). |
Erfasst von | FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur |
Update | 2006/1 |