Im Physikunterricht werden Schüler_innen nicht nur mit fachlichen, sondern auch mit hohen sprachlichen Anforderungen konfrontiert (Bach, 1984; Kulgemeyer, 2010). Von erfolgreichen Schüler_innen erwarten Physiklehrkräfte oftmals selbstverständlich, dass sie den Umgang mit bildungs- und fachsprachlichen Registern beherrschen (Feilke, 2012; Schleppegrell, 2004). Die Arbeiten von Tajmel (2010; 2011) legen nahe, dass sich diese Erwartungshaltung auch auf Leistungsbewertungen und Leistungsurteile niederschlägt. Genauer: Es lässt sich begründet vermuten, dass Physiklehrkräfte Urteile über fachliche und sprachliche Leistungen konfundieren. Wie Lehrkräfte bei der Beurteilung von Leistungsaufgaben tatsächlich vorgehen, welchen Logiken sie dabei folgen, welche Ressourcen sie aktivieren und welche Maßstäbe sie für relevant halten, ist allerdings weitgehend unbekannt (Leuders et al., 2014). In diesem Beitrag wird die Entwicklung eines Testinstruments vorgestellt, das dazu dienen soll, die eben beschriebenen Desiderate in einer Studie mit Physiklehrkräften zu explorieren.