Allerdings wurden von verschiedener Seite auch substanzielle Zweifel an der Belastbarkeit der genannten Studien geäußert. In methodischer Hinsicht wurden insbesondere die Wiederholbarkeit im Ranking-Verfahren, das Question-Wording und die mangelnde Sicherstellung der Interpretation der Schlüsselbegriffe durch die Probanden moniert (Millar, 2010). Auch kann man kritisch fragen, inwieweit die von Kerr zusammengestellten und von Thompson ergänzten Zielstellungen eigentlich den Zielen der befragten Lehrkräfte entsprochen haben oder inwieweit diese eigene Absichten verfolgten, die durch diese Aufstellung nicht abgedeckt wurden.
Schwerwiegender noch sind sich abzeichnende Effekte sozialer Erwünschtheit im Antwortverhalten der Lehrkräfte, insbesondere, da bereits in der initialen Studie von Kerr (1963) signifikante Diskrepanzen zwischen Theorie und Praxis, zwischen dem, was Lehrkräfte sagen, dass sie tun und dem, was sie tun, berichtet wurden. Wenn es sich, wie diese Divergenzen vermuten lassen, bei den angeführten Zielen nicht um entscheidungsleitende Überzeugungen, sondern um Ex-Post-Rationalisierungen und soziale Begründungsstrategien handelt, dann gilt, wie Millar (2010, S. 112) meint:„Teachers’ ranking of aims may tell us