Die probabilistische Testtheorie

· 23. April 2019

Einer der wichtigsten Bestandteile der psychologischen Intervention ist die Evaluation des Patienten. Die Erkenntnisse des Psychologen hängen oft stark von den dazu durchgeführten Tests ab und davon, wie diese ausgewertet werden. So ist die probabilistische Testtheorie eine der Theorien zur Validierung und Auswertung von Tests, die als Ergänzung zur klassischen Testtheorie vorgestellt wurden.

Wie bereits angedeutet, können die klassische Testtheorie und die probabilistische Testtheorie auf den gleichen Test angewendet werden. Nach jeder der beiden Theorien könnte die Relevanz oder Wertigkeit einzelner Items festgelegt werden. Dies könnte bei gleichen Antworten zu zwei Ergebnissen führen. Es sei aber darauf hingewiesen, dass die probabilistische Testtheorie uns ein viel besser kalibriertes Instrument bieten würde. Ihre Anwendung ist jedoch mit höheren Kosten verbunden und bedarf der Einbeziehung von Fachleuten.

Das Ziel dieser beiden Testtheorien ist das gleiche. Es sollen Instrumente geschaffen werden, die das messen, was wir wollen, mit möglichst geringem Messfehler. Die Psychometrie verlangt daher eine gewisse Zuverlässigkeit und Gültigkeit aller Tests.

Erinnern wir uns, dass ein Test zuverlässiger sein wird, je besser er die Ergebnisse vor der Messung von zwei Probanden – oder von demselben Probanden in verschiedenen Kontexten – repliziert, die das gleiche Niveau in dem haben, was gemessen wird. Andererseits bezieht sich die Validität auf den Grad, in dem empirische Evidenz und Theorie die Interpretation von Testergebnissen unterstützen.

Mann absolviert einen Test

Einschränkungen der klassischen Testtheorie, die zur probabilistischen Testtheorie führen

Ohne ihren Beitrag zur angewandten Psychologie unterschätzen zu wollen, der sicherlich enorm war, hat der klassische Ansatz der Testtheorie seine Grenzen. Diese Mängel erfordern, dass bei der Konstruktion und Auswertung von Tests ein Schritt nach vorn gemacht wird.

Nach der klassischen Testtheorie seien Messungen nicht invariant für das verwendete Gerät. Stellen wir uns daher einen Psychologen vor, der die Intelligenz von drei Personen mit jeweils einem anderen Test bewertet. In diesem Fall könnten die Ergebnisse nicht verglichen werden, weil jeder Test seine eigene Skala hat. Um also z. B. die Intelligenz einer Gruppe von Personen, die mit verschiedenen Intelligenztests bewertet wurden, vergleichen zu können, wäre es notwendig, die erhaltenen Ergebnisse zu transformieren. In diesem Sinne ermöglicht uns die probabilistische Testtheorie den Vergleich der Ergebnisse, die durch den Einsatz verschiedener Instrumente, aber in gleicher Größenordnung erzielt wurden.

Darüber hinaus ist eine weitere Einschränkung des klassischen Ansatzes die mangelnde Invarianz der Testeigenschaften in Bezug auf die Personen, die diese einschätzen sollen. Der probabilistische Ansatz verbessert auch diesen Aspekt.

Annahmen der probabilistischen Testtheorie

Um die beschriebenen Einschränkungen zu beseitigen, muss die probabilistische Testtheorie stärkere und restriktivere Voraussetzungen definieren als die klassische Testtheorie.

Erste Voraussetzung

Die wichtigste Voraussetzung ist, dass dass Messinstrument mit einer Idee übereinstimmt. Das heißt, dass eine funktionale Beziehung zwischen den Werten der Variablen, die die Items beschreiben, und der Wahrscheinlichkeit, dass die Beschreibung zutreffend ist, besteht. Diese Funktion wird als Item Characteristic Curve oder ICC bezeichnet.

Es scheint, dass die probabilistische Testtheorie diesbezüglich eine neue Perspektive eröffnet. Diese beruht darauf, dass beispielsweise die kompliziertesten Items eines Intelligenztests nur von den intelligentesten Personen beantwortet werden. Andererseits hätte ein Item, das von allen bewerteten Personen auf die gleiche Weise beantwortet wird, nicht die Macht, zwischen mehr oder weniger Intelligenz bei einem Probanden zu unterscheiden.

Zweite Voraussetzung

Eine weitere Voraussetzung ist, dass die Items eindimensional sind. Bevor man also diese Theorie anwendet, ist es notwendig, sicherzustellen, dass die Daten dieser Eindimensionalität entsprechen. Dies ist eine wichtige Einschränkung für den Einsatz: Viele der von Psychologen verwendeten Instrumente sammeln mehrdimensionale Informationen.

In Bezug auf einen Intelligenztest hieße das beispielsweise, dass die Antwort nur von der Intelligenz einer Person abhängt, und nicht von deren innerer Einstellung, Emotionen etc.

Test

Dritte Voraussetzung

Eine dritte Voraussetzung für die probabilistische Testtheorie ist die lokale Unabhängigkeit. Das bedeutet, dass für den Einsatz dieses Modells die Items voneinander unabhängig sein müssen. Die Antwort auf ein Item darf nicht von der Antwort auf andere Items abhängig sein. Wenn jedoch die Eindimensionalität erfüllt ist, wird auch die lokale Unabhängigkeit gewährleistet. Es besteht dann keine Interdependenz der Items und keine gemeinsame Varianz, die nichts mit der gemessenen Dimension zu tun hat. Daher werden die zweite und dritte Voraussetzung manchmal gemeinsam behandelt.

Experten weisen auf die Bedeutung der Fortschritte auf dem Gebiet der Psychometrie und der Interpretation von Tests hin. Es ist daher logisch, dass wir weitere Schritte in diese Richtung gehen müssen, denn die im Rahmen der probabilistische Testtheorie analysierten Tests liefern zumindest beunruhigende Ergebnisse darüber, wie derzeit gemessen wird.

  • Cuesta, M. y Muñiz, J. (1999). Robustness of item response logistic models to violations of the unidimensionality assumption. Psicothema, Vol. 11, 175-182
  • Muñiz, J. (1997) Introducción a la teoría de respuesta a los ítems. Madrid: Pirámide.
  • Muñiz, J. (2000). Teoría Clásica de los Tests. Madrid: Pirámide.
  • Muñiz Fernández, J. (2010). Las teorías de los tests: teoría clásica y teoría de respuesta a los ítems. Papeles del Psicólogo: Revista del Colegio Oficial de Psicólogos.