Teststatistik
Eine Teststatistik, auch Prüfgröße, Testgröße oder Prüffunktion genannt, ist eine spezielle reellwertige Funktion in der Testtheorie, einem Teilgebiet der mathematischen Statistik. Teststatistiken werden als Hilfsfunktionen bei der Definition von statistischen Tests verwendet. So wird beispielsweise bei einem Hypothesentest die Nullhypothese abgelehnt, wenn die Teststatistik über oder unter einem vorher festgelegten Zahlenwert liegt.
Definition
Gegeben sei eine Funktion
sowie ein statistischer Test
,
der definiert ist durch
.
Hierbei ist
eine feste Zahl, die auch der kritische
Wert genannt wird. Dann wird die Funktion
eine Teststatistik genannt.
Die Definition gilt ebenso für randomisierte Tests sowie Varianten der obigen Definition des Tests. Dazu gehört unter anderem das Vertauschen oder Abändern von Ungleichheitszeichen und Vertauschen von null und eins.
Beispiele
Unter Verwendung der Abkürzung
für das Stichprobenmittel
ist eine typische Teststatistik auf
gegeben durch
Hierbei ist
eine positive Zahl und
eine beliebige reelle Zahl. Diese Teststatistik findet beispielsweise bei den
Gauß-Tests Anwendung.
Dabei wird ausgenutzt, dass die Teststatistik standardnormalverteilt
ist, d.h.
,
wenn die Stichprobenvariablen
normalverteilt sind mit Erwartungswert
und Varianz
.
Bezeichnet man mit
die korrigierte
Stichprobenvarianz, so ist eine weitere wichtige Teststatistik auf
gegeben durch
.
Hierbei ist wieder
eine beliebige reelle Zahl. Diese Teststatistik findet bei dem
Einstichproben-t-Test
Anwendung. Dabei wird ähnlich zum obigen Beispiel ausgenutzt, dass wenn die
Stichprobenvariablen normalverteilt sind mit Varianz
und Mittelwert
,
die Teststatistik t-verteilt
ist mit
Freiheitsgraden. Es gilt dann
.
Eine dritte wichtige Teststatistik ist
Dabei ist
und
.
Sie wird beispielsweise beim Chi-Quadrat-Test
für die Varianz verwendet. Dabei wird genutzt, dass
Chi-Quadrat-Verteilt
ist, wenn die Stichprobenvariablen normalverteilt sind mit Erwartungswert
und Varianz
.
Vorteile
Betrachtet man einen Test
und bezeichnet mit
die Bildung des Erwartungswertes bezüglich einer Wahrscheinlichkeitsverteilung
,
so treten in der Testtheorie häufig Ausdrücke der Form
oder
auf. Dabei entspricht der erste Ausdruck dem Fehler erster Art und
der zweite dem Fehler
zweiter Art wenn
in der Nullhypothese
ist und
in der Alternative. Im Allgemeinen sind solche Ausdrücke schwer zu berechnen, da
der Test
selbst wenig Struktur besitzt
Geht man nun von einem nichtrandomisierten
Test
aus (der randomisierte
Fall folgt mit leichten Anpassungen), so lässt sich der Test schreiben als
.
Hierbei ist
der Ablehnbereich
des Tests und
die Indikatorfunktion
auf der Menge
.
Mit dieser Schreibweise folgt dann insbesondere
,
siehe auch Charakteristische Funktion (Mathematik)#Verwendung zur Berechnung von Erwartungswert, Varianz und Kovarianz.
Ist der Test nun durch eine Teststatistik
definiert, also beispielsweise durch
,
so ist der Ablehnbereich von der Form
.
Damit reduziert sich aber die Bestimmung des Erwartungswertes des Tests zu
.
Damit lässt sich der Erwartungswert des Tests direkt bestimmen, wenn die Verteilung der Teststatistik bekannt ist. Wie die drei obigen Beispiele zeigen ist dies bei vielen wichtigen Tests der Fall.
Die einfachere Berechnung des Erwartungswertes über die Verteilung der
Teststatistik wird auf verschiedene Weisen verwendet. Einerseits bei Hypothesentests
vor der
Datenauswertung, um den kritischen Wert
so anzupassen, dass der Test den gewünschten Fehler erster Art einhält.
Andererseits bei Signifikanztests
nach der Datenauswertung zur Bestimmung des p-Wertes.
Somit erleichtern Teststatistiken den Umgang und die Konstruktion von Tests.



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 29.09. 2023