Stichprobenvarianz (Schätzfunktion)
Die Stichprobenvarianz ist eine Schätzfunktion in der mathematischen Statistik. Ihre zentrale Aufgabe ist es, die unbekannte Varianz einer zugrundeliegenden Wahrscheinlichkeitsverteilung zu schätzen. Außerhalb der Schätztheorie findet sie auch als Hilfsfunktion zur Konstruktion von Konfidenzbereichen und statistischen Tests Verwendung. Die Stichprobenvarianz wird in mehreren Varianten definiert, die sich leicht bezüglich ihrer Eigenschaften und somit auch ihrer Anwendungsgebiete unterscheiden. Die Unterscheidung der unterschiedlichen Varianten ist in der Literatur nicht immer einheitlich. Wird daher lediglich von "der" Stichprobenvarianz gesprochen, so sollte immer überprüft werden, welche der Definitionen im entsprechenden Kontext gilt.
Ebenfalls als Stichprobenvarianz wird die empirische Varianz bezeichnet, ein Streumaß einer Stichprobe, also von mehreren Zahlen. Diese Stichprobenvarianz einer konkreten Stichprobe entspricht einem Schätzwert und ist damit eine Realisierung der Stichprobenvarianz als Schätzfunktion und Zufallsvariable.
Definition
Gegeben seien Zufallsvariablen
und sei
.
In der Anwendung sind die
die Stichprobenvariablen.
Es bezeichne
das Stichprobenmittel. In der Literatur finden sich im Wesentlichen drei unterschiedliche Definitionen der Stichprobenvarianz.
Viele Autoren nennen
die Stichprobenvarianz oder zur besseren Abgrenzung die korrigierte Stichprobenvarianz. Alternativ wird auch
als Stichprobenvarianz bezeichnet, ebenso wird auch
für eine fixe reelle Zahl
Stichprobenvarianz genannt.
Weder die Notation noch die Sprechweise für die verschiedenen Definitionen
der Stichprobenvarianz sind einheitlich und eine regelmäßige Quelle von
Irrtümern.
So finden sich als Notationen für
auch
oder
.
Für
findet sich auch die Schreibweise
oder
,
für
auch
.
In diesem Artikel werden der Klarheit halber die oben aufgeführten Notationen
und
verwendet. Dabei wird
als korrigierte Stichprobenvarianz bezeichnet,
als Stichprobenvarianz und
als Stichprobenvarianz mit vorgegebenen Erwartungswert. Diese Sprechweisen sind
in der Literatur nicht verbreitet und hier nur der Klarheit halber eingeführt.
Beim Vergleich verschiedener Quellen sollten stets die Definitionen, Notationen
und Sprechweisen miteinander verglichen werden, um Irrtümer zu vermeiden!
Verwendung
Wichtiger Verwendungszweck der Stichprobenvarianz ist die Schätzung der Varianz einer unbekannten Wahrscheinlichkeitsverteilung. Je nach Rahmenbedingungen kommen dabei die verschiedenen Definitionen zum Einsatz, da diese unterschiedliche Optimalitätskriterien erfüllen (siehe unten). Als Faustregel kann gelten:
- Sind der Erwartungswert und die Varianz des Wahrscheinlichkeitsmaßes
unbekannt, so wird
als Schätzfunktion verwendet.
- Ist die Varianz unbekannt und entspricht der Erwartungswert dem Wert
, so wird
als Schätzfunktion verwendet.
Die Schätzfunktion
wird meist nicht verwendet, sie entsteht beispielsweise bei Verwendung der
Momentenmethode oder
der Maximum-Likelihood-Methode
und erfüllt die gängigen Qualitätskriterien nicht.
Neben der Verwendung als Schätzfunktion wird die Stichprobenvarianz noch als Hilfsfunktion für die Konstruktion von Konfidenzintervallen oder statistischen Tests verwendet. Dort findet sie sich zum Beispiel als Pivotstatistik zur Konstruktion von Konfidentintervallen im Normalverteilungsmodell oder als Teststatistik bei dem Chi-Quadrat-Test.
Eigenschaften
Rahmenbedingungen
Meist wird die Stichprobenvarianz unter den Annahmen verwendet, dass die Auswertungen unabhängig identisch verteilt sind sowie entweder einen bekannten oder einen unbekannten Erwartungswert besitzen. Diese Annahmen werden durch die folgenden statistischen Modelle beschrieben:
- Ist der Erwartungswert unbekannt, so ist das statistische Modell gegeben durch das (nicht notwendigerweise parametrische) Produktmodell
-
.
- Hierbei bezeichnet
das n-fache Produktmaß von
und
ist die Familie aller Wahrscheinlichkeitsmaße mit endlicher Varianz, die mit einer beliebigen Indexmenge
indiziert sind. Die Stichprobenvariablen
sind dann unabhängig identisch verteilt gemäß
und besitzen also eine endliche Varianz.
- Ist der Erwartungswert bekannt und gleich
, so ist das statistische Modell gegeben durch das (nicht notwendigerweise parametrische) Produktmodell
-
.
- Hierbei bezeichnet
die Familie aller Wahrscheinlichkeitsmaße mit endlicher Varianz und Erwartungswert
, die mit einer beliebigen Indexmenge
indiziert sind. Die Stichprobenvariablen
sind dann unabhängig identisch verteilt gemäß
und besitzen somit eine endliche Varianz und den Erwartungswert
.
Erwartungstreue
Bekannter Erwartungswert
Im Falle des bekannten Erwartungswertes ist
ein erwartungstreuer
Schätzer für die Varianz. Das bedeutet es gilt
.
Hierbei bezeichnet
bzw.
die Erwartungswertbildung bzw. die Varianzbildung bezüglich des
Wahrscheinlichkeitsmaßes
.
Die Erwartungstreue gilt, da
ist. Hierbei folgt der erste Schritt aus der Linearität des Erwartungswertes,
der zweite, da nach Voraussetzung über den bekannten Erwartungswert
ist und somit
gilt nach Definition der Varianz. In den dritten Schrit geht ein, dass die
alle identisch verteilt sind.
Unbekannter Erwartungswert
Im Falle des unbekannten Erwartungswertes ist
eine erwartungstreue Schätzfunktion für die Varianz, es gilt also
Im Gegensatz dazu ist
nicht erwartungstreu, denn es gilt
.
Der Schätzer
ist aber noch asymptotisch
erwartungstreu. Dies folgt direkt aus der obigen Darstellung, denn es
ist
.
- Herleitung der Erwartungstreue
Beachte dazu zuerst, dass Aufgrund der Unabhängigkeit
gilt und aufgrund der identischen Verteilungen
für alle
und somit
.
Daraus folgt direkt
aufgrund von
und
im letzten Schritt und unter Verwendung der Linearität des Erwartungswertes.
Analog folgt
wieder mithilfe von
und
im dritten Schritt.
Mithilfe von
und
im zweiten Schritt sowie von
in dritten Schritt ist dann
Die letzte Gleichheit folgt hier nach den Verschiebungssatz. Daraus folgt dann
und analog
Bessel-Korrektur
Direkt aus der Definition folgt der Zusammenhang
Der Faktor
wird hierbei als Bessel-Korrektur (nach Friedrich Wilhelm Bessel) bezeichnet.
Er kann insofern als Korrekturfaktor verstanden werden, da er
so korrigiert, dass die Schätzfunktion erwartungstreu wird. Dies folgt, da wie
oben gezeigt
.
und die Bessel-Korrektur genau der Kehrwert des Faktors
ist. Die Schätzfunktion
geht somit aus
durch die Bessel-Korrektur hervor.
Stichprobenstandardabweichung
Die Wurzel aus der Stichprobenvarianz
bzw.
,
also
oder
mit
/DD>
wird Stichprobenstandardabweichung oder Stichprobenstreuung genannt, ihre Realisierungen entsprechen der empirischen Standardabweichung. Da die Erwartungstreue bei Anwendung einer nichtlinearen Funktion wie der Wurzel in den meisten Fällen verloren geht, ist die Stichprobenstandardabweichung im Gegensatz zur korrigierten Stichprobenvarianz in keinem der beiden Fälle ein erwartungstreuer Schätzer für die Standardabweichung.



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 21.06. 2020