Satz von Gauß-Markow
In der Stochastik ist der Satz von Gauß-Markow (in der Literatur ist auch die englische Transkription Markov zu finden, also Satz von Gauß-Markov) bzw. Satz von Gauß ein mathematischer Satz über die Klasse der linearen erwartungstreuen Schätzfunktionen. Er stellt eine theoretische Rechtfertigung der Methode der kleinsten Quadrate dar und ist nach den Mathematikern Carl Friedrich Gauß und Andrei Andrejewitsch Markow benannt. Es wird in neuer Zeit vorgeschlagen, dass der Satz einfach Satz von Gauß heißen sollte, da die Zuschreibung zu Markow auf einem Irrtum beruht (siehe Geschichte). Der Satz besagt, dass in einem linearen Regressionsmodell, in dem die Störgrößen einen Erwartungswert von null und eine konstante Varianz haben sowie unkorreliert sind (Annahmen des klassischen linearen Regressionsmodells), der Kleinste-Quadrate-Schätzer – vorausgesetzt er existiert – ein bester linearer erwartungstreuer Schätzer, kurz BLES (englisch Best Linear Unbiased Estimator, kurz: BLUE) ist. Hierbei bedeutet der „beste“, dass er – innerhalb der Klasse der linearen erwartungstreuen Schätzer – die „kleinste“ Kovarianzmatrix aufweist und somit minimalvariant ist. Die Störgrößen müssen nicht notwendigerweise normalverteilt sein. Sie müssen im Fall der verallgemeinerten Kleinste-Quadrate-Schätzung auch nicht unabhängig und identisch verteilt sein.
Geschichte
Der Satz wurde im Jahr 1821 von Carl Friedrich Gauß bewiesen. Versionen seines Beweises wurden unter anderem von Helmert (1872), Czuber (1891) und Andrei Andrejewitsch Markow (1912) veröffentlicht. Jerzy Neyman, der die Arbeit von Gauß nicht kannte, benannte den Satz unter anderem nach Markow. Seitdem ist der Satz als Satz von Gauß-Markow bekannt. Da die heutige Bezeichnung vor allem auf der Unkenntnis Neymans bzgl. Gauß Beweis beruht, wird in neuer Zeit – vor allem in englischsprachiger Literatur – vorgeschlagen, den Satz allein nach Gauß zu benennen, etwa Satz von Gauß. Historische Informationen zum Satz von Gauß-Markow finden sich bei Seal (1967), Placket (1972), Stigler (1986) und in History of Mathematical Statistics from 1750 to 1930 von Hald (1998).
Formulierung des Satzes
In Worten lautet dieser Satz: Der Kleinste-Quadrate-Schätzer ist die beste lineare erwartungstreue Schätzfunktion, wenn die zufälligen Störgrößen (die folgenden Formeln beziehen sich auf die einfache lineare Regression):
- unkorreliert
sind:
.
- unabhängige Zufallsvariablen sind immer auch unkorreliert. Man spricht in diesem Zusammenhang auch von Abwesenheit von Autokorrelation.
- im Mittel Null sind:
: Diese Annahme bedeutet, dass das Modell grundsätzlich für korrekt gehalten wird und die beobachtete Abweichung als zufällig angesehen wird oder von vernachlässigbaren äußeren Einflüssen herrührt.
- eine endliche konstante Varianz
haben (Homoskedastizität):
- wenn die Varianz der Residuen (und somit die Varianz der erklärten Variablen selbst) für alle Ausprägungen der Regressoren gleich ist, liegt Homoskedastizität bzw. Varianzhomogenität vor.
Alle oben genannten Annahmen über die Störgrößen lassen sich so zusammenfassen:
,
das heißt alle Störgrößen folgen der Verteilung
mit Erwartungswert
und der Varianz
.
Hierbei ist die Verteilung anfangs nicht näher spezifiziert.
Diese Annahmen werden auch als Gauß-Markow-Annahmen bezeichnet. In der Ökonometrie wird der Satz von Gauß-Markow oft abweichend dargestellt und es werden weitere Annahmen getroffen.
Allgemeine Formulierung des Satzes von Gauß-Markow (regulärer Fall)
Als Ausgangslage betrachten wir ein typisches multiples
lineares Regressionsmodell mit gegebenen Daten
für
statistische
Einheiten und
Regressoren. Der Zusammenhang zwischen der abhängigen Variablen und den
unabhängigen Variablen kann wie folgt dargestellt werden
.
In Matrixnotation auch
mit .
In kompakter Schreibweise
.
Hier stellt
einen Vektor von unbekannten Parametern dar (bekannt als Regressionskoeffizienten),
die mithilfe der Daten geschätzt werden müssen. Des Weiteren wird angenommen,
dass die Störgrößen im Mittel Null sind:
,
was bedeutet, dass wir davon ausgehen können, dass unser Modell im Mittel
korrekt ist. Hierbei nimmt man von der Datenmatrix
an, dass sie vollen (Spalten-)Rang
hat, das heißt, es gilt
.
Insbesondere ist dann
eine reguläre, also invertierbare Matrix. Deshalb spricht man hier vom
regulären Fall (s. Überschrift). Ferner erwartet man für die Kovarianzmatrix der
Störgrößen, dass
gilt. Die Gauß-Markow-Annahmen lassen sich im multiplen Fall also zusammenfassen
als
wobei der Erwartungswert der Störgrößen der Nullvektor
und die Kovarianzmatrix den Erwartungswert des dyadischen Produkts
der Störgrößen
darstellt.
Diese Annahme ist die Homoskedastizitätsannahme im multiplen Fall. Durch
obige Spezifikation
des linearen Modells erhält man damit für den Zufallsvektor
.
Durch diese Annahmen erhält man:
- Dass der Kleinste-Quadrate-Schätzer für den wahren Parametervektor
, der
lautet, ein minimalvarianter linearer erwartungstreuer Schätzer für
ist.
- Dass die Kovarianzmatrix
des Kleinste-Quadrate-Schätzers
ist.
- Dass die geschätzte Varianz der Störgrößen
ein erwartungstreuer Schätzer für die unbekannte Varianz der Störgrößen
ist.
Minimalvarianter linearer erwartungstreuer Schätzer
Minimalvarianter
Der minimalvariante, bzw. „der Beste“ Schätzer zeichnet sich dadurch aus, dass er die „kleinste“ Kovarianzmatrix (bzgl. der Loewner-Halbordnung) aufweist (ist somit minimalvariant). Ein Schätzer der diese Eigenschaft aufweist wird deshalb auch minimalvarianter oder effizienter Schätzer genannt. Bei zusätzlicher Annahme von Erwartungstreue spricht man auch vom minimalvarianten erwartungstreuen Schätzer.
Jeder Schätzer aus der Klasse der linearen erwartungstreuen Schätzer lässt sich darstellen als
(Linearität)
mit der -Matrix
.
Ein Beispiel für ein Schätzer diese Klasse ist der Kleinste-Quadrate-Schätzer
.
Die Eigenschaft der Erwartungstreue besagt, dass die Schätzfunktion „im Mittel“ dem wahren Parametervektor entspricht
.
Unter den oben genannten Voraussetzungen gilt dann, für alle
Vektoren
,
die Ungleichung:
(Effizienzeigenschaft),
wobei
der Kleinste-Quadrate-Schätzer ist, also der Schätzer der mittels der Kleinste-Quadrate-Schätzung
ermittelt wurde. Diese Effizienzeigenschaft kann auch umgeschrieben werden in
oder
.
Diese Eigenschaft wird positive
Semidefinitheit genannt (siehe auch Kovarianzmatrix
als Effizienzkriterium). Wenn also obige Ungleichung zutrifft, dann kann man
sagen, dass
besser ist als
.
Linearität
Für den Kleinste-Quadrate-Schätzer gilt, dass er ebenfalls linear ist
.
Die obige Ungleichung besagt, dass nach dem Satz von Gauß-Markow ,
ein bester linearer erwartungstreuer Schätzer, kurz BLES
(englisch
Best Linear Unbiased Estimator, kurz: BLUE) bzw. ein
minimalvarianter linearer erwartungstreuer Schätzer ist, das heißt in der Klasse
der linearen erwartungstreuen Schätzern ist er derjenige Schätzer, der die
kleinste Varianz bzw. Kovarianzmatrix besitzt. Für diese Eigenschaft der
Schätzfunktion
braucht keine Verteilungsinformation der Störgröße vorzuliegen. Eine Steigerung
der BLES-Eigenschaft stellt die sogenannte BES-Eigenschaft (BES
für Bester
erwartungstreuer Schätzer) dar, bei der eine Beschränkung auf lineare
Schätzer nicht gegeben ist. Oft stellt der Maximum-Likelihood-Schätzer
eine Lösung dar, die BES ist. Tatsächlich ist der Kleinste-Quadrate-Schätzer
bei normalverteilten
Störgrößen ein Maximum-Likelihood-Schätzer und mit dem Satz von
Lehmann-Scheffé kann die BES-Eigenschaft nachgewiesen werden.
Beweis
Gegeben, dass der wahre datengenerierende Prozess durch ein lineares Modell
beschrieben wird, gilt es den Kleinste-Quadrate-Schätzer mit allen anderen
linearen Schätzern zu vergleichen. Um einen Vergleich anstellen zu können
beschränkt man sich in der Analyse auf die Klasse der linearen und
erwartungstreuen Schätzer. Jeder beliebige Schätzer dieser Klasse, neben dem
Kleinste-Quadrate Schätzer ,
kann dargestellt werden als
mit
.
Falls
erhält man den Kleinste-Quadrate-Schätzer
.
Die Klasse aller linearen Schätzer ist somit gegeben durch
, wobei die Matrix
gegeben ist durch
Nun gilt es Restriktionen für
zu finden die sicherstellen, dass
erwartungstreu
für
ist. Ebenfalls muss die Kovarianzmatrix
von
gefunden werden. Der Erwartungswert
von
ergibt
D.h.
ist dann und nur dann erwartungstreu für
,
wenn
,
also gilt
,
da die Datenmatrix stets als fest
und von Null verschieden angenommen wird.
Es folgt für die Kovarianzmatrix von :
Daraus folgt
Diese Matrix wird immer positiv semidefinit sein, – unabhängig wie
definiert ist – da eine Matrix multipliziert mit ihrer eigenen Transponierten
immer positiv semidefinit ist.
Singulärer Fall, schätzbare Funktionen
Wir betrachten nun den sog. singulären Fall, d.h. es gilt .
Dann ist auch
nicht von vollem Rang, also nicht invertierbar. Der oben angegebene
Kleinste-Quadrate-Schätzer
existiert nicht. Man sagt,
ist nicht schätzbar bzw. nicht identifizierbar.
Der singuläre Fall tritt dann ein, wenn ,
oder wenn nur in
verschiedenen Regressoreinstellungen beobachtet wird, oder wenn lineare
Abhängigkeiten in der Datenmatrix
vorliegen.
Sei nun .
Dann sind bestenfalls
-dimensionale
Linearformen
linear und erwartungstreu schätzbar, wobei
eine
-Matrix
ist.
Schätzbarkeitskriterium
mit einer
-Matrix
ist schätzbar genau dann, wenn es eine
-Matrix
gibt, so dass
gilt, d.h. wenn jeder Zeilenvektor
von
eine Linearkombination
der Zeilenvektoren von
ist.
Wesentlich eleganter kann das Schätzbarkeitskriterium mit Pseudoinversen formuliert
werden. Dabei heißt
Pseudoinverse von
,
wenn
gilt.
mit einer
-Matrix
ist schätzbar genau dann, wenn
.
Dabei ist
eine beliebige Pseudoinverse von
.
Beispiel
Für die quadratische Regressionsgleichung
wurden
Beobachtungen bei
durchgeführt. Damit ergibt sich
.
Dann ist
schätzbar, weil die Zeilenvektoren von
Linearkombinationen der Zeilenvektoren von
sind. Beispielsweise ist der zweite Zeilenvektor von
gleich der Differenz aus drittem und erstem Zeilenvektor von
.
Hingegen ist
nicht schätzbar, weil sich keiner der Zeilenvektoren von
als Linearkombination der der Zeilenvektoren von
darstellen lässt.
Satz von Gauß-Markow im singulären Fall
Sei
schätzbar. Dann ist
bester linearer erwartungstreuer Schätzer für ,
wobei
eine beliebige Pseudoinverse zu
ist.
Der Schätzer
kann auch ohne Pseudoinverse ausgedrückt werden:
Dabei ist
eine beliebige Lösung des Normalgleichungssystems
.
Verallgemeinerte Kleinste-Quadrate-Schätzung
Die verallgemeinerte
Kleinste-Quadrate-Schätzung (VKQ-Schätzung), die von Alexander Aitken
entwickelt wurde, erweitert der Satz von Gauß-Markow auf den Fall, bei dem der
Vektor der Störgrößen eine nichtskalare Kovarianzmatrix
hat, d.h. es gilt .
Der VKQ-Schätzer ist ebenfalls BLUE.
Siehe auch



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 31.03. 2020