Projektionsmatrix (Statistik)
In der Statistik ist eine
Projektionsmatrix eine symmetrische
und idempotente Matrix.
Weiterhin sind alle Eigenwerte einer Projektionsmatrix entweder 0 oder 1 und
Rang und Spur einer Projektionsmatrix sind identisch.
Die einzige nichtsinguläre Projektionsmatrix ist die Einheitsmatrix. Alle
anderen Projektionsmatrizen sind singulär. Die wichtigsten Projektionsmatrizen
in der Statistik stellen die Prädiktionsmatrix
und die residuenerzeugende Matrix bzw. Residualmatrix
dar. Sie sind ein Beispiel für eine Orthogonalprojektion
im Sinne der linearen
Algebra, wo jeder Vektor
eines Vektorraumes mit Skalarprodukt bei
gegebener Projektionsmatrix
in eindeutiger Weise zerlegt werden kann gemäß
.
Eine weitere in der Statistik wichtige Projektionsmatrix ist die zentrierende
Matrix.
Ausgangslage
Als Ausgangslage betrachten wir ein typisches multiples
lineares Regressionsmodell mit gegebenen Daten
für
statistische
Einheiten und
Regressoren. Der Zusammenhang zwischen der abhängigen Variablen und den
unabhängigen Variablen kann wie folgt dargestellt werden
.
In Matrixnotation auch
mit .
In kompakter Schreibweise
.
Hier stellt
einen Vektor von unbekannten Parametern dar (bekannt als Regressionskoeffizienten),
die mithilfe der Daten geschätzt werden müssen. Des Weiteren wird angenommen,
dass die Fehlerterme
im Mittel null sind:
,
was bedeutet, dass wir davon ausgehen können, dass unser Modell im Mittel
korrekt ist.
Prädiktionsmatrix
Eine der wichtigsten Projektionsmatrizen in der Statistik ist die Prädiktionsmatrix. Die Prädiktionsmatrix ist wie folgt definiert
mit
,
wobei
die Datenmatrix darstellt. Die
Diagonalelemente der Prädiktionsmatrix
werden
genannt und können als Hebelwerte interpretiert werden.
Residuenerzeugende Matrix
Die residuenerzeugende Matrix (englisch residual-maker matrix), auch Residuum-erzeugende Matrix, Residualmatrix ist wie folgt definiert
,
wobei P die Prädiktionsmatrix darstellt. Der Name residuenerzeugende Matrix
ergibt sich dadurch, dass diese Projektionsmatrix multipliziert mit dem y-Vektor
den Residualvektor
ergibt. Der kann durch die Prädiktionsmatrix kompakt wie folgt ausgedrückt
werden
.
Bei linearen Modellen sind Rang und Spur einer Projektionsmatrix identisch. Für den Rang der residuenerzeugenden Matrix gilt
Idempotenz
Die Idempotenzeigenschaft der residuenerzeugenden Matrix kann wie folgt gezeigt werden
Symmetrie
Die Symmetrie der residuenerzeugenden Matrix folgt direkt aus der Symmetrie der Prädiktionsmatrix und kann wie folgt gezeigt werden
Weitere Eigenschaften
Die Projektionsmatrix hat eine Fülle von nützlichen algebraischen
Eigenschaften.
In der Sprache der linearen Algebra ist die Projektionsmatrix eine orthogonale
Projektion auf den Spaltenraum der Datenmatrix
.
Weitere Eigenschaften der Projektionsmatrizen werden im Folgenden
zusammengefasst:
und
ist invariant unter
:
folglich
.
(„Anwendung der Regression auf die Residuen liefert
“)
ist eindeutig für einen bestimmten Unterraum
- Alle Eigenwerte einer Projektionsmatrix sind entweder 0 oder 1
Anwendungen
Schätzung des Varianzparameters nach der Kleinste-Quadrate-Schätzung
Die Residuenquadratsumme, kurz SQR (Summe der Quadrate der Restabweichungen (oder: „Residuen“) bzw. englisch sum of squared residuals, kurz SSR) ergibt in Matrixschreibweise
.
Dies kann auch geschrieben werden als
.
Eine erwartungstreue Schätzung der Varianz der Störgrößen ist das „mittlere Residuenquadrat“:
.
Mithilfe der residuenerzeugenden Matrix lässt sich die Varianz der Fehlerterme auch schreiben als
.



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 11.03. 2020