Prädiktionsmatrix
In der Statistik ist die
Prädiktionsmatrix (englisch
prediction matrix) eine symmetrische
und idempotente Matrix und damit
eine Projektionsmatrix.
Die Prädiktionsmatrix wird gelegentlich Hut-Matrix oder
Dach-Matrix genannt, da sie
auf
abbildet. Dementsprechend wird sie entweder mit
oder
notiert. Der Begriff „Prädiktionsmatrix“ bzw. „Vorhersagematrix“ wurde von
Hoaglin & Welsh (1978)
sowie Chatterjee & Hadi (1986)
geprägt und rührt daher, dass wenn man die Matrix auf die
-Werte
anwendet sie die vorhergesagten Werte (
-Werte)
generiert.
Eine weitere in der Statistik wichtige Matrix ist die Residualmatrix,
die durch die Prädiktionsmatrix definiert wird und ebenfalls eine
Projektionsmatrix ist.
Definition
Gegeben ein typisches multiples
lineares Regressionsmodell ,
mit
dem
Vektor der unbekannten Regressionsparameter,
der
Versuchsplanmatrix
,
dem
Vektor der abhängigen Variablen
und dem
Vektor der Störgrößen
.
Dann ist die Prädiktionsmatrix definiert durch
mit
.
Die Matrix
wird auch Moore-Penrose-Inverse
von
genannt.
Die mithilfe der Methode
der kleinsten Quadrate geschätzte Regressions(hyper)ebene ist dann gegeben
durch die Stichproben-Regressionsfunktion
,
wobei
der Kleinste-Quadrate-Schätzvektor ist. Die Prädiktionsmatrix
ist die Matrix der Orthogonalprojektion
auf den Spaltenraum von
und hat maximal den Rang
(
ist die Anzahl der Parameter des Regressionsmodells). Falls
eine
Matrix mit
ist, dann ist
.
Da
eine Projektionsmatrix ist, gilt
.
Die Idempotenz- und die Symmetrieeigenschaft (
und
)
implizieren, dass
ein orthogonaler
Projektor auf den Spaltenraum
ist.
Die Projektionsrichtung ergibt sich aus der Matrix
,
deren Spalten senkrecht auf
stehen. Die Matrix
wird Prädiktionsmatrix genannt, da sich die Vorhersagewerte
durch die linksseitige Multiplikation des Vektors
mit dieser Matrix ergeben. Dies kann durch Einsetzen des KQ-Parameterschätzers
wie folgt gezeigt werden:
.
Die Vorhersagewerte von
(die
-Werte)
können also als eine Funktion der beobachteten
-Werte
verstanden werden. Zahlreiche statistische Resultate lassen sich auch mit der
Prädiktionsmatrix darstellen. Beispielsweise lässt sich der Residualvektor
mittels der Prädiktionsmatrix darstellen als:
.
Die (nichttriviale) Kovarianzmatrix
des Residualvektors lautet
und spielt für die Analyse von Hebelwerten
eine Rolle.
Eigenschaften
Idempotenz
Die Prädiktionsmatrix ist idempotent. Dies kann so interpretiert werden, dass „zweimaliges Anwenden der Regression zum gleichen Ergebnis führt“. Die Idempotenzeigenschaft der Prädiktionsmatrix kann wie folgt gezeigt werden:
,
wobei
die Einheitsmatrix
ist.
Symmetrie
Die Prädiktionsmatrix ist symmetrisch. Die Symmetrieeigenschaft der Prädiktionsmatrix kann wie folgt gezeigt werden
Hebelwerte
Die Diagonalelemente
der Prädiktionsmatrix
können als Hebelwerte interpretiert werden und spielen in der Regressionsdiagnostik
eine große Rolle. Sie sind gegeben durch
.
Diese Hebelwerte werden bei der Berechnung des Cook-Abstands
verwendet und können genutzt werden, um einflussreiche
Beobachtungen zu identifizieren. Es gilt ,
wobei
die Anzahl der Zeilen in der Versuchsplanmatrix
darstellt, die unterschiedlich sind. Wenn alle Zeilen unterschiedlich sind, dann
gilt
.



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 06.03. 2020