Summe der Abweichungsquadrate
In der Statistik ist die Summe
der Abweichungsquadrate (SAQ bzw. englisch sum of
squared deviations, kurz SSD), auch Abweichungsquadratsumme,
kurz Summe der Quadrate oder Quadratsumme (SQ oder
Q bzw. englisch
sum of squares, kurz SS) genannt, die Summe der quadratischen
Abweichungen der Messwerte von ihrem arithmetischen
Mittel. Die Summe der Abweichungsquadrate ist ein Maß für die Stärke der
Schwankungen der Messwerte um deren Mittelwert und damit ein Maß für die
„Variation“ eines Merkmals .
Eine Verallgemeinerung der Summe der Abweichungsquadrate stellt die Summe der
Abweichungsprodukte (SAP bzw. englisch sum of
products of deviations, kurz SPD), auch
Abweichungsproduktsumme, kurz Summe der Produkte (SP
bzw. englisch
sum of products, kurz SP) oder Produktsumme (selten auch
Summe der Kreuzprodukte bzw. Kreuzproduktsumme) dar und ist ein
Maß für den Grad der gemeinsamen Variation (der „Kovariation“)
und
.[1]
Definition
Die Abweichungsquadratsumme ergibt sich als Summe der quadratischen
Abweichungen der Messwerte von ihrem arithmetischen
Mittelwert
.
Alternativ lässt sich Abweichungsquadratsumme durch den Verschiebungssatz von Steiner wie folgt angeben:
.
Um den Unterschied zur Produktsumme deutlicher herauszustellen wird
sie auch als
notiert. Für Anwendungen, besonders in der Varianzanalyse,
wird die Notation der Abweichungsquadratsumme mit
bevorzugt.
Falls das Merkmal keinerlei Variabilität aufweist, d.h. ,
dann ergibt sich eine Quadratsumme (und eine Varianz) von Null. In die
Berechnung der Summe gehen insgesamt
Abweichungsquadrate ein, sodass die Abweichungsquadratsumme umso größer ist, je
größer die Stichprobengröße ist.
Mittleres Abweichungsquadrat
Um ein von der Stichprobengröße unabhängiges Maß für die Variation der
Merkmalswerte zu erhalten, muss eine Normierung vorgenommen werden. Die
Normierung geschieht dadurch, dass man die Abweichungsquadratsumme durch die Anzahl
der Freiheitsgrade
dividiert:
.
Das so gewonnene Streuungsmaß
stellt eine Art „mittleres“ bzw. „durchschnitlliches“ Abweichungsquadrat dar (englisch mean
square, kurz: MS), dass mit
bzw.
(Mittlere Quadrate der Abweichungen bzw.
Durchschnittliche Quadrate der Abweichungen) abgekürzt wird.
Das „mittlere Abweichungsquadrat“ (oft fälschlicherweise „mittlere Quadratsumme“
genannt) ist die empirische
Varianz, wird aber in der Varianzanalyse
nicht als Varianz, sondern als mittlere Abweichungsquadrat bezeichnet. Die
Abweichungsquadratsumme ist also die
-fache
empirische Varianz
der Messwerte.
Das mittlere Quadrat der Residuen
heißt „mittleres Residuenquadrat“.
Verallgemeinerung
Die Abweichungsproduktsumme bzw. die Summe der Abweichungsprodukte ist eine Verallgemeinerung der Abweichungsquadratsumme und ist definiert als Summe der Produkte der mittelwertbereinigten Messwertpaare:
.
Insbesondere gilt .
Die empirische
Kovarianz
ist die Summe der Abweichungsprodukte der Messwerte von
und
dividiert durch
:
.
Die empirische Kovarianz kann somit als „mittleres“ bzw. „durchschnittliches“ Abweichungsprodukt interpretiert werden.
Spezielle Quadratsummen
Residuenquadratsumme
Ausgehend von den Residuen, die den vertikalen Abstand zwischen Beobachtungspunkt und der geschätzten Regressionsgerade messen, lässt sich eine Residuenquadratsumme durch die Summe der Abweichungsquadrate der Residuen wie folgt definieren
.
Hypothesenquadratsumme
Die Hypothesenquadratsumme (englisch
sum of squares due to hypothesis) tritt beim Testen
der allgemeinen linearen Hypothese auf. Sei
eine
Restriktionsmatrix,
mit
Sei weiterhin angenommen, dass die
Restriktionen an den
Parametervektor
ausgedrückt werden können als :
,
wobei
ein
-Vektor
bestehend aus bekannten Konstanten darstellt. Die Hypothesenquadratsumme ist
dann gegeben durch
.
Anmerkungen
- ↑ Das gemeinsame Variieren zweier oder mehrerer Merkmale bezeichnet man als „Ko-Variation“



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 03.02. 2022