Mahalanobis-Abstand
Der Mahalanobis-Abstand, auch Mahalanobis-Distanz oder verallgemeinerter Abstand (nach Mahalanobis) genannt, ist ein Distanzmaß zwischen Punkten in einem mehrdimensionalen Vektorraum. Intuitiv gibt der Mahalanobis-Abstand zweier Punkte ihren Abstand in Standardabweichungen an. Der Mahalanobis-Abstand wird speziell in der Statistik verwendet, zum Beispiel im Zusammenhang mit multivariaten Verfahren.
Definition
Bei multivariaten
Verteilungen werden die
Koordinaten eines Punktes als
-dimensionaler
Spaltenvektor
dargestellt. Man fasst ihn als Realisierung
eines Zufallsvektors
mit der Kovarianzmatrix
auf. Der Abstand zweier so verteilter Punkte
und
wird dann durch den Mahalanobis-Abstand in der Grundgesamtheit
bestimmt. Der Mahalanobis-Abstand ist skalen- und translationsinvariant.
Analog gilt für den Mahalanobis-Abstand in der Stichprobe:
,
wobei
die Inverse der Stichproben-Kovarianzmatrix
darstellt.
Im Zweidimensionalen bilden die Punkte mit gleichem Mahalanobis-Abstand von
einem Zentrum graphisch eine Ellipse
(deren Achsen nicht notwendigerweise in Richtung der Koordinatenachsen zeigen),
während es beim euklidischen
Abstand ein Kreis ist. Ist die Kovarianzmatrix die Einheitsmatrix (dies ist
genau dann der Fall, wenn die einzelnen Komponenten des Zufallsvektors
paarweise unkorreliert
sind und jeweils Varianz 1 besitzen), so entspricht der Mahalanobis-Abstand
dem euklidischen Abstand. Die Flächen
konstanten Abstandes von einem Punkt können beim Mahalanobis-Abstand
beliebige Kegelschnitte
sein.
Mathematisch ergibt sich der Mahalanobis-Abstand aus der -dimensionalen
Normalverteilung mit Erwartungswertvektor
und Kovarianzmatrix
,
wobei
gilt. Diese Verteilung besitzt nämlich die Dichte
.
Durch Logarithmieren dieses Ausdrucks erhält man die logarithmische Dichte
mit einer Konstanten ,
was bis auf die fehlende Wurzel, den Vorfaktor und den Summanden
dem Mahalanobis-Abstand entspricht.
Anwendungen
In der Diskriminanzanalyse
wird die Zuordnung eines Punktes zu einer bestimmten gegebenen Population unter
anderem mit dem Mahalanobis-Abstand bestimmt. Ein weiteres Anwendungsgebiet ist
die Erkennung von Ausreißern
mit Hilfe des Mahalanobis-Abstands, wobei der Punkt
durch einen (robusten) Lageparameter ersetzt wird. Kritisch ist dabei
anzumerken, dass sowohl die Kovarianzmatrix als auch die Lageparameter durch
Ausreißer verzerrt sein können. Sie werden in den meisten Fällen durch robuste
Verfahren geschätzt, z.B. mit Hilfe der MCD-Schätzer (MCD englisch für
Minimum Covariance Determinant, deutsch
etwa Schätzer mit kleinstmöglicher Determinante
der Kovarianzmatrix).
Weiterhin können bei der Verwendung des Mahalanobis-Abstandes als Abstandsklassifikator
zwei Fälle unterschieden werden:
- Die Kovarianzmatrix ist für alle Klassen gleich oder gemittelt.
- Es werden unterschiedliche Kovarianzmatrizen für die einzelnen Klassen verwendet.
Die Entscheidung für eine Alternative ist durch empirische Analysen zu begründen.
Siehe auch
![Trenner](/button/corpdivider.gif)
![Extern](/button/extern.png)
![Seitenende](/button/stonrul.gif)
© biancahoegel.de
Datum der letzten Änderung: Jena, den: 08.05. 2021