Ordnungsstatistik
In der Statistik bezeichnet die
-te
Ordnungsstatistik (auch Ordnungsgröße genannt)
den
-kleinsten
Wert einer Stichprobe.
Ordnungsstatistiken sind damit spezielle Zufallsvariablen.
Sie werden aus einer vorgegebenen Gruppe von Zufallsvariablen gewonnen und
modifizieren diese so, dass die Realisierungen
der Ordnungsstatistik den Realisierungen der zugrunde liegenden Zufallsvariablen
entsprechen, aber immer der Größe nach geordnet sind.
Daher treten Ordnungsstatistiken insbesondere bei der Untersuchung von zufälligen Strukturen auf, die mit einer Ordnung versehen sind. Dazu zählt beispielsweise die Analyse von Wartezeitprozessen oder die Bestimmung von Schätzfunktionen für den Median oder Quantile.
Definition
Gegeben seien Zufallsvariablen .
Sind die Zufallsvariablen bindungsfrei, nehmen also fast
sicher nicht denselben Wert an, formell ausgedrückt
,
so definiert man
und
für .
Dann heißen
die Ordnungsstatistiken von
.
Die Zufallsvariable
wird dann auch die
-te
Ordnungsstatistik genannt. Als alternative Notation wird auch
anstelle von
verwendet.
Sind die Zufallsvariablen nicht bindungsfrei, so lassen sich die Ordnungsstatistiken definieren als
.
Hierbei bezeichnet
die Indikatorfunktion
auf der Menge
.
Im bindungsfreien Fall stimmen beide Definitionen überein. Nicht alle Autoren
fordern wie oben, dass die Zufallsvariablen fast sicher ungleiche Werte
annehmen. Die Eigenschaften der Ordnungsstatistiken variieren dann leicht.
Eigenschaften
Fordert man in der Definition
für alle
,
so gilt
Äquivalent dazu gilt für die Realisierungen
für fast alle Ereignisse
.
Die Realisierungen der Ordnungsstatistiken sind also (fast sicher) strikt aufsteigend.
Verzichtet man auf die Forderung, dass die Zufallsvariablen fast sicher nicht dieselben Werte annehmen sollen, so gilt entsprechend
Die Realisierungen sind dann nur noch (fast sicher) aufsteigend.
Verteilung der Ordnungsstatistiken
Für die Verteilungsfunktion
der -ten
Ordnungsstatistik gilt
Wichtige Spezialfälle der Verteilung ergeben sich für das Minimum ()
und Maximum (
)
als
Hat die Verteilung von
eine Dichtefunktion
,
dann erhält man durch Differenzieren die Dichtefunktion
der -ten
Ordnungsstatistik.
Anwendung
In der nichtparametrischen Statistik lassen sich Rangstatistiken oder empirische Verteilungsfunktionen durch Ordnungsstatistiken ausdrücken. Zudem können aus Ordnungsstatistiken schwach konsistente Schätzer für Quantile abgeleitet werden. Weiter lassen sich durch oben genannte Verteilung über Faltungen und Transformationssätze die Verteilung von wichtigen Maßzahlen wie dem Median oder der Spannweite gewinnen.
Beispiel

Es wird das Finale eines Wettbewerbs der Leichtathletik, bestehend aus den
besten
Teilnehmern, ausgetragen. In diesem Beispiel wird angenommen, dass die
Leistungsdichte im Finale des Wettkampfes sehr groß ist und es daher keine
Favoriten für die Medaillen gibt. Für die zufällige Gesamtpunktzahl jedes
Athleten wird daher dieselbe stetige Gleichverteilung im Punktebereich von
bis
angenommen. Es entscheidet demnach ausschließlich die Tagesform über die
Gesamtpunktzahl, welche starken Schwankungen unterliegt, und alle Athleten
besitzen das gleiche Leistungspotential. Setzt man die Dichtefunktion
und die Verteilungsfunktion
der stetigen Gleichverteilung in die obige Dichtefunktion der
Ordnungsstatistik ein, erhält man die Verteilungen für die einzelnen Ränge. Da
die Punktzahlen in der Ordnungsstatistik aufsteigend sortiert sind, erhält man
für
die Wahrscheinlichkeitsverteilung für die Goldmedaille, für
die der Silbermedaille und für
die der Bronzemedaille. Der nebenstehenden Grafik ist bereits zu entnehmen, dass
für die Goldmedaille eine höhere Punktzahl zu erwarten ist als für die Silber-
oder Bronzemedaille. Da die Punkte in diesem Beispiel als stetige
Gleichverteilung modelliert wurden, ist die
-te
Ordnungsstatistik für
(siehe Grafik) jeweils Beta-verteilt
(multipliziert mit
)
mit den Parametern
und
.
Der Erwartungswert einer solchen Betaverteilung ist
.
Für die Goldmedaille ist daher eine Punktzahl von
,
für Silber
und für Bronze
zu erwarten. Falls ein Athlet bereits
Punkte erhalten hat und auf die Punktzahlen der anderen Sportler wartet, kann er
unter den gemachten Annahmen seine eigenen Chancen für Gold berechnen. Die
Wahrscheinlichkeit, dass die
anderen Athleten alle schlechter abschneiden, beträgt
.
Falls der Athlet insgesamt
Punkte erhält, wie für die Goldmedaille erwartet, wird er also trotzdem nur mit
einer Wahrscheinlichkeit von
die Goldmedaille bekommen.
Literatur
- Herbert Büning und Götz Trenkler: Nichtparametrische statistische Methoden. 2. Auflage, de Gruyter, Berlin und New York 1994, ISBN 3-11-016351-9



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 03.02. 2022