Neyman-Kriterium

Das Neyman-Kriterium ist in der mathematischen Statistik ein Kriterium für die Suffizienz von σ-Algebren und Suffizienz von Statistiken bei statistischen Modellen mit dominierten Verteilungsklassen. Das Neyman-Kriterium leitet sich aus dem Satz von Halmos-Savage ab, ist aber leichter anzuwenden als dieser. Somit ist das Neyman-Kriterium eines der gängigsten Kriterien, um zu überprüfen, ob eine Abbildung Daten ohne Informationsverlust komprimiert.

Es ist nach Jerzy Neyman benannt.

Aussage

Für σ-Algebren

Gegeben sei ein statistisches Modell  (\Omega, \mathcal A, \mathcal P) mit dominierter Verteilungsklasse {\mathcal  P}, die von \nu dominiert wird, sowie eine Unter-σ-Algebra {\mathcal {S}} von  \mathcal A .

Dann ist {\mathcal {S}} suffizient genau dann, wenn eine  \mathcal A-\mathcal B([0,\infty))-messbare Funktion h existiert und für jedes  P \in \mathcal P eine  \mathcal S - \mathcal B([0,\infty))-messbare Funktion  f_P existiert, so dass

 \frac{\mathrm dP}{\mathrm d\nu}(x)=h(x) \cdot f_P(x)

gilt bis auf eine  \nu-Nullmenge. Dabei ist  \tfrac{\mathrm dP}{\mathrm d\nu}(x) die Radon-Nikodým-Ableitung von P bezüglich \nu .

Für Statistiken

Unter denselben Voraussetzungen wie oben ist eine Statistik

 T: (\Omega, \mathcal A) \to (\Omega^*, \mathcal A^*)

suffizient genau dann, wenn eine  \mathcal A-\mathcal B([0,\infty))-messbare Funktion h existiert und für jedes  P \in \mathcal P eine  \Omega^* - \mathcal B([0,\infty))-messbare Funktion  f_P existiert, so dass

 \frac{\mathrm dP}{\mathrm d\nu}(x)=h(x) \cdot f_P(T(x))

gilt bis auf eine  \nu-Nullmenge. Dies folgt aus dem Faktorisierungslemma und der Tatsache, dass T eine suffiziente Statistik ist genau dann, wenn  \sigma (T) eine suffiziente σ-Algebra ist.

Beispiel: Suffizienz der Exponentialfamilie

Per Definition hat für die Exponentialfamilie {\mathcal  P} bezüglich \mu jedes  P \in \mathcal P die Dichtefunktion

 f_{\vartheta}(x)= \frac{\mathrm dP}{\mathrm d\mu}(x)=C(\vartheta)h(x)\exp (\langle Q(\vartheta);T(x)\rangle)

Dies ist aber bereits genau die oben geforderte Zerlegung. h und T sind bereits korrekt, man setzt dann nur noch

 f_P(y)=\tilde f_\vartheta(y)=C(\vartheta)\exp (\langle Q(\vartheta);y\rangle)

um zu zeigen, dass T eine suffiziente Statistik für die Exponentialfamilie ist.

Literatur

Trenner
Basierend auf einem Artikel in: Extern Wikipedia.de
Seitenende
Seite zurück
© biancahoegel.de
Datum der letzten Änderung: Jena, den: 01.01. 2021