Suffiziente σ-Algebra
Eine suffiziente σ-Algebra ist ein spezielles Mengensystem in der mathematischen Statistik, das verwendet wird, um die Kompression von Daten ohne Informationsverlust mittels suffizienter Statistiken zu formalisieren.
Definition
Gegeben sei ein statistisches
Modell
sowie eine Teil-σ-Algebra
.
Sei
der bedingte
Erwartungswert gegeben
unter Verwendung des Wahrscheinlichkeitsmaßes
.
Die σ-Algebra
heißt dann suffizient für
,
wenn für jedes
eine
-messbare Funktion
existiert, so dass
.
Bemerkungen
Ein Defizit des Suffizienzbegriffes ist, dass wenn
σ-Algebren sind mit
und
suffizient ist (bezüglich einer vorgegebenen Verteilungsklasse), dann folgt im
Allgemeinen nicht, dass auch
suffizient ist. Das würde man aber intuitiv erwarten, denn wenn schon die
kleinere σ-Algebra ausreichend ist, um eine verlustfreie Datenkompression zu
ermöglichen, dann sollte dies ebenso für die größere gelten, da sie ja die
kleinere enthält, in der alle Informationen von Belang schon vorhanden sind. Zu
beachten ist hier, dass die Datenkompression hier dem Weglassen der Mengen aus
der größeren σ-Algebra entspricht.
Formell lässt sich dieses Defizit wie folgt einsehen: ist
suffizient, so gilt laut Definition des bedingten Erwartungswertes
für alle ,
aber eben nicht notwendigerweise für alle
.
Erläuterung
Klar wird die Bedeutung des Begriffes, wenn man die Wahrscheinlichkeitsmaße
aus
auf
einschränkt. Dann gilt
.
Da aber
nicht von
abhängt, können sich die Wahrscheinlichkeitsmaße nur dann unterscheiden, wenn
schon deren Einschränkungen auf
verschieden sind. Damit sind alle möglichen Informationen, welche die
Wahrscheinlichkeitsmaße aus
liefern können, bereits in
enthalten.
Stabilität bezüglich Operationen
- Ist
und ist
suffizient für
, so ist
genau dann suffizient für
, wenn
suffizient ist für
.
- Sei
die Mengen aller
-Nullmengen. Sind
und
suffizient und ist
, so ist auch
suffizient.
- Ist
suffizient und ist
eine abzählbar erzeugte σ-Algebra, so ist auch
suffizient. Daraus folgt direkt, dass abzählbar erzeugte Ober-σ-Algebren von suffizienten σ-Algebren wieder suffizient sind.
Suffizienz und dominierte Verteilungsklassen
Mittels des Satzes
von Halmos-Savage lassen sich für dominierte
Verteilungsklassen
einige stärkere Aussagen zeigen:
- Sei
. Dann ist jede σ-Algebra
mit
- ebenfalls suffizient.
ist genau dann suffizient bezüglich
, wenn
suffizient bezüglich
ist für alle
.
- Sind für
die Verteilungsklassen
auf
dominiert und ist
suffizient, so ist auch
suffizient bezüglich
.
Eine weitere Möglichkeit zur Überprüfung der Suffizienz einer σ-Algebra bei Vorliegen einer dominierten Verteilungsklasse ist das Neyman-Kriterium.
Verwandte Begriffe
Der bekannteste Begriff, der sich aus der Suffizienz einer σ-Algebra ableiten
lässt, ist die suffiziente
Statistik. Eine Statistik
heißt suffizient, wenn die von ihr erzeugte σ-Algebra
suffizient ist.
Eine Abwandlung des hier behandelten Suffizienzbegriffes ist die starke Suffizienz,
die mittels Markow-Kernen
definiert wird. Auf borelschen Räumen
stimmen die beiden Begriffe überein. Eine Verstärkung der Suffizienz ist die
Minimalsuffizienz:
eine σ-Algebra ist minimalsuffizient, wenn sie bis auf -Nullmengen
in jeder weiteren suffizienten σ-Algebra enthalten ist. Demnach ist eine
minimalsuffiziente σ-Algebra die maximal mögliche Datenreduktion.
Ein ebenfalls verwandter, aber gegenläufiger Begriff ist der einer vollständigen
Verteilungsklasse. Dies ist eine Verteilungsklasse ,
so dass auf
alle Funktionen unterschieden werden können.
Gegenteil des Suffizienzbegriffs ist die Verteilungsfreiheit. Sie formalisiert, dass eine σ-Algebra keine Informationen trägt bzw. dass eine Statistik keine Informationen überträgt.
Eine Verbindung von Suffizienz, Vollständigkeit und Verteilungsfreiheit schlagen die drei Sätze von Basu.
Literatur
- Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6.



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 31.01. 2021