Stochastisch unabhängige Zufallsvariablen

Die stochastische Unabhängigkeit von Zufallsvariablen ist ein zentrales Konzept der Wahrscheinlichkeitstheorie und der Statistik, das die stochastische Unabhängigkeit von Ereignissen und die Unabhängigkeit von Mengensystemen verallgemeinert. Die stochastische Unabhängigkeit von Zufallsvariablen wird beispielsweise bei der Formulierung des Zentralen Grenzwertsatzes benötigt.

Definition für zwei Zufallsvariablen

Gegeben sei ein Wahrscheinlichkeitsraum $(\Omega ,{\mathcal A},P)$ sowie zwei Messräume $(E_{1},\Sigma _{1})$ und $(E_{2},\Sigma _{2})$ und zwei Zufallsvariablen

$X_{1}:(\Omega ,{\mathcal A},P)\to (E_{1},\Sigma _{1})$

und

$X_{2}:(\Omega ,{\mathcal A},P)\to (E_{2},\Sigma _{2})$ .

Die beiden Zufallsvariablen heißen stochastisch unabhängig oder einfacher unabhängig, wenn für jedes $B_{1}\in \Sigma _{1}$ und jedes $B_{2}\in \Sigma _{2}$ gilt, dass

$P(\{\omega \in \Omega \colon X_{1}(\omega )\in B_{1}\,{\text{und}}\,X_{2}(\omega )\in B_{2}\})=P(\{\omega \in \Omega \colon X_{1}(\omega )\in B_{1}\})\cdot P(\{\omega \in \Omega \colon X_{2}(\omega )\in B_{2}\})$ .

Meist werden die Mengen kompakter notiert, indem man anstelle von $\{\omega \in \Omega \colon X_{2}(\omega )\in B_{2}\}$ einfach $\{X_{2}\in B_{2}\}$ schreibt. Dann lautet die Definition

$P(\{X_{1}\in B_{1},\,X_{2}\in B_{2}\})=P(\{X_{1}\in B_{1}\})\cdot P(\{X_{2}\in B_{2}\})$

für alle $B_{1}\in \Sigma _{1},\,B_{2}\in \Sigma _{2}$ .

Eine alternative Definition wird durch die stochastische Unabhängigkeit von Ereignissen ermöglicht. Man definiert dann

$A_{{B_{1}}}^{1}=\{\omega \in \Omega \colon X_{1}(\omega )\in B_{1}\}$

$A_{{B_{2}}}^{2}=\{\omega \in \Omega \colon X_{2}(\omega )\in B_{2}\}$ .

Die Zufallsvariablen $X_{1},X_{2}$ heißen dann stochastisch unabhängig, wenn für alle $B_{1}\in \Sigma _{1},B_{2}\in \Sigma _{2}$ gilt, dass die $A_{{B_{1}}}^{1}$ und $A_{{B_{2}}}^{2}$ stochastisch unabhängige Ereignisse sind, also

$P(A_{B_{1}}^{1}\cap A_{B_{2}}^{2})=P(A_{B_{1}}^{1})P(A_{B_{2}}^{2})$

gilt.

Beispiel

Wir betrachten den Wahrscheinlichkeitsraum $(\Omega ,{\mathcal A},P)$ mit Grundmenge $\Omega =\{1,2,3,4\}$ , σ-Algebra ${\mathcal A}={\mathcal P}(\Omega )$ und als Wahrscheinlichkeitsmaß die Gleichverteilung auf der Grundmenge. Sei $E_{1}=E_{2}=\{0,1\}$ und $\Sigma _{1}=\Sigma _{2}={\mathcal P}(\{0,1\})$ . Die Zufallsvariablen sind definiert als

$X_{1}(\omega )={\begin{cases}1&{\text{ falls }}\omega \in \{1,2\}\\0&{\text{ falls }}\omega \in \{3,4\}\end{cases}}$

$X_{2}(\omega )={\begin{cases}1&{\text{ falls }}\omega \in \{2,3\}\\0&{\text{ falls }}\omega \in \{1,4\}\end{cases}}$

Jede der σ-Algebren hat 4 Elemente: $\emptyset ,\{0\},\{1\},\{0,1\}$ . Demnach wären 16 Kombinationen zu überprüfen. Die Fälle, in denen eine der beteiligten Mengen die Obermenge oder die leere Menge ist, können jedoch ausgeschlossen werden, da jede Menge von diesen beiden unabhängig ist. Demnach bleiben nur 4 Fälle übrig: $B_{1}=\{0\}$ oder $B_{1}=\{1\}$ kombiniert mit $B_{2}=\{0\}$ oder $B_{2}=\{1\}$

Sei $B_{1}=B_{2}=\{0\}$ . Dann ist $A_{{B_{1}}}^{1}=\{3,4\}$ und $A_{{B_{2}}}^{2}=\{1,4\}$ sowie $A_{{B_{1}}}^{1}\cap A_{{B_{2}}}^{2}=\{4\}$ . Diese Ereignisse sind unabhängig, denn es ist $P(\{4\})={\tfrac {1}{4}}=P(\{3,4\})P(\{1,4\})$ .
Sei $B_{1}=B_{2}=\{1\}$ . Dann ist $A_{{B_{1}}}^{1}=\{1,2\}$ und $A_{{B_{2}}}^{2}=\{2,3\}$ sowie $A_{{B_{1}}}^{1}\cap A_{{B_{2}}}^{2}=\{2\}$ . Diese Ereignisse sind unabhängig, denn es ist $P(\{2\})={\tfrac {1}{4}}=P(\{1,2\})P(\{2,3\})$ .
Sei $B_{1}=\{1\}$ und $B_{2}=\{0\}$ . Dann ist $A_{{B_{1}}}^{1}=\{1,2\}$ und $A_{{B_{2}}}^{2}=\{1,4\}$ sowie $A_{{B_{1}}}^{1}\cap A_{{B_{2}}}^{2}=\{1\}$ . Diese Ereignisse sind unabhängig, denn es ist $P(\{1\})={\tfrac {1}{4}}=P(\{1,2\})P(\{1,4\})$ .
Sei $B_{1}=\{0\}$ und $B_{2}=\{1\}$ . Dann ist $A_{{B_{1}}}^{1}=\{3,4\}$ und $A_{{B_{2}}}^{2}=\{2,3\}$ sowie $A_{{B_{1}}}^{1}\cap A_{{B_{2}}}^{2}=\{3\}$ . Diese Ereignisse sind unabhängig, denn es ist $P(\{3\})={\tfrac {1}{4}}=P(\{3,4\})P(\{2,3\})$ .

Somit sind alle Ereignisse unabhängig und demnach auch die Zufallsvariablen.

Allgemeine Definition

Die Familie von Zufallsvariablen $X_{i}\colon (\Omega ,{\mathcal A},P)\rightarrow (E_{i},\Sigma _{i})$ , $i\in I$ für eine beliebige Indexmenge heißt stochastisch unabhängig, falls für jede endliche Teilmenge von gilt, dass

$P\left(\bigcap _{{j\in J}}\{X_{j}\in B_{j}\}\right)=\prod _{{j\in J}}P(X_{j}\in B_{j})$

für alle $B_{j}\in \Sigma _{j}$ gilt.

Mit der Unabhängigkeit für Mengensysteme wird die stochastische Unabhängigkeit von Zufallsvariablen auch wie folgt definiert: Eine Familie von Zufallsvariablen sind genau dann stochastisch unabhängig, wenn ihre Initial-σ-Algebren voneinander unabhängig sind.

Diese Definition kann äquivalent auf Zufallsvektoren, also auf $\mathbb {R} ^{n}$ -wertige Zufallsvariablen, angewandt werden. An die Unabhängigkeit der Komponentenabbildungen sind dabei keine weiteren Forderungen gestellt

Kriterien für Unabhängigkeit

Erzeugendensysteme

Die Anzahl der auf Unabhängigkeit zu überprüfenden Mengen lässt sich reduzieren, wenn ein Erzeuger bekannt ist. Existiert zu jeder σ-Algebra $\Sigma _{i}$ ein durchschnittsstabiler Erzeuger ${\mathcal E}_{i}$ , gilt also $\sigma ({\mathcal E}_{i})=\Sigma _{i}$ , so genügt es, die Unabhängigkeit auf den Erzeugern zu überprüfen. Das Kriterium reduziert sich dann zu

$P\left(\bigcap _{{j\in J}}\{X_{j}\in B_{j}\}\right)=\prod _{{j\in J}}P(X_{j}\in B_{j})$

für alle $B_{j}\in {\mathcal E}_{j}$ und alle endlichen Teilmengen von . Für diskrete Wahrscheinlichkeitsräume wählt man als Erzeuger meist die Punktmengen $\{x_{k}\}$ , für reelle Zufallsvariablen die halboffenen Intervalle als Erzeuger der Borelsche σ-Algebra.

Endliche Familien

Ist die Familie von Zufallsvariablen und damit auch die Indexmenge endlich, zum Beispiel mit Indexmenge $I=\{1,\dots ,n\}$ , so genügt es

$P\left(\bigcap _{{i\in I}}\{X_{i}\in B_{i}\}\right)=\prod _{{i\in I}}P(X_{i}\in B_{i})$

für alle $B_{i}\in \Sigma _{i}$ zu überprüfen. Auf die Überprüfung der Teilmengen $J\subset I$ kann verzichtet werden. Dies folgt daraus, dass $\{X_{i}\in E_{i}\}=\Omega$ ist. Der Fall mit $J\subsetneqq I$ folgt dann automatisch aus dem obigen Fall, man setzt für $i\in I\setminus J$ dann $B_{i}=E_{i}$ und erhält daraus die Aussage für die kleinere Indexmenge.

Für endliche Familien diskreter Zufallsvariablen

Beide oben genannten Kriterien lassen sich für eine endliche Familie von Zufallsvariablen, die Werte in einem diskreten Messraum annehmen zusammenfassen. Sei $I=\{1,\dots ,n\}$ und seien die $X_{i}$ Zufallsvariablen von $(\Omega ,{\mathcal A},P)$ nach $(E_{i},\Sigma _{i})$ und sei $E_{i}$ diskret, also endlich oder abzählbar unendlich. Dann sind die Zufallsvariablen genau dann unabhängig, wenn

$P(X_{1}=x_{1},\dots ,X_{n}=x_{n})=\prod _{{i=1}}^{n}P(X_{i}=x_{i})$

für alle $x_{i}\in E_{i}$ gilt.

Für endliche Familien reeller Zufallsvariablen

Für endliche Familien reellwertiger Zufallsvariablen ergibt sich folgendes Kriterium: Die Zufallsvariablen $(X_{i})_{{i\in I}}$ sind genau dann stochastisch unabhängig, wenn

$P(X_{1}\leq x_{1},\dots ,X_{n}\leq x_{n})=\prod _{{i=1}}^{n}P(X_{i}\leq x_{i})$

für alle $x_{1},\dots ,x_{n}\in \mathbb{R}$ gilt. Sind also $F_{{X_{i}}}(x)=P(X_{i}\leq x)$ die Verteilungsfunktionen der $X_{i}$ sowie $F_{{I}}(x_{1},\dots ,x_{n}):=P(X_{1}\leq x_{1},\dots ,X_{n}\leq x_{n})$ die gemeinsame Verteilungsfunktion, dann sind die $X_{i}$ genau dann stochastisch unabhängig, wenn

$F_{I}(x_{1},\dots ,x_{n})=\prod _{{i=1}}^{n}F_{{X_{i}}}(x_{i})$

gilt. Falls die $X_{i}$ eine gemeinsame Dichtefunktion $f_{{I}}$ besitzen, so sind sie genau dann stochastisch unabhängig, wenn

$f_{{I}}(x_{1},\dots ,x_{n})=\prod _{{i=1}}^{n}f_{{X_{i}}}(x_{i})$

gilt. Dabei bezeichnet $f_{{X_{i}}}$ die Randdichte von $X_{i}$ .

Existenz unabhängiger Zufallsvariablen

Für abzählbar unendliche Familien von Zufallsvariablen stellt sich die Frage, ob überhaupt ein „genügend großer“ Wahrscheinlichkeitsraum existiert, so dass die gesamte Familie auf diesem Wahrscheinlichkeitsraum unabhängig ist. Es ist nicht offensichtlich, dass dies möglich ist, alternativ könnte die Unabhängigkeit eine zu starke Forderung sein, da die Initial-σ-Algebren bei vielen Zufallsvariablen immer zwangsläufig abhängig sind.

Tatsächlich lässt sich die Frage aber mittels des Produktmaßes positiv beantworten. Betrachtet man das unendliche Produktmodell

$\left(\prod _{{i=1}}^{{\infty }}\Omega _{i},\bigotimes _{{i=1}}^{{\infty }}{\mathcal A}_{i},\bigotimes _{{i=1}}^{{\infty }}P_{i}\right)$

und definiert als Familie von Zufallsvariablen genau die Projektionen auf die i-ten Komponenten $(X_{i})_{{i\in \mathbb{N} }}=(\pi _{i})_{{i\in \mathbb{N} }}$ , so ist diese Familie per Definition des Produktmodells und des Produktmaßes unabhängig und die Projektionen $\pi _{i}$ haben genau die Verteilung $P_{i}$ auf dem Ereignisraum $(\Omega _{i},{\mathcal A}_{i})$ . Das Produktmodell ist also groß genug, um eine unabhängige Familie von Zufallsvariablen zu enthalten. Andererseits wird dadurch das Problem der Existenz von unendlich vielen unabhängigen Zufallsvariablen auf die Existenz eines unendlichen Produktmaßes zurückgeführt, was nicht selbstverständlich ist. Diese Existenzfrage wird Beispielsweise durch den Satz von Andersen-Jessen für beliebige Indexmengen positiv beantwortet, kann aber auch für abzählbare Indexmengen über den Satz von Ionescu-Tulcea oder für Borel'sche Räume über den Erweiterungssatz von Kolmogorov erfolgen.

Unkorreliertheit und Unabhängigkeit

Zwei Zufallsvariablen X,Y heißen unkorreliert, wenn ihre Kovarianz $\operatorname {Cov}(X,Y)$ gleich null ist.

Aus Unabhängigkeit der Zufallsvariablen X,Y folgt immer ihre Unkorreliertheit. Sind nämlich die Zufallsvariablen unabhängig, so gilt für den Erwartungswert $\operatorname E(XY)=\operatorname E(X)\operatorname E(Y)$ und demnach

$\operatorname {Cov}(X,Y)=\operatorname {E}(XY)-\operatorname {E}(X)\operatorname {E}(Y)=\operatorname {E}(X)\operatorname {E}(Y)-\operatorname {E}(X)\operatorname {E}(Y)=0$ .

Dabei folgt die erste Gleichheit aus dem Verschiebungssatz für die Kovarianz und die zweite aus der Unabhängigkeit der Zufallsvariablen und der obigen Folgerung für den Erwartungswert.

Umgekehrt folgt aus Unkorreliertheit nicht stochastische Unabhängigkeit. Ein Beispiel dafür sind die Zufallsvariable , die gleichverteilt auf [-1,1] ist und $Y=X^{2}$ . Es gilt dann

$\operatorname {Cov}(X,Y)=\operatorname {E}(X^{3})-\operatorname {E}(X)\operatorname {E}(X^{2})=0-0\cdot \operatorname {E}(X^{2})=0$ ,

die Zufallsvariablen sind also unkorreliert. Sie sind aber nicht unabhängig, denn es ist zum Beispiel

$P(\{X\in [0,{\tfrac {1}{2}}],\,Y\in [0,{\tfrac {1}{9}}]\})=P([0,{\tfrac {1}{2}}]\cap [-{\tfrac {1}{3}},{\tfrac {1}{3}}])={\frac {1}{6}}$

und

$P(\{X\in [0,{\tfrac {1}{2}}]\})=P([0,{\tfrac {1}{2}}])={\frac {1}{4}}{\text{ und }}P(\{Y\in [0,{\tfrac {1}{9}}]\})=P([-{\tfrac {1}{3}},{\tfrac {1}{3}}])={\frac {1}{3}}$ .

Die Abhängigkeit folgt dann aus ${\tfrac {1}{4}}\cdot {\tfrac {1}{3}}\neq {\tfrac {1}{6}}$ .

Bemerkungen

Für die Analyse auf Abhängigkeit zweier Zufallsvariablen kann man auch testen, ob der Korrelationskoeffizient Null ist. Wenn die Hypothese abgelehnt wird, geht man davon aus, dass diese Variablen stochastisch abhängig sind. Der Umkehrschluss ist allerdings nicht zulässig, denn es können Abhängigkeitsstrukturen vorliegen, die der Korrelationskoeffizient nicht erfassen kann. Jedoch sind beispielsweise unkorrelierte, gemeinsam normalverteilte Zufallsvariablen auch stochastisch unabhängig.

Unabhängigkeit von Zufallsvariablen und Mengensystemen

Im Rahmen des bedingten Erwartungswertes wird teilweise auch von der Unabhängigkeit einer Zufallsvariable und eines Mengensystems ${\mathcal E}$ gesprochen. Die Zufallsvariable und das Mengensystem heißen unabhängig, wenn das Mengensystem ${\mathcal E}$ und die Initial-σ-Algebra $\sigma (X)$ der Zufallsvariable unabhängige Mengensysteme sind.

Verallgemeinerungen

Mittels des bedingten Erwartungswertes lässt sich sowohl die Unabhängigkeit von Mengensystemen als auch die Unabhängigkeit von Zufallsvariablen zur bedingten Unabhängigkeit erweitern.

Basierend auf einem Artikel in:

Wikipedia.de