Gauß-Seidel-Verfahren
In der numerischen Mathematik ist das Gauß-Seidel-Verfahren oder Einzelschrittverfahren (nach Carl Friedrich Gauß und Ludwig Seidel) ein Algorithmus zur näherungsweisen Lösung von linearen Gleichungssystemen. Es ist, wie das Jacobi-Verfahren und das SOR-Verfahren, ein spezielles Splitting-Verfahren. Das Verfahren wurde zuerst von Gauß entwickelt, aber nicht veröffentlicht, sondern nur in einem Brief im Jahr 1823 an Gerling erwähnt. Erst 1874 wurde es, bevor seine Anwendung durch Gauß bekannt war, von Seidel veröffentlicht.
Entwickelt wurde das Verfahren, da das Gaußsche Eliminationsverfahren, ein exakter Löser, bei Handrechnung für Rechenfehler sehr anfällig ist. Eine iterative Vorgehensweise hat diesen Nachteil nicht.
Beschreibung des Verfahrens
Gegeben ist ein lineares Gleichungssystem in Variablen mit den
Gleichungen
Um dieses zu lösen, wird ein Iterationsverfahren durchgeführt. Gegeben sei ein Näherungsvektor an die exakte Lösung. Nun wird die
-te Gleichung nach der
-ten Variablen
aufgelöst, wobei die vorher berechneten Werte
des aktuellen Iterationsschritts mit verwendet werden, im Gegensatz zum
Jacobi-Verfahren, bei dem nur die Werte
des letzten Iterationsschrittes verwendet werden. Das heißt für den
-ten Iterationsschritt:
Das Ergebnis der Rechnung ist ein neuer Näherungsvektor für den gesuchten Lösungsvektor
. Wiederholt man diesen Vorgang, gewinnt man eine
Folge von Werten, die sich dem Lösungsvektor im Falle der Konvergenz immer mehr annähern:
Das Gauß-Seidel-Verfahren ist inhärent sequentiell, das heißt bevor eine Gleichung aufgelöst werden kann, müssen die Ergebnisse der vorherigen Gleichungen vorliegen. Es ist damit wie das Vorwärts- und Rückwärtseinsetzen mit einer LR-Zerlegung nur eingeschränkt zur Nutzung auf Parallelrechnern geeignet, insbesondere nur für dünnbesetzte Matrizen.
Als Algorithmusskizze mit Abbruchbedingung ergibt sich:
- wiederhole
- für
bis
- nächstes
- bis
Dabei wurden die Erstbelegung des Variablenvektors, die willkürlich gewählt werden kann, und eine
Fehlerschranke als Eingangsgrößen
des Algorithmus angenommen, die Näherungslösung ist die vektorielle Rückgabegröße. Die Fehlerschranke misst hier,
welche Größe die letzte Änderung des Variablenvektors hatte. Als Bedingung für die Durchführbarkeit des Algorithmus
lässt sich festhalten, dass die
Hauptdiagonalelemente von Null verschieden sein müssen.
Bei dünnbesetzten Matrizen reduziert sich der Aufwand des Verfahrens pro Iteration deutlich.
Beschreibung des Verfahrens in Matrixschreibweise
Die Matrix des linearen
Gleichungssystems
wird hierzu in
eine Diagonalmatrix
, eine strikte obere
Dreiecksmatrix
und eine strikte untere Dreiecksmatrix
zerlegt, so dass gilt:
.
In jedem Iterationsschritt gilt dann . Nach Umstellen ergibt sich formal
und daraus
.
Man legt dann einen Startvektor
fest und setzt ihn in die Iterationsvorschrift ein:
.
Beispiel
Es ist das lineare Gleichungssystem
mit
und
gegeben. Dazu wird die Gleichung in der
Form
verwendet,
wobei
und
ist.
Dafür muss die Matrix
als Summe einer unteren
Dreiecksmatrix
und einer
oberen Dreiecksmatrix
dargestellt werden:
Die inverse Matrix von ist
Daraus ergibt sich
Daraus können die Vektoren mithilfe der Iterationsvorschrift
iterativ berechnet werden.
Als erstes wird der Startvektor gesetzt, z. B.
Daraus ergibt sich schrittweise
Der Algorithmus konvergiert also gegen die Lösung
Diagonaldominanz und Konvergenz
Das Verfahren konvergiert linear, wenn der
Spektralradius der
Iterationsmatrix kleiner 1 ist. In diesem Falle ist
der Fixpunktsatz von Banach bzw.
der Konvergenzsatz der Neumann-Reihe (auf
eine hinreichend große Potenz von
) anwendbar und das Verfahren konvergiert. Im
gegenteiligen Fall divergiert das Verfahren, wenn die rechte Seite des Gleichungssystems einen Anteil eines
Eigenvektors zu einem Eigenwert mit Betrag
größer als 1 beinhaltet. Je geringer der Spektralradius, desto schneller konvergiert das Verfahren.
Die Bestimmung des Spektralradius ist für den praktischen Einsatz meist ungeeignet, weswegen über die hinreichende Bedingung,
dass eine Matrixnorm der Verfahrensmatrix kleiner als 1 sein muss, bequemere Kriterien
gefunden werden können. Diese Matrixnorm ist gleichzeitig die Kontraktionskonstante im Sinne des banachschen Fixpunktsatzes.
Im Falle, dass sowohl als auch
"kleine" Matrizen bzgl. der gewählten
Matrixnorm sind, gibt es die folgende Abschätzung der Matrixnorm für
(siehe Neumann-Reihe für den ersten Faktor):
Der letzte Ausdruck ist für ebenfalls kleiner
als 1. Obwohl die Konvergenzbedingung diejenige des Jacobi-Verfahrens ist, ist die so erhaltene Abschätzung der
Kontraktionskonstante
des Gauß-Seidel-Verfahrens immer kleinergleich
der entsprechenden Abschätzung der Kontraktionskonstante des Jacobi-Verfahrens.
Das einfachste und gebräuchlichste hinreichende Konvergenzkriterium der Diagonaldominanz ergibt sich für die Supremumsnorm der Vektoren und die Zeilensummennorm als zugehörige induzierte Matrixnorm. Es verlangt die Erfüllung des Zeilensummenkriteriums, also der Ungleichung
für
.
Je größer die kleinste Differenz zwischen rechten und linken Seiten der Ungleichung ist, desto schneller konvergiert das Verfahren. Man kann versuchen, diese Differenz mittels Zeilen- und Spaltenvertauschungen zu vergrößern, d.h. durch Umnummerieren der Zeilen und Spalten. Dabei kann man beispielsweise anstreben, die betragsgrößten Elemente der Matrix auf die Diagonale zu bringen. Die Zeilenvertauschungen müssen natürlich auch auf der rechten Seite des Gleichungssystems vollzogen werden.
Anwendungen
Für moderne Anwendungen wie die Lösung großer dünnbesetzter Gleichungssysteme, die aus der Diskretisierung partieller Differentialgleichungen stammen, ist das Verfahren ungeeignet. Es wird jedoch mit Erfolg als Vorkonditionierer in Krylow-Unterraum-Verfahren oder als Glätter in Mehrgitterverfahren eingesetzt.
Erweiterung auf nichtlineare Gleichungssysteme
Die Idee des Gauß-Seidel-Verfahrens lässt sich auf nichtlineare Gleichungssysteme mit einer mehrdimensionalen nichtlinearen
Funktion
erweitern. Wie im linearen Fall wird im
-ten Schritt die
-te Gleichung bezüglich der
-ten Variablen gelöst, wobei für die weiteren
Variablen der bisherige Näherungswert und für die vorherigen Variablen der vorher berechnete neue Wert genommen wird:
- Für k=1, … bis zur Konvergenz
- Für i=1, …, n:
- Löse
nach
auf.
- Löse
- Für i=1, …, n:
Hierbei ist das Lösen in der Regel als die Anwendung eines weiteren iterativen Verfahrens zur Lösung nichtlinearer Gleichungen zu verstehen. Um dieses Verfahren vom Gauß-Seidel-Verfahren für lineare Gleichungssysteme zu unterscheiden, wird häufig vom Gauß-Seidel-Prozess gesprochen. Die Konvergenz des Prozesses folgt aus dem Banachschen Fixpunktsatz wieder als linear.
Literatur
- A. Meister: Numerik linearer Gleichungssysteme, 2. Auflage, Vieweg 2005, ISBN 3528131357
- W. C. Rheinboldt: Methods for Solving Systems of Nonlinear Equations, 2. Auflage, SIAM, 1998, ISBN 089871415X



© biancahoegel.de
Datum der letzten Änderung: Jena, den: 12.02. 2023