Wie berechnet man die Wählerwanderungen?

Kurz nach einer Wahl werden neben den Ergebnissen auch immer die Wählerwanderungen angezeigt. Also die Anzahl der Leute die bei der letzten Wahl die Partei A gewählt haben, bei dieser Wahl aber die Partei B. Auch die Wanderung von und zu den Nichtwählern wird angegeben. Den meisten Leuten ist aber nicht klar, worauf diese Werte basieren. Deshalb möchte ich hier mal etwas näher darauf eingehen. Hier findet sich auch eine schöne Verbindung von Mathematik und Politik.Zunächst einmal gibt es zwei Möglichkeiten die Wählerwanderung zu ermitteln. Die erste Möglichkeit ist mittels Aggregatdatenanalyse und die zweite Möglichkeit mittels Befragungen. Bei den Befragungen werden in der Woche vor der Wahl und am Wahltag vor zufälligen Wahllokalen Befragungen zum Wahlverhalten durchgeführt. Anhand dieser Daten werden dann die Wählerwanderungen berechnet. Dies ist allerdings sehr aufwändig und deshalb werden meist Aggregatdatenanalysen verwendet, um die es auch in diesem Artikel gehen soll.

Wie der Name Aggregatdatenanalysen schon andeutet, werden für die Analyse aggregierte Daten verwendet. In diesem Fall die absoluten Wählerzahlen der einzelnen Parteien in den Stimmkreisen (die Nichtwähler werden als Wähler der Nichtwählerpartei (NWP) aufgefasst). Die Idee hinter der nun folgenden Analyse ist, dass wenn bei der einen Wahl Partei A viele Stimmen hat und bei der nächsten Wahl die Partei B, dann wird angenommen, dass viele Wähler von Partei A zur Partei B gewechselt sind.

Lineare Regression

Diese Analyse beruht auf der multiplen linearen Regression. Zunächst möchte ich aber kurz auf die lineare Regression mit einer Partei eingehen, da diese noch relativ anschaulich erklärt werden kann. Bei der linearen Regression geht es darum eine Punktwolke möglichst gut durch eine Gerade zu repräsentieren. Mathematisch ausgedrückt wollen wir eine Gerade finden, so dass der quadratische Abstand der Punkte zu der Gerade minimal ist. Als Datenmaterial nehmen wir den Vergleich der Wahlergebnisse der CDU von 2009 und 2013. In der folgenden Abbildung sind die Daten aus den einzelnen Wahlkreisen eingetragen.

Jetzt versuchen wir eine Gerade in die Punktwolke zu legen, die die Punktwolke möglichst gut repräsentiert. Die Grundgleichung der gesuchten Gerade hat in unserem Beispiel die Form

CDU13=a*CDU09+b.

Es geht jetzt also um die Ermittlung der Parameter a und b in der Gleichung. Macht man dies, erhält man die Gleichung

CDU13=1,0848*CDU09+7569,8490.

In der nachfolgenden Abbildung ist gut zu erkennen, dass die Gerade gut die Richtung der Punktwolke wiedergibt. Das Bestimmtheitsmaß der Gleichung ist 0,914. Es gibt an wie gut die Abweichungen durch das Regressionsmodell erklärt werden können. Der Wert liegt immer zwischen 0 und 1. Ein Wert von 1 steht für einen perfekten linearen Zusammenhang und 0 für keinen linearen Zusammenhang der Daten. Aus der Gleichung kann man jetzt auch ablesen, dass im Durchschnitt in den Wahlkreisen 8,48% mehr Menschen die CDU gewählt haben, als im Jahr 2009.

Multiple Regression

Bei der multiplen Regression geht man analog vor, nur dass die gesuchte Gleichung etwas anders aussieht. Berücksichtigen wir nur die großen Parteien incl. der NWP und der PkP (Partei der kleinen Parteien), ergibt sich für die CDU folgende Gleichung:

CDU13=a*CDU09+b*SPD09+c*Gruene09+d*Linke09+e*AfD09+f*NWP09+g*PkP09+h.

Entsprechende Gleichungen können wir für alle Parteien aufstellen. Anschaulich gesprochen suchen wir jetzt nicht mehr eine 2-dimensionale Gerade sondern eine 8-dimensionale Hyperebene die die Zusammenhänge möglichst gut beschreibt. In unserem Beispiel erhalten wir sieben Gleichungen, deren Koeffizienten die Bewegung der Wähler zwischen den Parteien angeben.

Dieses Wissen können wir jetzt anwenden und die Wählerbewegungen zwischen den zwei letzten Bundestagswahlen berechnen. Ich verwende dazu die Statistiksoftware R. In der folgenden Tabelle sind die Wanderungen zur CDU dargestellt, die bei der Berechnung herauskommt. Das Bestimmtheitsmaß ist allerdings nur 0,1162. Wenn man sich die einzelnen Variablen anschaut, dann wird nur das Verhältnis zur FDP signifikant.

Partei SPD FDP DIE.LINKE GRÜNE PkP NWP
Wanderung 544.182 2.881.396 65.790 -924.011 -2.359.246 6.001.978

Dieses Ergebnis können wir jetzt mit den offiziellen Zahlen vergleichen. Wir stellen hier fest, dass der Wert für die FDP relativ gut stimmt. Bei den anderen Parteien sind teilweise große Abweichungen festzustellen. Dies liegt aber daran, dass in der Praxis noch einige Anpassungen vorgenommen werden, die einiges Effekten, die das Ergebnis verfälschen, entgegenwirken. Dies würde aber den Rahmen des Blogeintrags sprengen. Bemerken muss man aber auch, dass die Medien bei der Publikation der Wählerwanderung noch Angaben zum Bestimmtheitsmaß und der Signifikanz angeben müssten um die Ergebnisse einordnen zu können.

https://wahl.tagesschau.de/wahlen/2013-09-22-BT-DE/analyse-wanderung.shtml

Weitere Verfahren

Mittlerweile wurden eine ganze Reihe weiterer Verfahren zur Ermittlung der Wählerwanderung entwickelt. Sie beruhen zum Beispiel auf dem multinomialen Dirichlet-Modell. Es existieren auch Modelle, die Individualdaten und Aggregatdaten gleichzeitig verwenden. In R können die Pakete eiPack und eiwild verwendet werden.

Weiterführende Links:


Wie hat dir der Artikel gefallen? 1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (Bisher keine Bewertungen)

Loading...

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Ich akzeptiere

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.