Sterbefälle nach Altersgruppen und Bundesländern in Deutschland von 2016 bis 2021
Interaktive Auswertung der Sterbefallzahlen vor und während Covid19.
- Datenherkunft
- Verarbeitung der Daten
- Todesfälle nach Alter
- Todesfälle nach Bundesland
- Todesfälle nach Bundesland und Bevölkerungsdichte
- Technisches Fazit
- Quellverzeichniss
In diesem Blog-Post möchte ich herausfinden, wie leicht sich interaktive Grafiken in Notebooks erstellen lassen. Als Framework verwende ich hier Altair, da es sich in meinem Blog leicht integrieren lässt [FP20].
Um den Beitrag auch inhaltlich interessant zu gestallten, werte ich die Sterbefallzahlen von Deutschland der letzten fünf Jahre aus. Dabei Grenze ich die Zeiträume vor und während Covid19 voneinander ab.
Als Fragestellung definiere ich:
- Wie verändern sich die Sterbefallzahlen je Altersgruppe und Monat?
- Wie verändern sich die Sterbefallzahlen je Bundesland?
Im ersten Teil wird die Datenherkunft und -verarbeitung beschrieben. Anschließend werden rund um die obigen Fragestellungen Grafiken aufgebaut. Zum Schluss folgt ein technisches Fazit zum Framework.
Datenherkunft
Für die Auswertung von Sterbefällen in Deutschland werden die aktuellen Sterbefalldaten vom Statistischen Bundesamt [SB21] herangezogen. Die Daten beinhalten unter anderem Aufstellungen der Todesfälle nach Altersgruppen oder Bundesländern. In dieser Analyse werden die monatlichen Sterbefallzahlen für den Zeitraum März 2016 bis Februar 2021 herangezogen. Die aktuellsten Daten liegen derzeit nur bis Februar 2021 vor und beinhalten einen Schätzanteil, der in der Datenquelle im Reiter "Hinweise" erklärt ist. Neben den Sterbefallzahlen werden zusätzlich Daten über die Bevölkerungsdichte der Bundesländer verarbeitet [SB20], wobei sich diese Zahlen auf den Stichtag 31.12.2019 beziehen.
Verarbeitung der Daten
Preprocessing
Der Auswertungszeitraum wird beschränkt auf März 2016 bis Februar 2021. Der Zeitraum, in dem Corona in Deutschland sehr aktive war, wird hier vereinfacht auf März 2020 (als Covid19 in Deutschland die ersten größeren gesellschaftlichen Veränderungen auslöste) bis Februar 2021 (orange) festgelegt. Der vor-Covid19-Zeitraum wird auf März 2016 bis Februar 2020 festgelegt (blau). Somit umfasst der Covid19-Zeitraum exakt ein Jahr und der vor-Covid19-Zeitraum exakt 4 Jahre. Somit bleiben beide Zeiträume ohne gravierende saisonale Abweichungen vergleichbar. Die Aufteilung der Zeiträume ist im nachstehenden Diagramm verdeutlicht.
Datenaggregation
Bei den Berechnungen werden die Werte über einen Zeitraum über das Arithmetische Mittel aggregiert. Je nach Auswertung geschieht dies über den ganzen Zeitraum oder je Monat. Das erste und dritte Quartil, der aggregierten Daten, werden gegebenenfalls als Schattierung in den Diagrammen mit abgebildet. In einigen Abbildung werden die berechneten Punkte interpoliert um die Lesbarkeit zu erhöhen.
Todesfälle nach Alter
Im nachstehenden Diagramm wird die durchschnittliche Anzahl an Todesfällen pro Monat je Altersgruppe abgebildet. Eine Altersgruppe umfasst fünf Jahre. Der Punkt Alter 55 umfasst z.B. alle Todesfälle im Alter zwischen 50 und 55. Todesfälle der über 100-jährigen werden im Punkt 100 abgebildet.
Die Werte sind jeweils über den vor-Covid19-Zeitraum (blau) und den Covid19-Zeitraum (orange) aggregiert. Im Diagramm lassen sich die Monate per Dropdown-Box auswählen.
Nachfolgend sind die durchschnittlichen Todesfälle nach Alter für jeden einzelnen Monat aufgelistet. Die Auflistung beginnt mit dem Monat März.
Beobachtung
Nordrhein-Westfalen (NW) hat als Einwohner-stärkstes Land die meisten Todesfälle. In jedem Bundesland sind Anstiege der Todeszahlen im Covid19-Zeitraum zu erkennen. Allerdings sind lediglich minimale Anstiege in Hessen (HE) und Bayern (BY) für die Altersgruppen unter 65 Jahren zu erkennen. In den anderen Bundesländern gibt es keinen merklichen Anstieg in dieser Altersgruppe.
Bei der Darstellung der Todesfällen je Einwohner gibt es in der Altersgruppe unter 65 kleinere Schwankungen. Der Anstieg an Todesfällen in Nordrhein-Westfalen (NW) ist etwas geringer als in Bayern (BY) und in etwa so hoch wie in Baden-Württemberg (BW). Den stärksten Anstieg verzeichnet hier Sachsen (SN) und Brandenburg (BB).
Beobachtung
Die Stadtstaaten Hamburg (HH) und Bremen (HB) weisen trotz ihrer hohen Einwohnerdichte einen nur moderaten Anstieg der Sterbefälle aus. Wohingegen Berlin einen hohen Anstieg verzeichnet. Schleswig-Holstein (SH) hat den geringsten Anstieg zu verzeichnen.
Der Korrelationskoeffizient zwischen der Bevölkerungsdichte und Anstieg der Todesfälle beträgt:
Eine Korrelation ist für diesen Vergleich nicht festzustellen.
Technisches Fazit
Mit Altair lassen sich einfach Grafiken gestallten und interaktiv in Notebooks mit einbinden. Die Webseite beinhaltet eine Vielzahl von Beispielen [AA1]. Einige Fragestellungen werden auch im Github-Issue-Tracker [AA2] beantwortet.
Ich habe etwas Zeit mit JavaScript-Debugging verbracht, als ich die Bindings falsch verwendet habe. Es gab aber schlussendlich zu jedem Problem eine Lösung [AA2] oder Workarounds wie etwa bei der Legende im Bardiagramm [AG18]. Wie erwartet braucht es etwas Übung um ein neues Framework wie gewollt einsetzen zu können.
Die Integration [FP20] in diesen Blog funktioniert einwandfrei. Ich werde das Framework bestimmt auch an anderer Stelle verwenden.
Quellverzeichniss
Datenquellen
Die hier verwendeten Daten stammen vom Statistischen Bundesamtes und unterliegen der Lizenz "dl-de/by-2-0". Der Lizenztext findet sich unter www.govdata.de/dl-de/by-2-0. Die Daten wurden zum Zwecke der Analyse ausschließlich innerhalb dieses Notebooks durch Ausführung des angegebenen Programmcodes modifiziert.
- [SB21] Statistisches Bundesamt (Destatis), 2021 (erschienen am 30. März 2021), Sterbefälle - Fallzahlen nach Tagen, Wochen, Monaten, Altersgruppen, Geschlecht und Bundesländern für Deutschland 2016 - 2021, abgerufen 03.04.2021, https://www.destatis.de/DE/Themen/Gesellschaft-Umwelt/Bevoelkerung/Sterbefaelle-Lebenserwartung/Tabellen/sonderauswertung-sterbefaelle.xlsx?__blob=publicationFile
- [SB20] Statistisches Bundesamt (Destatis), 2020 (erschienen am 2. September 2020), Bundesländer mit Hauptstädten nach Fläche, Bevölkerung und Bevölkerungsdichte am 31.12.2019, abgerufen am 03.04.2021, https://www.destatis.de/DE/Themen/Laender-Regionen/Regionales/Gemeindeverzeichnis/Administrativ/02-bundeslaender.xlsx?__blob=publicationFile
Sonstige Quellen
A lot of the coding is derived from various examples of the Altair homepage and great examples in the coresponding github issue tracker answered by https://github.com/jakevdp.
- [AA1] https://altair-viz.github.io/gallery/index.html
- [AA2] https://github.com/altair-viz/altair/issues/
- [AG18] A. Gordon, 2018 (erschienen am 06. Oktober 2018), Focus: generating an interactive legend in Altair, abgerufen 05.04.2021, https://medium.com/dataexplorations/focus-generating-an-interactive-legend-in-altair-9a92b5714c55
- [FP20] fastpages.fast.ai, 2020 (erschienen am 20. Februar 2020), Fastpages Notebook Blog Post, abgerufen 05.04.2021, https://fastpages.fast.ai/jupyter/2020/02/20/test.html