Mit diesem Notebook wird analysiert, inwiefern sich sozioökonomische Deprivation als Prädiktor für das Steueraufkommen der Gemeinden eignet. Um die Nachvollziehbarkeit der Einschätzung zur verbessern das Ergebnis als Notebook bereitgestellt.
Die Analysen werden mit dem freien Programmpaket R durchgeführt. Alle Schritte werden erläutert.
# Working Directory
setwd("~/Notebooks")
# Libraries provided for reproducability
library("tidyverse",quiet=T)
library("haven")
library("viridis")
# Options for Graphic Output
options(repr.plot.width=6, repr.plot.height=3.375)
Die verwendeten Daten zur Gemeindefinanzierung stammen aus der INKAR-Online Datenbank des Bundesinstitut für Bau-, Stadt- und Raumforschung (BBSR) im Bundesamt für Bauwesen und Raumordnung (BBR). Sie sind frei zugänglich und können auf Ebene der Gemeindeverbände für den Zeitraum 1995 bis 2015 (Stand: 5.6.2018) bezogen werden.
# Finanzen
options(warn=-1)
Gemeindefinanzen <- suppressMessages(read_delim("data/Gemeindefinanzen_1995_2015.csv",";", escape_double = FALSE, locale = locale(date_names = "de",
decimal_mark = ","), trim_ws = TRUE, skip = 1))
Gemeindefinanzen <- Gemeindefinanzen %>% rename(Kennziffer_Gemeindeverband=X1,Name=X2,Typ=X3) %>% gather(Jahr,Steuereinnahmen_pro_EW,4:24) %>%
mutate(Jahr=as.numeric(Jahr), Kennziffer_Gemeindeverband=as.numeric(Kennziffer_Gemeindeverband))
options(warn=0)
head(Gemeindefinanzen)
Für Deutschland sind regionale Unterschiede für verschiedene Gesundheitsindikatoren dokumentiert, die auch mit sozioökonomischen Unterschieden assoziiert sind. Der „German Index of Socioeconomic Deprivation“ (GISD) wird auf Ebene der Gemeindeverbände, der Landkreise und kreisfreien Städte sowie der Regierungsbezirke ab 1998 generiert. Er ist mit Aggregatdaten sowie Individualdaten der Studie Gesundheit in Deutschland assoziiert und wird für die Nutzung in der Forschung und Gesundheitsberichterstattung des Bundes und der Länder bereitgestellt. Er soll dazu beitragen, neue Datenquellen für die Analyse des Zusammenhangs von sozialer Ungleichheit und Gesundheit zu erschließen. Der Index kann hier heruntergeladen werden, nähere Informationen zur Indexkonstruktion sind hier verfügbar.
# GISD in Stata long format dataset
download.file("https://github.com/lekroll/GISD/blob/master/Revisions/2018/Bund/Gemeindeverband/Gemeindeverband_long.dta?raw=true",
"data/Gemeindeverband_long.dta",mode = "wb")
GISD <- read_dta("data/Gemeindeverband_long.dta") %>%
mutate(Kennziffer_Gemeindeverband= as.numeric(as.character(Kennziffer_Gemeindeverband)), Jahr=as.numeric(as.character(Jahr)))
head(GISD)
Die Daten von INKAR lassen sich mit dem GISD anhand der Zugehörigen Regionalkennziffer zusammenführen. Hierfür müssen die Bezeichnung der Schlüsselvariable in beiden Datensätzen und der Datentyp der Schlüsselvariable (numerisch oder Zeichen) ggf. vereinheitlicht werden.
Comparison <- left_join(Gemeindefinanzen,GISD,by=c("Kennziffer_Gemeindeverband","Jahr")) %>% filter(!is.na(GISD_Score))
Comparison <- Comparison %>% filter(!is.na(GISD_Score) & !is.na(Steuereinnahmen_pro_EW))
head(Comparison)
Comparison %>% count(Jahr) %>% ggplot(aes(x=Jahr, y=n, fill="Gemeindeverbände")) + geom_bar(stat="identity")+ scale_fill_viridis(discrete=T) + theme_minimal() +
scale_y_continuous(limits=c(0,5000)) + labs(title="Anzahl",y="",x="Jahr", fill="") + geom_text(colour="White",aes(y=500,label=paste(n)), angle=90)
# Comparison
ggplot(Comparison,aes(x=GISD_Score,y=Steuereinnahmen_pro_EW, group=Jahr, colour=Jahr)) +
geom_smooth(method="gam") + scale_colour_viridis() + theme_minimal() +
labs(title="Einnahmen pro Einw. (EUR)", y="", x="Regionale Deprivation")
ggplot(Comparison %>% group_by(Jahr) %>% summarise(Korrelation = cor(Steuereinnahmen_pro_EW,GISD_Score)),
aes(x=Jahr,y=Korrelation, colour=Jahr)) + geom_smooth(method="loess",se=F,colour="grey80") +
geom_point()+ scale_colour_viridis() + scale_y_continuous(limits=c(-1,0)) + theme_minimal() +
labs(y="",title="Korrelationskoeffizient \n nach Pearson r=")
ggplot(Comparison %>% group_by(Jahr) %>% summarise(Varianzaufklärung = (cor(Steuereinnahmen_pro_EW,GISD_Score)^2)*100),
aes(x=Jahr,y=Varianzaufklärung, colour=Jahr)) +
geom_smooth(method="loess",se=F,colour="grey80") + labs(y="", title="Varianzaufklärung in %") +
geom_point()+ scale_colour_viridis() + theme_minimal() + scale_y_continuous(limits=c(0,100))
Der Vergleich wird jährlich durchgeführt. Die Abbildung beschreibt das Gesamtergebnis für den Zeitraum 1998-2014.
Comparison %>% group_by(Jahr) %>%
mutate(GISD_q5=ntile(GISD_Score, 5),Steuer_q5=ntile(Steuereinnahmen_pro_EW, 5)) %>%
group_by(GISD_q5,Steuer_q5) %>%
count() %>%
group_by(GISD_q5) %>%
mutate(n=100*n/sum(n)) %>%
ggplot(aes(x=GISD_q5,y=n,
label=floor(n*10)/10,fill=as.character(Steuer_q5))) +
geom_bar(stat="identity") +
scale_fill_viridis(discrete=T) + theme_minimal() +
geom_text(pos="stack",vjust=1,color="White", size=3.5) +
labs(x="Quintile Deprivation (GISD)",y="Anteil",fill="Quintile\nSteuereinnahmen")
Zwischen den Steuereinnahmen der Gemeindeverbände und der über den GISD approximierten Sozialstruktur der Gemeinden besteht ein starker Zusammenhang, allerdings ist die Varianzaufklärung der Gemeindefinanzen durch den GISD nur mäßig. Gründe dafür dass GISD die Steuereinnahmen nicht besser erklärt sind etwa:
Konjunktureffekte
Das Steueraufkommen varriert in Abhängigkeit von der konjunkturellen Lage. Tendenziell ist anzunehmen, dass die Bedeutung der Einkommenssteuer und damit der Anteil der Löhne am gesamten Steueraufkommen in Phasen der Rezession höher ist als in konjunkturellen Hochphasen, in denen auch eine stärkere Bautätigkeit Treiber der Einnahmen und höhere Gewerbeeinnahmen vorliegen.
Komponenten der Gemeindefinanzen
Die Steuereinnahmen der Gemeinden speisen sich aus folgenden Quellen: Grundsteuer A und B + Gewerbesteuer + Einkommensteuer + Umsatzsteuer + sonstige Gemeindesteuer (Vergnügungssteuer, Hundesteuer, Getränkesteuer usw.) - Gewerbesteuerumlage. Lediglich die Einkommenssteuer ist dabei direkt mit der Sozialstruktur assoziiert und geht auch in die Konstruktion des GISD ein. Die übrigen Steuerarten weisen dagegen nur indirekte Verbindungen zur Sozialstruktur auf.