GENESIS-Online

In vielen Fällen werden die benötigten Daten vom Statistischen Bundesamt und den Statistischen Ämtern der Länder in der Auskunftsdatenbank „GENESIS-Online regional“ bereitgestellt:
„Bei GENESIS (Gemeinsames neues statistisches Informationssystem) handelt es sich um ein von den Statistischen Ämtern des Bundes und der Länder gemeinsam entwickeltes metadatengestütztes statistisches Informationssystem. Mit ,GENESIS-Online regional‘ wurde von den Statistischen Ämtern des Bundes und der Länder ein webbasierter Zugang zu GENESIS entwickelt, der es ermöglicht, das Statistische Informationssystem per Internet zu nutzen.“
(www.regionalstatistik.de, Stand: 20.07.2015)

  1. Bund (kostenfrei)
  2. Bundesländer (kostenfrei)
  3. Regierungsbezirke (kostenfrei)
  4. Kreise und kreisfreie Städte


Mikrozensus

Der Mikrozensus ist eine jährliche repräsentative Haushaltsbefragung des Statistischen Bundesamts. Befragt wird 1 % aller bundesdeutschen Haushalte. Der Mikrozensus liefert u. a. verlässliche Informationen zu Haushaltszusammensetzung, Einkommenssituation und Bildungsstand. Detaillierte Daten aus dem Mikrozensus können bei den Statistischen Lan-desämtern oder beim Statistischen Bundesamt kostenpflichtig bestellt werden. Die Gebühren sind bei den jeweiligen Ämtern zu erfragen. Unter Umständen kann es passieren, dass bei sehr spezifischen Anfragen die angeforderten Zahlen aus Gründen des Datenschutzes nicht veröffentlicht werden, und zwar, wenn die Fallzahlen in den einzelnen Klassen zu gering sind. Zur Information siehe: www.forschungsdatenzentrum.de/bestand/mikrozensus/index.asp (Stand: 21.07.2015)


INKAR Online-Atlas (Indikatoren und Karten zur Raumentwicklung)

INKAR Online-Atlas ist eine Veröffentlichung des Bundesamts für Bauwesen und Raumordnung. Der Online-Atlas veranschaulicht die Lebensumstände in Deutschland und Europa und enthält Indikatoren zu verschiedenen Themenbereichen – u. a. Arbeitslosigkeit, Bevölkerung und Siedlungsstruktur, Alters- und Sozialstruktur, medizinische Versorgung –, größtenteils auf Gemeindeebene. www.inkar.de (Stand: 21.07.2015)


IS GBE (Informationssystem für Gesundheitsberichterstattung)

Das IS GBE ist ein gemeinsames Webangebot des Bundesministeriums für Gesundheit (BMG), des Statistischen Bundesamts und des Robert-Koch-Instituts und ist unter folgender Adresse aufrufbar: www.gbe-bund.de.
Dort wird eine Vielzahl von Gesundheitsdaten und -statistiken aus unterschiedlichen Quellen vorgehalten. Zudem werden Grafiken und Texte zu verschiedenen Themen angeboten.


Allbus (Allgemeine Bevölkerungsumfrage der Sozialwissenschaften)

Allbus ist eine repräsentative Umfrage, die in zweijährlichem Turnus durchgeführt wird. Sie umfasst neben soziodemografischen Fragestellungen zum Teil identische, aber auch wechselnde Themengebiete. Die Fragebögen und Datensätze sind kostenlos zur wissenschaftlichen Forschung und Lehre nutzbar und können auf der ALLBUS-Homepage (Stand: 20.07.2015) abgerufen werden. Zur Nutzung der Datensätze wird das Statistik-Softwarepaket SPSS benötigt. Hierzu sind aber entsprechende SPSS-Kenntnisse erforderlich! Die Daten lassen sich nach Alter und Wohnortmerkmalen (Bundesgebiet Ost/West, politische Gemeindegröße) auswerten.


SOEP (Sozio-oekonomisches Panel)

Das SOEP ist eine Längsschnittbefragung bundesdeutscher Haushalte und der darin lebenden Personen, die in den alten Bundesländern seit 1984, in den neuen Ländern seit 1990 mit jeweils jährlichen Wiederholungsbefragungen durchgeführt wird. Im Gegensatz zu Allbus werden hier also dieselben „Einheiten“ (Haushalte, Personen) wiederholt befragt, sodass Veränderungen innerhalb der Haushalte/Personen untersucht werden können. Ansonsten beinhaltet das SOEP ein ähnliches Themenspektrum wie die Allbus-Umfragen. Die SOEP-Datensätze werden ebenfalls zur wissenschaftlichen Forschung und Lehre bereitgestellt. Weitere Informationen findet man hier: SOEP-Homepage. Dort kann auch das Informationssytem SOEPinfo online aufgerufen werden, mit dem gezielt nach im SOEP erhobenen Daten/Indikatoren gesucht werden kann.

Die Liste der o. g. externen Datenquellen ist nicht erschöpfend. Es existiert darüber hinaus noch eine Vielzahl sozialwissenschaftlicher Forschungsdatensätze, die empirische Informationen zu den hier relevanten Aspekten enthalten und in der Regel auch auf Homepages im Internet repräsentiert sind. Ist also in den genannten Datensätzen eine gesuchte Information nicht zu finden, empfiehlt sich eine entsprechende Recherche nach weiteren Datenquellen im Internet. Allerdings sollten dabei gewisse elementare Qualitätsmerkmale der Daten beachtet werden:

  • Wie steht es um die Repräsentativität und Aussagekraft der jeweiligen Stichprobe?
  • Wurden die befragten „Einheiten“ (Personen, Haushalte, Kommunen) zufällig ausgewählt, und welche „Grundgesamtheit“ (gesamte Bundesrepublik, regional begrenztes Gebiet) liegt dieser Auswahl zugrunde?
  • Wie groß ist die Stichprobe (erhobene Fallzahlen)? Grundsätzlich gilt: Je mehr Daten vorliegen, desto aussagekräftiger sind die Ergebnisse!
  • Wann fand die Datenerhebung statt? Die Informationen sollten natürlich möglichst aktuell sein.


Grundsätzlich bieten die genannten Datenquellen einen hohen Qualitätsstandard, was Repräsentativität, Stichprobengröße und Aktualität betrifft. Insbesondere die Daten, die von den statistischen Ämtern herausgegeben werden (Mikrozensus, GENESIS-Online), empfehlen sich sozusagen als „erste Anlaufstelle“ bei der Suche nach statistischen Informationen. Eine weitere Datensuche ist eigentlich nur dann nötig, wenn das Gesuchte dort nicht gefunden wird.


Eigene empirische Datenerhebungen

Werden spezifische Informationen zur eigenen Kommune benötigt, die weder bereits vorhanden noch in öffentlich zugänglichen Datenquellen erhältlich sind, ist auch die Durchführung einer Eigenerhebung denkbar. Hierbei ist aber zu bedenken, dass der Erfolg einer solchen Untersuchung – im Sinne des Gewinns verlässlicher und aussagekräftiger Befunde – die Einhaltung gewisser methodischer Grundanforderungen voraussetzt. Im Grunde bedarf es zur Durchführung eigener empirischer Erhebungen eines entsprechenden Expertenwissens, welches hier nicht erschöpfend dargeboten werden kann! Einige Aspekte sollen aber im Folgenden kurz skizziert werden:


Stichprobengenerierung

Auch für die zu befragende Stichprobe aus der Kommune gilt, dass sie die Gesamtbevölkerung bzw. denjenigen Teil der Bevölkerung, über den Erkenntnisse gewonnen werden sollen (z. B. die älteren Einwohner 60+), möglichst gut repräsentieren soll. Repräsentativität bedeutet, einfach ausgedrückt, dass in der Stichprobe das in Frage stehende Merkmal ungefähr genauso verteilt ist wie in der Grundgesamtheit, aus der diese Stichprobe entstammt und für die die aus der Untersuchung gewonnen Erkenntnisse Gültigkeit besitzen sollen. Der „Königsweg“, um solche Repräsentativität zu erzielen, ist die echte Zufallsstichprobe, d. h. aus der Grundgesamtheit (Bevölkerung bzw. Bevölkerungsgruppe) werden Befragungspersonen zufällig ausgewählt, sodass für jede Person dieselbe Wahrscheinlichkeit besteht, in die Stichprobe aufgenommen zu werden. Andererseits kann aber auch eine solche Zufallsstichprobe dem Untersuchungsinteresse zuwider laufen: Gilt ein besonderes Interesse z. B. den hochaltrigen Personen über 80 Jahren, deren Anteil an der Gesamtbevölkerung gering ist, so kann eine ausschließliche Zufallsauswahl dazu führen, dass nur sehr wenige solcher hochaltrigen Personen gezogen werden und somit die Daten speziell für diesen Altersbereich kaum aussagekräftig sind. In diesem Fall würde sich die Ziehung einer sogenannten geschichteten Stichprobe empfehlen: Dabei wird die Gesamtpopulation in verschiedene Altersgruppen unterteilt und dann aus jeder dieser „Schichten“ eine Zufallsstichprobe in ausreichender Größe gezogen. Bei der Auswertung der Daten einer solchermaßen geschichteten Stichprobe ist allerdings zu bedenken, dass statistische Kennwerte für die Gesamtstichprobe (z. B. ein Mittelwert aller Befragten) verzerrt sein können, da z. B. die Hochaltrigen 80+ überrepräsentiert sind. Um trotzdem zu unverzerrten Aussagen über die Grundgesamtheit zu kommen, müssten die Werte der einzelnen Befragungspersonen entsprechend der Wahrscheinlichkeit ihrer Aufnahme in die Stichprobe gewichtet werden – und spätestens an dieser Stelle ist statistisches Expertenwissen gefragt, welches hier nicht detailliert wiedergegeben werden kann.
Abgesehen davon aber kann gesagt werden: Je größer die Stichprobe, desto besser! Je mehr Personen befragt werden, desto eher ergeben die Ergebnisse ein unverzerrtes Bild der Gesamtbevölkerung. Ideal wäre somit eine Vollerhebung aller in Frage kommenden Personen, falls diese ökonomisch realisierbar ist.


Teilnahmeverweigerung

Prinzipiell ist bei jeder empirischen Untersuchung mit einer gewissen Anzahl von Personen zu rechnen, die die Teilnahme verweigern. Diese Verweigerung ist dann problematisch, wenn sie „selektiv“ stattfindet, d. h. wenn sich die Ausfälle nicht zufällig über die ausgewählten Personen verteilen, sondern mit hoher Wahrscheinlichkeit eine bestimmte Personengruppe betreffen, welche somit in der Stichprobe unterrepräsentiert wäre. Dies wäre der Fall, wenn z. B. besonders Personen mit sehr niedrigem Einkommen oder hochaltrige Personen mit gesundheitlichen Problemen dazu tendieren, die Teilnahme zu verweigern. Eine einfache und für alle Fälle handhabbare Empfehlung, wie derlei vermieden werden kann, lässt sich im Grunde nicht geben. Generell sollte bereits im Vorfeld der Untersuchung überlegt werden, wie die Personen zur Teilnahme motiviert werden können. Nach Durchführung der Erhebung sollte auf jeden Fall überprüft werden, ob die Stichprobe hinsichtlich zentraler soziodemografischer Merkmale (Alter, Geschlecht, Bildung, Einkommen usw.) „selektiv“ ist, d. h. ob sie auffällige Abweichungen von der Grundgesamtheit aufweist. Die Verteilung dieser Merkmale in der Grundgesamtheit müsste aus vorhandenen Datenquellen (Einwohnermelderegister, statistische Ämter) erschließbar sein.


Fragebögen/Erhebungsinstrument

In der Regel wird für eine empirische Untersuchung ein Fragebogen erstellt werden, in dem die zu erfragenden Items und die darauf möglichen Antwortalternativen vorgegeben sind. Die folgenden Seiten bieten eine Liste von Indikatoren, die dabei ggf. aufzunehmen sind. Bezüglich der konkreten Formulierung und grafischen Gestaltung der Items empfiehlt es sich, auf bereits erprobte „Vorbilder“ zurückzugreifen. Diese liefern z. B. die oben aufgeführten Internet-Datenquellen, von denen auch meist die zugehörigen Fragebögen heruntergeladen werden können. Außerdem empfiehlt sich ein kleiner Probedurchlauf vor der eigentlichen Datenerhebung, bei dem einige Personen den Fragebogen bearbeiten, um auf diese Weise mögliche Verständnisprobleme und dergleichen aufzudecken und zu beseitigen.
Eine wichtige grundsätzliche Unterscheidung bei der Gestaltung von Fragebogen-Items ist die zwischen offenen und geschlossenen Antwortformaten: Bei geschlossenen Antwortformaten werden die möglichen Antwortalternativen explizit vorgegeben und müssen von der Befragungsperson oder vom Interviewer auf dem Fragebogen nur noch angekreuzt werden. Beim offenen Antwortformat kann sich die Befragungsperson zu der Frage frei äußern. Die Antwort wird dann möglichst wörtlich auf dem Fragebogen protokolliert. Solche offenen Formate empfehlen sich, wenn mögliche, bislang noch nicht realisierte Aspekte eines Themas, die für die Befragten wichtig sind, aufgedeckt werden sollen. Der Nachteil besteht allerdings in der schlechten Handhabbarkeit und geringen Objektivität der so gewonnen Informationen: Um zu statistischen Aussagen zu gelangen, müssen die freien Antworten auf irgendeine Weise kategorisiert werden, was natürlich gewisse Interpretationsspielräume eröffnet und zudem zeitaufwendig ist. Aus diesem Grunde sollten, wo möglich, geschlossene Antwortformate verwendet werden.


Verarbeitung und Auswertung der Daten

Hier kommt die eigentliche Statistik ins Spiel – und damit wiederum die Notwenigkeit speziellen Expertenwissens, das ohne entsprechende Vorbildung im Grunde kaum angeeignet werden kann. Die gewonnenen Daten müssen zunächst EDV-technisch erfasst, d. h. in einen Computerdatensatz eingegeben werden. Eine einfache Möglichkeit bietet hier das weit verbreitete Excel-Programm, das auf Computern mit Microsoft-Betriebssystemen heute fast immer installiert ist. Im Datensatz sollten die Variablen (erfragte Items) spaltenweise, die Befragungspersonen zeilenweise angeordnet sein. Die Zellen enthalten die Werte der Personen in den Variablen. Zuvor muss für jedes Item des Fragebogens festgelegt sein, welchen Wert welche vorgegebene Antwortalternative im Datensatz zugewiesen bekommt (z. B. bei der Variable Geschlecht: weiblich = 1, männlich = 2). Es empfiehlt sich, weitestgehend numerische Werte (Zahlen) zu benutzen, da die gängigen Statistik-Softwareprogramme leichter mit numerischen Variablen umgehen können. Ist der Computerdatensatz generiert, kann statistisch ausgewertet werden. Einfache Berechnungen (Mittelwerte, Prozentwerte usw.) können z. B. ebenfalls mittels Excel durchgeführt werden. Für komplexere statistische Verfahren benötigt man entsprechende Software wie SPSS, SAS oder Stata. Die Benutzung dieser Software erfordert spezielle Kenntnisse und Erfahrung. Es empfiehlt sich also, hier eine entsprechend geschulte Person zur Mitarbeit zu gewinnen.
Spezielle Fragen zu statistischen Auswertungsmethoden können im hier gesetzten Rahmen nicht behandelt werden. Für Eigenerhebungen ist es unerlässlich, dass eine Person mit Statistikexpertise zum Team gehört oder zumindest mit der Auswertung beauftragt wird.

Bei der Konzeption von Eigenerhebungen (Fragebögen), insbesondere bei der Formulierung von Fragen, kann die Arbeitshilfe (Teil 3) verwendet werden, die zu den meisten Indikatoren vorformulierte Fragen bzw. Fragenbogenauszüge/-bausteine enthält.