Von 2018 bis 2023 haben wir daran gearbeitet, den Zugang zu den Daten der amtlichen Statistik zu verbessern.
Die Statistischen Ämter sammeln kontinuierlich Daten und erstellen Statistiken zu allen Bereichen unserer Gesellschaft, Umwelt und Wirtschaft. Das reicht von Zahlen zu Arbeitslosigkeit und Sozialleistungen bis zur Tierhaltung in der Landwirtschaft. Diese amtliche Statistik ist nicht nur eine wichtige Entscheidungsgrundlage für Politik und Verwaltung, sondern auch ein wertvolles Werkzeug für den Journalismus und zivilgesellschaftliche Initiativen.
Das Ziel von Datenguide war es, den Zugang zu Daten der statistischen Ämter zu verbessern, insbesondere für Jounalist*innen und andere zivilgesellschaftliche Akteure. Denn in der Praxis ist die Nutzung von amtlichen Statistiken oft schwierig. Obwohl die amtliche Statistik theoretisch der Öffentlichkeit zur Verfügung steht und die offiziellen Statistikportale Daten zum Download anbieten, stellen die Bedienung dieser Portale und die Weiternutzung der Daten ein großes Hindernis dar.
Die offiziellen Portale richten sich an Expert*innen und boten, zumindest zum Beginn des Projekts Datenguide, kaum Informationen für Laien oder brauchbare Werkzeuge zum Durchsuchen und Darstellen von Datensätzen. Aber auch für Fachleute ist die Arbeit mit offziellen Veröffentlichungen der Statistischen Ämter bis heute zeitraubend und frustrierend, da viele Datensätze einzeln angefordert und aufbereitet werden müssen.
Mit Datenguide wollten wir dazu beitragen, diese Hürden abzubauen. Wir haben an Open-Source-Tools gearbeitet, die helfen, die Daten der amtlichen Statistik sinnvoll einzusetzen. Dazu gehörte ein experimentelles Datenportal und eine Datenschnittstelle (API), die den Zugriff auf die Daten der Regionalstatistik ermöglichten. Die API und das damit verbundene Datenportal haben wir im Juni 2024 abgeschaltet, da die statistischen Ämter inzwischen offizielle Datenschnittstellen anbieten.
Datenguide war mehr als eine Online-Plattform. Wir haben mit verschiedenen Wegen der Nutzung und Bereitstellung von Daten experimentiert, Wissen über amtliche Statistik aufgebaut und uns für offene Daten eingesetzt. Wir haben einen Hackday zu Wahldaten organisiert und unser Wissen in Workshops und Vorträgen weitergegeben, zum Beispiel bei der re:publica, der SciCAR und beim Chaos Communication Congress. Gemeinsam mit der Community von CorrelAid haben wir nicht nur an Tools, sondern auch an Beispielen für die zivilgesellschaftliche Nutzung von amtlichen Statistiken gearbeitet.
Simon präsentiert Datenguide beim rC3, dem Online-Kongress des CCC. Hier erfahrt ihr alles über das Projekt und die Hintergründe. Von A wie Amtliche Statistik bis Z wie Zensus.
Video: Talk im Wikipaka-Stream, rc3 von media.ccc.de.
Foto: Workshop bei der OpenNews Unconference von Erik Westra (bearbeitet). Original unter CC BY-NC 2.0.
Den Ausgangspunkt für die Arbeit von Datenguide bildeten die Daten der deutschen Regionalstatistik, für deren Download und Weiterverarbeitung wir verschiedene Open-Source-Komponenten entwickelten. Die technischen Grundlagen dafür entstanden 2018 im Rahmen einer Förderung durch den Prototype Fund. Darauf aufbauend haben wir, unter anderem mit finanzieller Unterstützung des MIZ Babelsberg, eine Online-Plattform entwickelt und Fallstudien umgesetzt. Der Source-Code, der im Rahmen dieser Arbeit entstanden ist, ist auf GitHub archiviert.
2020 konnten wir, dank einer erneuten Förderung durch den Prototype Fund, verschiedene interaktive Visualisierungen und Tools entwickeln, die Hintergründe und Grundlagen für die Nutzung von amtlichen Statistiken erklären. Diese Inhalte sind, soweit technisch möglich, auch nach dem Ende des Projekts online verfügbar.
Die Arbeit an Datenguide floss auch zurück in die Weiterentwicklung der offiziellen Angebote der statistischen Ämter, unter anderem durch gemeinsame Workshops und einen Katalog mit Empfehlungen, den wir bereits 2018 im Rahmen einer Beratung für das Statistische Bundesamt entwickelt haben. Wir hoffen, dass wir durch unsere Arbeit auch Impulse für die zukünftige Verbesserung der offiziellen Statistikportale geben konnten.
Source Code für Datenguide auf GitHubStatistik erklärt: Grundlagen für die Arbeit mit den Daten der RegionalstatistikSo nutzt du die offiziellen Datenschnittstellen der statistischen ÄmterDas Kernteam von Datenguide bestand aus Simon Jockers, Simon Wörpel, Patricia Ennenbach und Christian Rijke. Wir wurden unterstützt von vielen anderen, die an unseren Veranstaltungen teilgenommen, eigene Prototypen entwickelt und teilweise auch am Code und der Dokumentation von Datenguide mitgearbeitet haben. Wir danken allen, die zu diesem Projekt beigetragen haben!
Das Projekt Datenguide wurde unterstützt durch das MIZ Babelsberg (2018-2019) und den Prototype Fund (2018, 2020), einem Projekt der Open Knowledge Foundation, gefördert durch das Bundesministerium für Bildung und Forschung. 2018 erhielten wir außerdem ein Grow-Stipendium von Netzwerk Recherche und der Schöpflin Stiftung.