Modal-Split-Daten von Google: Warum Dortmund diese nicht nutzt
Google veröffentlich frei zugängliche Daten im Environmental Insights Explorer. Auf den ersten Blick klingt das sehr interessant, und lädt vielleicht zu Schlüssen ein, die in das eigene Weltbild passen. Jedoch sind die Daten weniger aussagekräftig, als es zuerst erscheinen mag, da sie ohne Kenntnis der Methodik wertlos sind.
Zu den angebotenen Daten gehören auch Daten zum Verkehrsaufkommen. Google schreibt zu den Daten:
Bei den Daten handelt es sich um eine modellierte Schätzung, die auf tatsächlichen Messungen der Aktivitäten und der Infrastruktur beruht. Den Schätzungen liegen dabei die gleichen Informationen zugrunde, die auch in Google Maps zur Verfügung gestellt werden.
Es sind also irgendwie aufbereitete Daten. Zu den Verkehrsdaten erläutert der Konzern:
Der EIE berücksichtigt:
- Alle Fahrten auf einer beliebigen Straße durch die Verwendung anonymisierter und aggregierter Standortdaten und die Modellierung der Gesamtbevölkerung und Belegungsfaktoren für den jeweiligen Verkehrsträger. […]
- Die gesamte Fahrt, die innerhalb der Stadtgrenzen beginnt oder endet. Wir stellen diese Informationen zur Verfügung, weil wir die gesamte Fahrt für die Planung von Einsparungen (z. B. Verkehrsverlagerungen vom Auto auf das Fahrrad) für relevanter halten.
Um die Fahrten [nutzen wir Daten […], die aus den eigenen Standortverlaufsdaten von Google abgeleitet sind.
Wie jedes Verfahren hat auch dieses seine Vor- und Nachteile. Gegenüber städtischen Erhebungen sticht die größere Datenbasis als großer Pluspunkt hervor. Wenn ich das richtig verstehe, ist damit durchreisender Verkehr nicht erfasst und jede Fahrt über Grenzen hinweg sowohl im Start-, als auch im Zielort erfasst. So richtig klar ist nicht, wie die Daten berechnet werden. Dies ist auch ein Grund für die Stadt Dortmund, diese bisher nicht zu nutzen, so Stadtsprecher Christian Schön gegenüber VeloCityRuhr.Net:
Die Methodik der Datenerstellung ist eine black–box und nicht nachvollziehbar. Es steht zu vermuten, dass sowohl direkte Nutzungsdaten verbreiteter Anwendungen wie google–maps, aber auch weiterer Anwendungen und Metadaten zum Einsatz kommen. Darüber sind jedoch keine Informationen verfügbar. Daher sind die Daten (und eventuelle Unzulänglichkeiten) nicht nachprüfbar. Dasselbe Problem haben auch ähnliche Datenanwendungen, beispielsweise Mobilfunkdaten (Verbindungsdaten) wie von terralytics oder u.a. floating car data.
Auch ist nicht klar, wie ein „Weg“ definiert ist (werden z.B. Wege zu Fuß zum Parkplatz als Fußweg gespeichert?). Der Mobilitätsplanung sind keine genauen Erhebungsmethodiken, keine Korrekturen, Datenvalidierung bekannt, auch nicht die Verteilung von Android–Geräten, google–maps Nutzenden o. ä. Inwiefern das Unternehmen in der Lage ist, von „seinen“ Nutzenden auf alle zu schließen, auch diejenigen, die keine google–Dienste nutzen und umgekehrt Fehler von denen, die mehrere Geräte nutzen, auf welche Weise zu bereinigen, bleibt unklar.
Das sind wirklich wesentliche Probleme, wenn man die Daten nutzen will – ein Screenshot davon ist schnell mit süffisanten Kommentar gepostet und wage Erinnerungen fließen in die politische Meinungsbildung ein. Für die städtische Planung seien die Daten zudem zu großräumig und es fehle eine unterjährige Auswertung. Dennoch nimmt die Stadt Dortmund an einem Forschungsprojekt zur Nutzung der Daten teil. Aktuell will die Stadt aufgrund der Probleme nicht auf die Haushaltsbefragung verzichten, so Schön.
Die Dortmunder Haushaltsbefragung und deren Methodik inklusive der Schwierigkeiten sind offen und nachvollziehbar. Deren Ergebnisse sind u. a. Grundlage des städtischen Verkehrsmodells, weil Zusammenhänge zwischen verschiedenen soziodemographischen Merkmalen wie Alter oder Beruf, räumlichen Merkmalen wie Stadtbezirk und Mobilitätskennziffern, z. B. Führerscheinbesitz, Zeitkartennutzung, PKW–Verfügbarkeit sowie den zurückgelegten Wegen inklusive Wegezweck, wichtig sind. Im Bereich der Erhebungsmethodik gibt es Entwicklungen, zusätzlich zu den (telefonischen/postalischen) Haushaltsbefragungen Wege auch elektronisch zu erfassen, beispielsweise über digitale Anwendungen. Vorteil der digitalen Erfassung von Wegen ist die bessere Erfassung von kürzeren Wegen, insbesondere Fußwegen, sowie die Möglichkeit, leichter über einen längeren Zeitraum (beispielsweise eine Woche) ein Wegeprotokoll zu führen.
Aufgrund der methodischen Probleme sind die Daten mit Daten aus anderen Quellen nicht vergleichbar. So ist es auch unredlich, wenn in Grafiken unterschiedlich erhobene Zahlen zu z. B. Radverkehrsanteilen nebeneinander gestellt werden.
Nutzbar sind die Daten unter der Voraussetzung, dass die Methodik gleich bleibt, für Langzeitvergleiche. 2022 wurden laut Google nur 4,53 % der Wege mit dem Rad zurück gelegt, 2018 (als älteste verfügbare Daten) waren es nur 2,97 %. Das ist eine Steigerung von gut 50 %. Interessant sind auch Vergleiche zwischen Städten. Ebenso ist ein Vergleich innerhalb der Methodik zwischen Städten. So werden in Kopenhagen, dem Dortmund ja nacheifern will, die meisten Wege zu Fuß zurückgelegt (wobei der Anteil gar nicht viel größer ist als in Dortmund!), der Anteil des Kfz-Verkehrs ist halb so groß wie in Dortmund und der Radverkehrsanteil gut 4 mal so hoch. Ob Dortmund auch ein Modal Split wie in Kopenhagen anstrebt, lies die Stadt offen. Nicht vergessen: Andere rechtliche, administrative, morphologische, geographische, klimatische und soziale Rahmenbedingungen machen ein direkt Vergleich eh schwierig.
Im Landesvergleich liegt Dortmund deutlich unter dem Schnitt. Dafür hat weder die Stadt, noch ich eine plausible Erklärung. Ihr? Schreibt’s in die Kommentare.