Der Fachvortrag zur Veranstaltung ist im Volltext verfügbar. Das PDF enthält alle Bilder und Formeln.
1 Motivation
Moderne Fahrradverleihsysteme, auch Bike-Sharing-Systeme (BSS) genannt, ermöglichen eine umweltfreundliche und individuelle Mobilität im Stadtverkehr. Wesentliche Ziele von Städten, in denen BSS betrieben werden, sind die Reduzierung von Stau und Umweltverschmutzung sowie der Verbesserung der allgemeinen Fahrradnutzung, des Stadtbildes und der Gesundheit der Bevölkerung [1]. Weiterhin können mit dem Rad Gebiete erreicht werden, die über keine Anbindung an das ÖV-Netz verfügen. Nachteilig ist, dass die Benutzung des Fahrrads stark wetter- und topographieabhängig ist und sich eher für Kurzstrecken eignet. Ein flächendeckender Zugang mit automatisierten Ausleihprozessen wird in BSS durch Informations- und Kommunikationstechnologie unterstützt [2].
Die Dienstleistung in BSS besteht aus der Bereitstellung von Fahrrädern, der Entleihung eines Fahrrads, der Fahrt an sich und der Rückgabe des Fahrrads. Im Gegensatz zum traditionellen Fahrradverleih ist eine Einwegnutzung möglich. Eine Rückgabe am Entleihort ist somit nicht von Nöten. Betreiber dieser Systeme sind Städte und Kommunen, Transportunternehmen, Universitäten, gemeinnützige Organisationen (non-profit) und kommerzielle Unternehmen (for-profit) sowie sehr häufig Werbeunternehmen [3].
Hinsichtlich der Konfiguration von BSS werden stationslose und stationsbasierte Systeme unterschieden. In stationslosen Systemen, wie z.B. dem „Call a bike“ [4] der Deutschen Bahn, wird ein zu entleihendes Rad mittels eines Telefonanrufes freigeschaltet. Kunden stellen die Räder an einer dem Ziel nahegelegenen Kreuzung ab und teilen dem Betreiber den Standort per Anruf mit. In stationsbasierten Systemen, wie z. B. dem Pariser „Vélib“ [5], werden Räder an mit Fahrradboxen ausgestatteten Stationen, die über die Stadt hinweg verteilt sind, dem Kunden zugänglich gemacht. Das Werbeunternehmen JCDecaux betreibt dieses System und finanziert sich über die Vermietung von Werbeflächen, die von der Stadt Paris zur Verfügung gestellt werden.
Weiterhin unterscheiden sich BSS vom traditionellen Fahrradverleih in der Ausgestaltung der Preismodelle. Im Bike-Sharing werden vorwiegend lineare oder progressive Preismodelle gegenüber degressiven im Fahrradverleih eingesetzt. Die Abrechnung in stationslosen Systemen erfolgt meist minutengenau. In stationsbasierten durch Werbung finanzierten Systemen ist häufig die erste halbe Stunde kostenlos. Danach erhöhen sich die Kosten progressiv, z. B. in 30-Minuten-Schritten. Dadurch entsteht für den Kunden der Anreiz, das Rad möglichst kurz auszuleihen und es somit anderen Kunden schnell wieder zur Verfügung zu stellen.
Durch kurze Ausleihzeiten und Einwegnutzung entsteht ein Ungleichgewicht in der Fahrradverteilung an den Stationen, was bei der Standortplanung zu berücksichtigen ist. Daher widmet sich dieser Artikel der Antizipation der Betriebskosten in stationsbasierten BSS. Dazu werden zuerst drei Maßnahmen für die Planung und Steuerung von BSS vorgestellt. Danach fokussieren wir auf die langfristige Standortplanung. Ein Geo Business Intelligence Ansatz wird vorgestellt, mithilfe dessen Erkenntnisse über die operativen Vorgänge an stehenden Stationen gewonnen und für die Planung neuer Stationen übertragen werden können. In einer Fallstudie wird Einsicht in die vielschichtigen Ursachen für Entleihungen und Rückgaben an Fahrradstationen anhand des Wiener Citybike gegeben.
2 Betriebswirtschaftliche Betrachtung von BSS
In stationsbasierten BSS sind Entscheidungen über die Planung von Stationen und Steuerung der Fahrradverfügbarkeit zu treffen. Dazu ist zunächst die betriebswirtschaftliche Zielsetzung für eine Dienstleistung im Allgemeinen zu definieren: Zwischen den Faktoren Qualität, Zufriedenheit und Unternehmenserfolg existiert ein allgemein anerkannter Zusammenhang. Die transaktionsspezifische Zufriedenheit einer Dienstleistung resultiert aus der wahrgenommenen Qualität dieser Dienstleistung. Diese Zufriedenheit wiederum hat einen positiven Effekt auf den Unternehmenserfolg [6]. Übertragen auf BSS lässt sich daraus folgern, dass die Sicherstellung einer angemessenen Verfügbarkeit maßgeblich ist. Die Bereitstellung von Rädern bzw. Fahrradboxen ist essentiell zur Erreichung einer hohen Kundenzufriedenheit und dem damit einhergehenden Unternehmenserfolg. Als Beispiel aus der Praxis wird die Ausschreibung des BSS in Arlington [7] angeführt. Hier wird gefordert, dass Stationen tagsüber nicht länger als 60 nachts nicht länger als 180 Minuten gefüllt sind.
Dieser Zielsetzung wirkt entgegen, dass die Fahrradverfügbarkeit durch ein Ungleichgewicht in der örtlichen Verteilung der Räder an den Stationen beeinträchtigt wird. Dieses Ungleichgewicht entsteht durch Einwegnutzung und kurze Ausleihzeiten. Die Kapazität der Stationen ist begrenzt, weshalb an vollen Stationen keine Fahrräder abgegeben und an leeren Stationen keine Räder entliehen werden können. Anhand von drei Maßnahmen lässt sich die Verfügbarkeit in BSS gewährleisten:
- Die strategischen Aufgaben des Designs umfassen infrastrukturelle Fragestellungen wie eine geeignete Anzahl Fahrräder im System und die Standortplanung von Stationen.
- Das taktische Management beschäftigt sich mit Anreizen für die kundenseitige Verteilung der Räder.
- Im operativen Management werden Entscheidungen über die Repositionierung, also die betreiberseitige Umverteilung der Räder, getroffen. Die operativen Kosten zur Repostionierung eines Rads werden im Vélib auf drei US Dollar geschätzt [3].
In diesem Beitrag wird näher auf die strategische Aufgabe der Standortplanung eingegangen. Um suboptimale Entscheidungen beim Design zu vermeiden, sind die Kosten auf operativer Ebene geeignet zu antizipieren und bei der Errichtung von Stationen zu berücksichtigen.
3 Standortplanung in BSS mit Geo Business Intelligence
In der Standortplanung sind für die Neuplanung oder Erweiterung von BSS geeignete Entscheidungen über die Anzahl und Lage der Stationen sowie deren Anzahl an Fahrradboxen treffen. Dies sichert eine angemessene Fahrradverfügbarkeit. Eine Vielzahl von Optimierungsmodellen aus dem Operation Research zur Ermittlung geeigneter Standorte existieren [8]. Jedoch ist wissenschaftliche Literatur zur Standortplanung in BSS spärlich vertreten. Wir verfolgen einen Geo Business Intelligence (Geo BI) Ansatz zur Standortplanung in BSS. Durch Analyse von operativen Fahrraddaten werden Einblicke in die komplexen operativen Entleih- und Rückgabevorgänge erlangt. Dies führt zu einem besseren Verständnis über die Systemstruktur und erhöht die Effektivität Optimierungsmodellen [9]. Insbesondere ist die Übertragung der Erkenntnisse aus der operativen Ebene auf strategische Fragestellungen vielversprechend.
3.1 Aktuelle Ansätze
Erschienene Artikel widmen sich bisher keiner integrierten Betrachtung von Optimierung und Datenanalyse. Einerseits existieren Veröffentlichungen über die Analyse von Fahrraddaten aus BSS ohne direktes Ziel die gewonnenen Erkenntnisse in Optimierungsmodellen zu verwenden. Andererseits erfolgt eine Beschreibung von Standortoptimierungsmodellen, ohne detailliertes Wissen über das Systemverhalten im Bike-Sharing.
- Borgnat et al. [10] analysieren quantitativ die Fahrradfahrten aus dem Lyoner BSS. Zeitliche Muster hinsichtlich der systemweiten Nutzung über die Woche sind auszumachen. Weiterhin werden die Entleihungen und Rückgaben auf örtliche Muster untersucht, um die Fahrradflüsse innerhalb der Stadt zu verstehen. Dazu werden Flüsse zwischen den Stationen mithilfe eines Clusterverfahrens zu Gruppen zusammengefasst. Darüber hinaus wird ein Regressionsmodell zur Vorhersage der täglichen stundenweisen Fahrradnutzung vorgestellt. Teil des Regressionsmodells sind Wetterdaten wie Temperatur und Niederschlag.
- Kaltenbrunner et al. [11] analysieren die Füllstände an den Fahrradstationen des BSS in Barcelona. Grundlage sind die Füllstände, die vom Betreiber alle zwei Minuten aufgezeichnet werden. Die durchschnittlichen Füllstände der Stationen werden anhand von Tagesganglinien visualisiert. Zeitliche und räumliche Ähnlichkeiten in den Bestandsverläufen werden ermittelt. Außerdem erfolgt die Vorhersage der Füllstände einzelner Stationen auf Grundlage eines aktuellen Zustands bis zu einer Stunde in die Zukunft mithilfe einer Zeitreihenanalyse.
- Froehlich et al. [12] verwenden aufgezeichnete Füllstände aus dem BSS in Barcelona. Mittels eines Clusterverfahren werden Stationen anhand ihrer tageszeitabhängigen Füllstände zu Gruppen zusammengefasst. Weiterhin werden räumliche Abhängigkeiten der Füllstände ausgemacht.
- Aus Sicht des OR erstellen Lin und Yang [13] ein mathematisches Modell zur Bestimmung einer geeigneten Anzahl von Fahrradstationen und deren Standorte sowie Entscheidungen über die Netzwerkstruktur der Fahrradwege zwischen den Stationen und die Routen zwischen Ausgangs- und Bestimmungsort. Dabei soll eine gewisse Fahrradverfügbarkeit und Nachfrageabdeckung an den Stationen gewährleistet werden. Die Verfügbarkeit von freien Boxen zur Abgabe der Räder wird nicht modelliert. Weiterhin wird eine tagesabhängige Schwankung in der Nachfrage unterstellt. Somit fließt kein detailliertes Wissen über das Systemverhalten ein.
Wir stellen im Folgenden einen Geo Business Intelligence Ansatz vor, der Datenanalyse und Optimierung vereint und so zu besseren Standortentscheidungen führen kann.
3.2 Standortplanung mittels Geo Business Intelligence
Je nach Zielsetzung sind bei der Standortplanung die Kosten für die zu implementierenden Stationen unter Einbehaltung einer vorgegebenen Verfügbarkeit zu minimieren oder umgekehrt. Die Kosten für Stationen bestehen aus Erstellungs- und Betriebskosten. Die leicht zu ermittelnden Erstellungskosten setzen sich aus den Kosten für das Terminal und die Fahrradboxen sowie deren elektronische Versorgung und Datenleitung zusammen. Die reine Betrachtung der langfristigen Standortentscheidung ohne Berücksichtigung der operativen Vorgänge kann zu suboptimalen Standorten führen [14]. Deshalb müssen die Betriebskosten für die Sicherstellung der Fahrradverfügbarkeit, die durch die Repositionierung entstehen, antizipiert und in die Planung einbezogen werden. Eine Integration der Repositionierungskosten auf Ebene der Entleih- und Rückgabevorgänge an den einzelnen Stationen in das langfristige Standortmodell kann die Problemgröße explodieren lassen und zu einer Nichtberechenbarkeit führen. Daher sind die Repositionierungskosten an potentiellen Standorten anhand der zu erwarteten Entleih- und Rückgabevorgänge geeignet zu approximieren.
Die Ermittlung der potentiellen Entleihungen und Rückgaben geschieht mithilfe von Geo BI. Darin werden Hypothesen und Fragen aufgestellt, bei denen räumliche Daten mit einbezogen werden. Mittels (Geo-)Informationstechnologien und Methoden wie zum Beispiel Data Mining werden unternehmensinterne und externe Daten strukturiert, Raubezüge hergestellt, Zusammenhänge und Muster erkannt, analysiert und visualisiert, um entscheidungsunterstützende Ergebnisse zu liefern [15]. Folgende, von uns aufgestellte, Hypothese gilt es bei der Standortplanung in stationsbasierten BSS zu belegen: Die Entleihungen und Rückgaben an Stationen und das Kundenverhalten ähneln sich in gleichartigen Gebieten. Bei der Erweiterung bzw. Neuplanung eines BSS können damit Entleihungen und Rückgaben sowie Kundenverhalten für potentielle Standortgebiete ermittelt werden, um die einhergehenden Kosten zu antizipieren. In einem darauf folgenden Optimierungsmodell zur Standortplanung ist eine geeignete Anzahl, Lage und Größe der Stationen anhand der antizipierten Kostenunter Einhaltung einer gewissen Fahrradverfügbarkeit zu ermitteln.
Bild 1: Datenverarbeitungsprozesse zur Standortempfehlung in Anlehnung an Feix [15]
Die Grundlage des Geo BI Prozesses sind unternehmensinterne und –externe Daten, die anhand des Knowledge Discovery in Databases (KDD) Prozesses ([16], [17], [18]) analysiert werden. Der Prozess ist in Bild 1 dargestellt und enthält die folgenden Schritte:
- Im Preprocessing des Geo BI Prozesses werden sowohl die internen, vom Bike-Sharing Betreiber aufgezeichneten, Daten über Fahrten und Kunden, als auch Standortfaktoren in Form von unternehmensexternen geographischen (Markt-)Daten vorverarbeitet. Dazu erfolgt die Bereinigung, Selektion und Transformation der Rohdaten sowie die Geokodierung dieser Daten.
- Mithilfe von Data Mining lassen sich Muster in der Entleih- und Rückgabeaktivität an Stationen sowie das Verhalten der Kunden in Form von Kundenprofilen mithilfe von Clusteralgorithmen finden. Weiterhin werden die Stationen anhand ihrer Standortfaktoren gruppiert. Diese bestehen aus Gebietsmerkmalen wie z. B. topografischer Lage, Anbindung an Stationen des ÖPNV, Bevölkerungszahl, Altersstruktur, gewerblicher oder privater Nutzung des Gebiets. Somit lassen sich Stationen mit gleichartigem Umfeld zusammenzufassen. In der anschließenden Klassifikation werden potentielle Standorte, für die Gebietsmerkmale aber keine kundenbezogenen Fahrtdaten vorliegen, den gefundenen Mustern der Stationsaktivität und Nutzerprofilen zugeordnet. Dies geschieht auf Basis derjenigen Gebiete, für die bereits eine Zuordnung aufgrund der Analyse der internen Daten vorliegt.
- Im Postprocessing dient, neben Verfahren zur Clusterbewertung aus dem Data Mining, die Visualisierung der Ergebnisse mit einem Geographischen Informationssystem zur Interpretation und Validierung der gefundenen Muster.
Somit lassen sich die Stationsaktivität und das Kundenverhalten für Gebiete, in denen keine Stationen vorhanden sind, mithilfe des Stationsumfelds antizipieren, die dafür entstehenden Kosten approximieren, in ein Standortoptimierungsmodell integrieren und Empfehlungen für Standorte ableiten. Eine folgende Fallstudie gibt Einblicke in die räumlich und zeitlich abhängigen Entleihungen und Rückgaben an den Stationen.
4 Fallstudie
In einem ersten Schritt werden unternehmensinterne Daten in einer Fallstudie anhand des beschriebenen Geo BI Prozesses zur Standortplanung analysiert, um ein besseres Verständnis über die Fahrtaktivitäten zu erlangen. Dazu erfolgt zuerst die Vorstellung der Daten. Eine anschließende explorative Analyse zeigt eine saisonale und tageszeitabhängige Nutzung. Erkenntnisse über räumliche Abhängigkeiten werden durch eine Gruppierung der Stationen aufgrund ihrer Entleihungen und Rückgaben im Tagesverlauf gewonnen. Untersuchungen des Stationsumfelds validieren die Ergebnisse. Die internen Daten stammen von unserem Praxispartner „Citybike Wien“ [19]. Die Datenanalyse erfolgt mit der Rapidminer Community Edition [20] der Firma Rapid-I GmbH und die Visualisierung mit dem Geographischen Informationssystem Google Earth [21].
4.1 Vorstellung der Daten und Maßnahmen zur Datenbereinigung
Im Citybike Wien werden die Entleih- und Rückgabevorgänge an den Stationen elektronisch erfasst. Das Citybike verfügt über mehr als 60 Stationen und ist ein Projekt der Gewista Werbegesellschaft m. b. H. Daten von mehr als 760.000 Fahrten aus den Jahren 2008 und 2009 stehen zur Verfügung. Zur Charakterisierung der Fahrten werden Zeitpunkt und Stationsnummer von sowohl Entleihung als auch Rückgabe ausgewiesen. Geokoordinaten der Stationen liegen ebenfalls vor.
Für das Data Mining sind die Daten geeignet vorzubereiten und zu bereinigen. Es werden einige generelle und allgemeingültige Filter angewandt, um fehlerhafte und ungeeignete Werte zu entfernen. Folgende Maßnahmen werden vorgenommen:
- Entfernen von Fahrten, deren Entleihdauer unter 0 liegt. Dieser Fall kann eintreten, wenn bei der Rückgabe ein Fehler an der Box auftritt.
- Entfernen von Fahrten, die als defekt oder gestohlen ausgewiesen werden.
- Entfernen von Fahrten, die, wenn sie dieselbe Entleih- und Rückgabestation aufweisen, kürzer als eine Minute andauern. Das bedeutet, dass ein Rad unmittelbar nach der Entnahme wieder zur Verfügung steht. Eine Fahrt findet somit nicht statt.
- Entfernen von Fahrten, die an Teststationen des Betreibers beginnen oder enden.
- Stationen mit geringen Entleihungen und Rückgaben werden entfernt. Diese Stationen können ein untypisches und unregelmäßiges Aktivitätsmuster aufweisen, was die Ergebnisse der Clusteranalyse verfälschen kann.
Nach dieser Bereinigung reduziert sich die Anzahl der Fahrten um ca. 2 Prozent. Die Anzahl der Stationen sinkt auf 59.
4.2 Explorative Analyse zur Ermittlung zeitlicher Nutzungsmuster
Aufgrund der Datenfülle ist eine Betrachtung der einzelnen Fahrten nicht geeignet, um allgemeine Aussagen über die zeitliche Nutzung im gesamten System bzw. an den Stationen treffen zu können. Daher werden in einer explorativen Analyse zunächst Fahrtdauern ermittelt, gefolgt von Ganglinien der Fahrtanzahl unterschiedlicher zeitlicher Aggregation. Dies erfolgt auf Monats-, Wochen- und Tagesstundenbasis.
Aus der Differenz von Rückgabe- und Entleihzeitpunkt lässt sich die Fahrtdauer berechnen. Fahrten bis zu einer Entleihdauer von 60 Minuten sind im Citybike Wien kostenfrei. In mehr als 90 % der Fahrten fallen keine Kosten an. Anhand der minutenweisen aggregierten relativen Anzahl von Fahrten in Bild 2 ist zu erkennen, dass der Großteil erheblich kürzer als 60 Minuten ist. Der Median liegt bei etwa 15 Minuten, der arithmetische Mittelwert bei ca. 29 Minuten. Im BSS in Lyon liegt der Median der Fahrtdauer bei 11 Minuten [10]. In diesem System sind die ersten 30 Minuten einer Fahrt kostenlos.
Bild 2: Relative Häufigkeiten von Fahrtdauern
Anhand von Bild 3 wird die Gesamtnutzung des Systems in den Jahren 2008 und 2009 verglichen. Hierzu wurden Monatsganglinien der Fahrten gebildet. Ein Anstieg der Fahrten von etwa acht Prozent zwischen 2008 und 2009 ist zu verzeichnen. Gründe hierfür mögen in der steigenden Akzeptanz des Citybike und in der Erweiterung des Stationsnetzes liegen. Weiterhin wird die saisonal abhängige Nutzung deutlich. In beiden Jahren zeigt sich ein erster größerer Anstieg in den Fahrtzahlen im April. Somit stellt dieser Monat den Saisonauftakt dar. Im Sommer liegt die Systemnutzung auf einem hohen Niveau. Ab Oktober ist ein Rückgang der Nutzung zu beobachten. Somit können als Hauptsaison die Monate April bis Oktober ausgemacht werden. Ein Vergleich der beiden Jahre untereinander zeigt, dass Anfang 2008 die Niederschlagsmenge erheblich größer als 2009 [22]. Bei der Sonnenscheindauer war es umgekehrt [23].
Bild 3: Monatliche Fahrtanzahl in 2008 und 2009
Um die zeitlichen Verläufe der Fahrten genauer zu analysieren, müssen die Entleihungen und Rückgaben detaillierter aggregiert werden. Der Tradeoff ist folgender: Je kleiner das Zeitintervall, desto größer sind die Fluktuation, wohingegen bei einem größeren Zeitintervall Auffälligkeiten verloren gehen könnten. Im Innerortsbereich werden Messungen zur Verkehrsstärke für Tagesganglinien stundenweise aggregiert [24]. Borgnat et al. ermitteln Wochenganglinien für Lyons BSS auf Basis einer einstündigen Aggregation, wobei zeitliche Muster für Werktage und Wochenende zu beobachten sind [10]. Weiterhin ist der überwiegende Teil der Fahrten in Wien kürzer als 60 Minuten. Somit fällt die Wahl der Aggregationsebene auf eine stundenweise Aggregation aller Fahrten im Wochenverlauf, wodurch 168 Werte entstehen.
Bild 4: Absolute Fahrtanzahl im Wochenverlauf
Der Wochenverlauf auf Basis der Entleihzeitpunkte wird anhand von Bild 4 dargestellt. Zu erkennen sind unterschiedliche zeitliche Aktivitätsmuster an Werktagen und Wochenenden. Werktage weisen drei Nutzungsspitzen auf. Die Nachtspitze liegt zwischen 0 und 2 Uhr. Dies mag an der Einstellung des U-Bahn Betriebs zwischen 0 und 1 Uhr liegen. Danach sinkt die Fahrtzahl auf den Tiefpunkt in der fünften Tagesstunde. Eine Frühspitze ist am Morgen von 8 bis 10 Uhr auszumachen. Ein Grund hierfür könnte sein, dass das Citybike für den Weg zur Arbeit genutzt wird. Das globale Tagesmaximum wird zwischen 17 und 19 Uhr erreicht, was vermutlich am Rückweg von der Arbeit und einsetzendem Freizeitverkehr liegt. An Samstagen und Sonntagen ist die Nachtspitze besonders ausgeprägt, die Frühspitze fehlt. Die Hauptnutzung findet nachmittags statt. Die hier nicht abgebildete, quartalsweise Unterteilung des Wochenverlaufs zeigt dieselben Charakteristika in den Nutzungsspitzen. Lediglich die Amplituden unterscheiden sich. Jahreszeitlich bedingt ist die Nutzung im ersten und vierten Quartal geringer wohingegen das Citybike im zweiten und dritten Quartal stärker genutzt wird.
Bild 5: Durchschnittliche Anzahl an Entleihungen und Median der Fahrtdauer im 24-stündigen Verlauf
Um einen tieferen Einblick in die Aktivitäten zu bekommen, werden Tagesganglinien der durchschnittlichen Entleihungen und der Median der Fahrtdauern für Werktage, Samstage und Sonntag gebildet. In dieser Betrachtung sind die Wiener Feiertage als eigenständige Kategorie ausgewiesen. Bei den Entleihungen ist in Bild 5 zu erkennen, dass Samstage, Sonntage und Feiertage dasselbe zeitliche Aktivitätsmuster aufweisen jedoch mit unterschiedlichen Ausprägungen. Die Fahrtdauern sind in der Nacht generell gering. An Werktagen ist die Fahrtdauer signifikant geringer als an den übrigen Tagen. Besonders um die Mittagszeit sind erhebliche Unterschiede auszumachen. Dies lässt auf eine freizeitlich ausgerichtete Nutzung an Wochenenden und Feiertage schließen.
Die explorative Analyse zeigt die Komplexität von BSS auf operativer Ebene. Weiterhin sind zeitliche Nutzungsmuster zu beobachten.
4.3 Clusteranalyse zur Ermittlung zeitlicher und räumlicher Nutzungsmuster
Dieser Abschnitt befasst sich mit der Clusteranalyse der Fahrtdaten. Ziel ist eine Gruppierung von Stationen anhand der tageszeitabhängigen Aktivität bezgl. der Entleihungen und Rückgaben. Damit lassen sich Unterschiede und Gemeinsamkeiten an den Stationen verdeutlichen. Weiterhin werden Ursachen für unterschiedliche Stationsaktivität anhand der geographischen Lage gesucht. Zunächst sind die Daten aus Gründen der Vergleichbarkeit zu normalisieren. Danach erfolgt die Gruppierung von Stationen mithilfe eines Clusteralgorithmus. Die Tagesverläufe der gefundenen Cluster werden beschrieben und zeitlich sowie räumlich validiert.
4.3.1 Normalisierung und Clustering der Daten
Der vorherige Abschnitt hat gezeigt, dass Werktage sowie Wochenenden und Feiertage getrennt zu betrachten sind. In diesem Artikel werden im Folgenden lediglich Werktage untersucht. Die Aktivität an Stationen wird anhand der Entleihungen und Rückgaben im 24-stündigen Verlauf beschrieben. Die Aggregation der Werte erfolgt für den gesamten zweijährigen Zeitraum. Somit ergeben sich für jede Station jeweils 24 Werte für Entleihungen und Rückgaben. Da Stationen unterschiedliche Kapazitäten aufweisen sind die Tagesverläufe anhand von absoluten Werten nicht vergleichbar. Daher müssen Entleihungen und Rückgaben normalisiert werden, um die Stationskapazität bei der Analyse außer Acht zu lassen. Angewendet wird die proportionale Normalisierung [18]. Hier werden die Anzahl der Entleihungen bzw. Rückgaben für jede Stunde durch Gesamtanzahl geteilt. Somit ist die Summe der normalisierten Werte gleich Eins.
Ziel des Clustering ist es, Stationen anhand ihrer Aktivität in Gruppen zusammenzufassen. Stationen derselben Gruppe sollen eine große Ähnlichkeit aufweisen, wohingegen Stationen unterschiedlicher Gruppen möglichlist verschieden voneinander sein sollen [18]. Das Clustering erfolgt mittels des Expectation-Maximization-Algorithmus (EM-Algorithmus) [17]. Dies ist ein partitionierendes Verfahren. Hierbei werden die Objekte k Clustern zugeordnet. Jedes Cluster enthält mindestens ein Objekt. Es wird eine initiale Zuordnung der Objekte zu den Clustern generiert. Durch iterative Reallokation der Objekte wird das Clustering verbessert, wobei die Distanzen von Objekten innerhalb eines Clusters minimiert und die von Objekten verschiedener Cluster maximiert werden. Der EM-Algorithmus liefert für eine Clusteranzahl von fünf die besten Ergebnisse.
4.3.2 Beschreibung der Cluster
Die folgenden Verläufe zeigen die normalisierten Entleihungen und Rückgaben der gefundenen Cluster für jede Stunde des Werktages. Die Angabe von beispielsweise 5% zum Zeitpunkt 10 bedeutet, dass 5% aller Entleihungen bzw. Rückgaben von Stationen des Clusters im Zeitraum zwischen 10 und 11 Uhr stattfinden. Die Kurvenverläufe zeigen dabei den Durchschnitt für alle Stationen eines Clusters und werden demzufolge durch den jeweiligen Clustermittelpunkt, d.h. den Centroid, erzeugt.
Bild 6: Entleihungen und Rückgaben im Tagesverlauf
Zur leichteren Verständlichkeit werden den Clustern Namen zugeordnet. Die Bezeichnungen der Cluster ergeben sich aus ihren individuellen Charakteristika. Ein Merkmal wird einem Zeitraum zugeordnet, in dem es besonders signifikant auftritt. Die Cluster der Werktage werden folgendermaßen beschrieben:
- Cluster RMPE (Returns Morning Pickups Evening) weist eine hohe Rückgabeaktivität am Morgen und eine hohe Entleihaktivität am Abend auf.
- Cluster PMRE (Pickups Morning Returns Evening) entspricht dem Gegenteil: Hohe Entleihaktivität am Morgen und hohe Rückgabeaktivität am Abend.
- Cluster ANPM (Active Night Pickups Morning) weist die höchste Aktivität in der Nacht und gleichzeitig eine stärkere Entleihaktivität am Morgen auf.
- Cluster AD (Active Day) ist tagsüber systemweit der aktivste.
- Die Benennung des Clusters AVG steht für Average, um das durchschnittliche Aktivitätsprofil der zugehörigen Stationen zu symbolisieren.
Die Anzahl der Stationen pro Cluster ist recht ausgeglichen. Lediglich die Cluster AVG und AD weisen eine große bzw. besonders kleine Anzahl Stationen auf.
Tabelle 1: Clusterstruktur an Werktagen
Auffällig ist, dass die Stationen des Clusters AD im Zeitraum zwischen ca. 11 und 19 Uhr mehr als alle anderen Cluster genutzt werden. Am späten Abend und in der Nacht hingegen ist die Aktivität von AD systemweit am geringsten. Die Kurvenverläufe der Entleihungen und Rückgaben sind insgesamt recht ausgeglichen. Der Hochpunkt am Morgen ist nur bezüglich der Rückgabeaktivität zu erkennen. Am Nachmittag überwiegt die Entleihaktivität in geringem Maße.
Diese Tendenz – höhere Rückgabeaktivität am Morgen und höhere Entleihaktivität am Abend – tritt im Cluster RMPE verstärkt auf. An Stationen dieses Clusters ist morgens die Rückgabeaktivität clusterübergreifend am höchsten. Dabei ist die Rückgabeaktivität fast drei Mal größer als die Entleihaktivität. Im weiteren Tagesverlauf ist die Entleihaktivität erhöht, bis der Hochpunkt zwischen 17 und 18 Uhr erreicht ist. Zu diesem Zeitpunkt ist die Rückgabeaktivität etwas geringer. Auch am späten Abend und in der Nacht sind diese Stationen bzgl. der relativen Fahrtbeginne höher. Für die beiden beschriebenen Cluster ist also insgesamt die Neigung erkennbar, am Morgen eine höhere Rückgabeaktivität und am Abend eine höhere Entleihaktivität aufzuweisen.
Ein entgegengesetztes Aktivitätsmuster zeigen die Cluster ANPM und PMRE, wobei letzterer heraussticht. Zu allen markanten Tageszeiten (Nacht, Morgen und Nachmittag) ist das Aktivitätsprofil des Clusters PMRE dem des RMPE entgegengesetzt. Hier ist morgens die Entleihaktivität deutlich größer als bei allen anderen Clustern. Gleichzeitig ist die Rückgabeaktivität sehr gering, somit ist die Entleihaktivität zwischen 8 und 9 Uhr über viermal größer ist als die Rückgabeaktivität. Im Gegensatz zu den Stationen des Clusters RMPE könnte es hier zu niedrigen die Füllstände kommen. Danach die sinkt Entleihaktivität um am Nachmittag wieder zu steigen, wohingegen die Rückgabeaktivität im Tagesverlauf bis zum Maximum zwischen 18 und 19 Uhr stark ansteigt. Auch am späten Abend und in der Nacht ist die Rückgabeaktivität höher als die Entleihaktivität. In diesem Zeitraum gehört der Cluster zu den aktivsten im gesamten System.
Auch der Cluster ANPM weist die charakteristischen Merkmale des PMRE auf. Jedoch ist abends und nachts die Entleihaktivität höher bei etwa gleicher Rückgabeaktivität. Dadurch gehören die Stationen dieses Clusters zu den aktivsten in den Nachtstunden. Am Nachmittag und Abend ist wie beim PMRE die Rückgabeaktivität größer als die Entleihaktivität; die Diskrepanz ist jedoch sichtbar geringer als beim ANPM. Bis 24 Uhr besteht noch eine leicht höhere Rückgabeaktivität. Zum Tageswechsel steigt die Entleihaktivität auf das Niveau der Rückgabeaktivität. Das Aktivitätsmuster am Morgen mit höherem Anteil an begonnen Fahrten entspricht grundsätzlich wieder dem Cluster PMRE, ist aber weniger deutlich ausgeprägt.
Morgens ist sowohl das Verhältnis als auch der prozentuale Anteil von Entleihungen und Rückgaben von ANPM fast identisch zu dem des größten Clusters AVG. Zu den übrigen Tageszeiten sind die Kurvenverläufe recht ausgeglichen. Abweichungen sind am Morgen und in der Nacht festzustellen. Am Nachmittag und Abend sind Entleih- und Rückgabeaktivität in etwa gleich. Als besonderes Merkmal kann herausgestellt werden, dass die Verläufe dieses Clusters sehr ähnlich mit den über alle 59 Stationen gemittelten Werten sind. Gleichzeitig enthält AVG mit 19 Datenobjekten die meisten Stationen aller Cluster. Beide Erkenntnisse lassen also darauf schließen, dass hier Stationen mit typischer bzw. durchschnittlicher Aktivität im Tagesverlauf gruppiert sind.
4.3.3 Validierung der Cluster
Nach der Beschreibung der Cluster sollen die Muster zeitlich und räumlich validiert werden. Zunächst wird untersucht, inwiefern die tagezeitabhängige Stationsaktivität der Cluster zur allgemeinen Radaktivität in Wien passt. Weiterhin wird ein Zusammenhang zwischen der tageszeitabhängigen Aktivität der Cluster und der geographischen Lage ihrer Stationen hergestellt.
Bild 7: Tagesganglinien der Dauerzählung des Radverkehrs in Wien [25]
Damit die Ergebnisse des Clustering in Bezug zum allgemeinen Radverkehr gesetzt können, werden Daten aus der automatischen Radverkehrszählung in Wien hinzugezogen (Bild 7) [25]. Von den acht Zählstellen liegen die Zählstellen am Opernring und Westbahnhof in der Nähe von Citybike Stationen. Ob die Citybikenutzer diese Zählstellen auf ihren Fahrten passieren, ist nicht bekannt. Dennoch können aufgrund der Lage der Zählstellen Vergleiche in den Aktivitätsmustern zu den Citybike Stationen gemacht werden. Die Zählstelle Opernring weist in etwa dasselbe Aktivitätsprofil auf wie die umliegenden Stationen des RMPE Cluster. Auch die in dieser Arbeit nicht dargestellten Aktivitätsverläufe an Sams-, Sonn- und Feiertagen ähneln der der allgemeinen Radverkehrsstärke. Weiterhin sind die Tagesverläufe an den AVG Stationen in der Nähe des Westbahnhofs mit denen der Zählstation vergleichbar. Daraus lassen sich keine allgemeingültigen Aussagen über die Qualität des Clusterings treffen. Dennoch zeigt dieser Vergleich, dass die ermittelten Aktivitätsmuster der Cluster dem allgemeinen Radverkehr in Wien ähneln. Unglücklicherweise liegen die Daten der Zählungen nur bis 2007 vor und nicht für den Zeitraum der betrachteten Citybike Daten.
Bild 8: Geographische Lage der Cluster mit Wiener Bezirksgrenzen Bild 8 zeigt die geographische Verteilung der Cluster. Die ist Tendenz erkennbar, dass Stationen gleicher Cluster in Nachbarschaften auftreten. Stationen mit ähnlicher Aktivität scheinen also dazu zu neigen, sich in angrenzenden Gebieten zu befinden. Am auffälligsten kann das für die blau eingefärbten Stationen des Clusters RMPE festgestellt werden. Alle zugehörigen Stationen befinden sich ohne Ausnahme konzentriert in der Stadtmitte. Eine hohe Rückgabeaktivität am Morgen kann darauf hindeuten, dass das BSS als Transportmittel zur Arbeit genutzt wird. Bestätigt wird dies durch eine hohe Anzahl an Beschäftigten sowie einen hohen Anteil an nicht Wohngebäuden in der Stadtmitte (Bezirk 1) im Verglich zu den übrigen Bezirken ([26],[27]) Da das Citybike separate Touristenangebote zur Nutzung des Systems führt und sich im Stadtkern viele Sehenswürdigkeiten befinden, ist die Aktivität des Clusters eventuell auch auf die touristische Nutzung zurückzuführen. Eine höhere Anzahl an Entleihungen am Nachmittag und Abend korreliert mit der Vermutung des Touristen- und Pendlerverkehrs.
Inmitten des Gebiets vom blau gekennzeichneten Cluster RMPE findet sich die Station 1021 an der Fahnengasse des Clusters AD. In der Nähe ist die Ausgabestelle der Citybike Touristenkarten. Die anderen beiden Stationen dieses orange markierten Clusters befinden sich ebenfalls an markanten Punkten: dem Prater im Nordosten und dem Schloss im Südwesten. Im Cluster AD sind also insgesamt Stationen an touristisch besonders attraktiven Standorten gruppiert. Dieses könnte die durchgängig hohe Aktivität tagsüber erklären. Nachts hingegen werden die Stationen kaum genutzt.
Im Gegensatz dazu ist die nächtliche Aktivität des Clusters ANPM die höchste im System. Geographisch befinden sich die in Rot gehaltenen Stationen teilweise am Rand des Stationsnetzes und teilweise nahe am Zentrum. Im Nordwesten sind einige Stationen dieses Clusters an der Ringstraße zu finden. In der Nähe der Stationen 1041 Falkostiege und 1042 Pilgramgasse gruppieren sich beliebte Nachtlokale.
Die Merkmale des Clusters ANPM ähneln denen des Clusters PMRE, dessen Aktivität am Morgen und Abend jedoch deutlich signifikanter ausgeprägt ist. Die entsprechend grün markierten Stationen befinden sich stets am Randbereich des BSS und orientieren sich insgesamt stärker nach außen als die Stationen des eben betrachteten Clusters ANPM. Auffällig ist weiterhin, dass keine Station in direkter Nachbarschaft zu einer anderen Station des innenstadtnahen Clusters RMPE steht. Die periphere Lage und der Aktivitätsverlauf könnten auf eine Art Wohngebietscharakter des Clusters und somit eine Pendlernutzung hindeuten.
Der von durchschnittlicher Aktivität geprägte Cluster AVG ist mit 19 Stationen am häufigsten vertreten. Die räumliche Verteilung der violett gekennzeichneten Stationen ist eventuell gerade wegen dieser Tatsache recht diffus. Einerseits gibt es Gruppen von Stationen, die sehr weiten außen liegen, so beispielsweise im Südwesten. Andererseits schließen einige Stationen direkt an den Cluster RMPE an, der den Stadtkern ausfüllt. Auffällig ist dennoch, dass die Stationen jeweils im Verbund auftreten; außer im Nordosten ist keine Isolation zu erkennen. Bei den AVG Stationen scheinen sich die unterschiedlichen Nutzungsgründe zu überlagern.
Anhand der Clusteranalyse werden Erkenntnisse darüber gewonnen, dass sich die tageszeitlichen Aktivitätsmuster an Stationen ähneln. Ein Grund dafür scheint die räumliche Lage der Stationen zu sein, womit die in Kapitel 3.2 aufgestellte Hypothese gestützt wird.
5 Zusammenfassung und Ausblick
BSS erweitern das innerstädtische Mobilitätsangebot. Die Sicherstellung einer hohen Fahrradverfügbarkeit ist dabei essentiell für die Akzeptanz solcher Systeme. Aufgrund von Einwegnutzung und kurzen Ausleihzeiten ist ein Ungleichgewicht in der örtlichen Verteilung der Fahrräder zu beobachten. Zur Aufhebung des Ungleichgewichts wurden neben der betreiber- und kundenseitigen Umverteilung die Standortplanung vorgestellt. Dazu befasst sich dieser Artikel mit einem Geo Business Intelligence Ansatz, um Ursachen des Ungleichgewichts auf operativer Ebene zu finden, welche bei der langfristigen Standortplanung mit berücksichtigt werden müssen.
Analysen von Fahrraddaten aus Wien mithilfe eines Clusteralgorithmus zeigen räumliche und zeitliche Abhängigkeiten der Fahrradaktivität an den Stationen. Dies ist ein erster Schritt um zu sehen, dass die Lage der Stationen Einfluss auf die tageszeitabhängige Nachfrage und das damit einhergehende Ungleichgewicht in der Fahrradverteilung hat. Um einen besseren Eindruck zu bekommen, sind zukünftig die Kunden und das Stationsumfeld anhand des Geo Business Intelligence Prozesses zu untersuchen. Weiterhin sind die Daten anhand der gefundenen Erkenntnisse für die Anwendung in Standortmodellen geeignet aufzubereiten. Dazu kann ein formales Modell erstellt werden mit dessen Hilfe die tageszeitabhängige Nachfrage auf unterschiedlichen Aggregationsebenen abgebildet werden. Weiterhin ist zu ermitteln, mit welcher Aggregationsstufe sich in langfristiges Standortmodell lösen lässt bzw. auf welcher Ebene und wie die Betriebskosten zu ermitteln sind.
6 Danksagung
Wir danken der Gewista Werbegesellschaft m.b.H. für die Bereitstellung der Daten aus ihrem Projekt Citybike Wien sowie für Diskussion und kritische Auseinandersetzung mit den gefundenen Ergebnissen.
7 LITERATUR
[1] SHAHEEN, S.; GUZMAN, S.; ZHANG, H. (2010). Bikesharing in Europe, the Americas, and Asia: Past, Present and Future. Transportation Research Record, 2010
[2] BÜHRMANN, S. (2008): Bicycles as public-individual transport – European developments. Rupprecht Consult Forschung und Beratung GmbH, Köln.
[3] DEMAIO, P. (2009): Bike-sharing: History, Impacts, Models of Provision, and Future. In: Journal of Public Transportation, Vol. 12, No. 4, 2009.
[4] CALL A BIKE: http://www.callabike-interaktiv.de/
[5] VÉLIB: http://www.velib.paris.fr/
[6] KAISER, M.-O. (2004): Erfolgsfaktor Kundenzufriedenheit. Erich Schmidt Verlag GmbH.
[7] ZAHORY, M. N.: Ausschreibung für den Betrieb des Arlington Bike-Sharing-Systems. www.metrobike.net/index.php?s=file_download&id=18
[8] OWEN, S. H.; DASKIN, M. S. (1998): Strategic facility location: A review. European Journal of Operations Research 111 (1998). 423 – 447.
[9] MEISEL, S.; MATTFELD, D. (2010). Synergies of Operations Research and Data Mining. European Journal of Operational Research, 206(1), 1–10.
[10] BORGNAT, P.; ROBARDET, C.; ROUQUIER, J.-B.; ABRY, P.; FLEURY, E.; FLANDRIN, P. (2010). Shared Bicycles in a City: A Signal Processing and Data Analysis Perspective [Accessed 7 September 2010].
[11] KALTENBRUNNER, A.; MEZA, R.; GRIVOLLA, J.; CODINA, J; BANCHS, R. (2010). Urban cycles and mobility patterns: Exploring and predicting trends in a bicycle-based public transport system. Pervasive and Mobile Computing, 6(4), 455–466.
[12] FROEHLICH, J.; NEUMANN, J.; OLIVER, N. (2008). Sensing and Predicting the Pulse of the City through Shared Bicycling. Proceedings of the International Workshop on Urban, Community, and Social Applications of Networked Sensing Systems.
[13] LIN, J.-R.; YANG, T.-H. (2010). Strategic design of public bicycle sharing systems with service level constraints. Transportation Research Part E: Logistics and Transportation Review, In Press, Corrected Proof.
[14] SALHI, S.; RAND, G. K. (1989): The effect of ignoring routes when locating depots. European Journal of Operations Research 39 (1989). 150 – 156.
[15] FEIX, C. (2007): Bedeutung von "Geo Business Intelligence" und Geomarketing zur Entscheidungsunterstützung unternehmerischer Planungsprozesse im Kontext wirtschaftlicher Liberalisierung. Freie Universität Berlin.
[16] FAYYAD, U. M.; PIATETSKY-SHAPIRO, G.; SMYTH, P. (1996): From Data Mining to Knowledge Discovery: An Overview. In: Fayyad, U. M.; Piatetsky-Shapiro, G.; Smyth, P.; Uthurusamy, R. (Hrsg.): Advances in Knowledge Discovery and Data Mining. AAAI Press, Menlo Park, 1–34.
[17] TAN, P.-N.; STEINBACH, M.; KUMAR, V. (2006): Introduction to Data Mining. Pearson Addison-Wesley.
[18] HAN, J.; KAMBER, M. (2000): Data Mining: Concepts and Techniques. Morgan Kaufmann, San Francisco.
[19] CITYBIKE WIEN: http://www.citybikewien.at/
[20] RAPIDMINER: http://rapid-i.com/content/view/181/190/
[21] GOOGLE EARTH: http://www.google.com/earth/index.html
[22] O.V.: Niederschläge nach Monaten 2008 und 2009. Wiener Referat Statistik und Analyse. http://www.wien.gv.at/statistik/daten/rtf/niederschlaege.rtf
[23] O.V. Sonnenscheindauer nach Monaten 2008 und 2009. Wiener Referat Statistik und Analyse. http://www.wien.gv.at/statistik/daten/rtf/sonne.rtf
[24] PINKOFSKY, L. (2006): Typisierung von Ganglinien der Verkehrsstärke und ihre Eignung zur Modellierung der Verkehrsnachfrage. Dissertation. Betreut von Prof. Dr. Manfred Wermuth. Braunschweig. Technische Universität Carolo-Wilhelmina zu Braunschweig, Institut für Verkehr und Stadtbauwesen. Online verfügbar unter http://opus.tu-bs.de/opus/volltexte/2006/847, zuletzt geprüft am 07.01.2010.
[25] O.V.: Tagesganglinien der Fahrradverkehrsstärke. Sznizek + Partner Verkehrsplanungs GmbH. http://www.snizek.at/images/rpics/ganglinien/taggang0207.htm
[26] O.V.: Bezirksporträts. Wiener Referat Statistik und Analyse. http://www.wien.gv.at/statistik/pdf/bezirksportraets09.pdf
[27] O.V.: Unternehmen und Beschäftigte nach Bezirken 2001. Wiener Referat Statistik und Analyse. http://www.wien.gv.at/statistik/daten/pdf/unternehmen-bezirke.pdf |