FGSV-Nr. FGSV 002/106
Ort Stuttgart
Datum 02.04.2014
Titel Mobilfunkbewegungsdaten als Erweiterung der Datengrundlage für Verkehrsmodelle
Autoren Univ.-Prof. Dr. Ing. Martin Fellendorf, Michael Cik, Bakk. rer. nat. Julia Vogel
Kategorien HEUREKA
Einleitung

Die Erhebung von Bestandsverkehrsdaten für großräumige Verkehrsuntersuchungen ist derzeit zeit- und kostenintensiv. Eine neue Möglichkeit der Datengewinnung bietet sich durch die wiederholte Erkennung mobiler Endgeräte. Ziel dieser Arbeit ist die Verwendung von Mobilfunkdaten als zusätzliche Eingangsquelle für Verkehrsmodelluntersuchungen mittels eines eigens entwickelten Softwarewerkzeugs zur Auswertung von Mobilfunk-Quelle-ZielBeziehungen. Daraus folgend wurde ein Verfahren zur Verschneidung des Mobilfunkbewegungsdaten mit dem Verkehrsmodell und dafür notwendige Extrapolationskoeffizienten entwickelt.

PDF
Volltext

Der Fachvortrag zur Veranstaltung ist im Volltext verfügbar. Das PDF enthält alle Bilder und Formeln.

1 Einleitung

Großräumige Verkehrsuntersuchungen benötigen Fahrtenmatrizen mit Angabe von Quelle, Ziel und gewähltem Verkehrsmittel für jede Fahrt. Fahrtenmatrizen werden zeit- und kostenintensiv mit Hilfe von Verkehrsnachfragemodellen berechnet. Als Eingangsdaten für Verkehrsnachfragemodelle dienen raumbezogene Strukturdaten, Verkehrszählungen und unterschiedliche Formen der Verkehrsbefragung. Daher stellt sich die Frage, alternative Möglichkeiten zur Gewinnung von Quelle-Ziel-Matrizen zu finden.

Eine neue Möglichkeit der Datengewinnung bietet sich durch die wiederholte Erkennung mobiler Endgeräte (z.B. Mobilfunktelefone, mobiles Internet, usw.). Aufgrund der hohen Verbreitung von Mobilfunktelefonen und der Möglichkeit, diese orten zu können, wird seit einiger Zeit versucht, diese Technologie zur Verkehrsdatengewinnung zu nutzen [1 - 3]. Die Position von beweglichen Mobiltelefonen (floating phones) wird über die anonyme Ortung in einer Mobilfunkzelle durchgeführt. Die Nutzung der sogenannten pseudonymisierten IMSI (International Mobile Subscriber Identity) als individuelles Identifizierungsmerkmal jeder einzelnen SIM-Karte (Subscriber Identity Module) eines Mobilfunkgerätes in GSM- und UMTS-Mobilfunknetzen (Global System for Mobile Communications, Universal Mobile Telecommunications System) ermöglicht es, Ortswechsel von SIM-Karten zu detektieren und damit die Reisezeiten einzelner Mobilfunknutzer zu berechnen und auf eine vergleichsweise günstige Weise zu ermitteln [4 - 7].

Dieser Beitrag beschäftigt sich mit der Verwendung von Mobilfunkdaten als Eingangsdaten für Verkehrsmodelle. Raumbezogenes Verkehrsaufkommen und Verkehrsverteilung werden durch die Auswertung von Mobilfunkdaten über einen längeren Zeitraum bestimmt. Neben einer Zeit- und Kostenersparnis soll durch die Einbeziehung und Kombination von Mobilfunkdaten mit derzeitig üblichen Erhebungsmethoden eine Qualitätsverbesserung erzielt werden. Eine offene Frage bei der Gewinnung von Nachfragematrizen aus Mobilfunkdaten ist die fehlende räumliche Kongruenz von Verkehrsbezirksgrenzen des Verkehrsmodells und der Zelleinteilung der Mobilfunkbetreiber. Weiterhin muss der Anteil der Mobilfunkbenutzer bezogen auf die Gesamtmenge der mobilen Bevölkerung berücksichtigt werden. In diesem Artikel werden Lösungen zu diesen beiden Fragestellungen anhand eines kalibrierten multimodalen Verkehrsmodells in Verbindung mit einem eigens entwickelten Softwarewerkzeug zur Auswertung von Quelle-Ziel-Beziehungen aus Mobilfunkdaten vorgestellt.

2 Datengrundlage und Berechnung der Mobilfunkbewegungsdaten

Die Datengrundlage bilden die Mobilfunkdaten des iTraffic Data Stream von der A1 Telekom Austria AG. Informationen, die zur Positionsbestimmung verwendet werden können, beruhen auf den Eventtypen bei aktiver Verwendung des mobilen Endgeräts (aus-/eingehende SMS, aus-/eingehender Anruf, Verwendung des Internets). Wird das Gerät passiv verwendet, kommt es nur beim Wechsel von einer Location Area (LA) zu einer anderen LA in Verbindung mit der periodischen Standortabfrage zu einem Eventeintrag. Abgespeichert werden die anonymisierte Identifikationsnummer (ID) des Teilnehmers (SIM-Karte), der Zeitstempel, der Eventtyp (z.B. SMS oder Anruf), die Position des Teilnehmers (Längen- und Breitengrad) und die Quelle (GSM, UMTS, GPS). Aus Datenschutzgründen wird nicht die Telefonnummer, sondern nur eine ID der SIM-Karte übertragen. Da die SIM-ID über einen Tag unverändert bleibt, sind Wegeketten über einen Tag nicht aber über mehrere Tage hinweg verfolgbar. Die genaue Position des Teilnehmers ist nur gegeben, wenn GPS die liefernde Quelle ist. Bei GSM und UMTS handelt es sich um eine Näherung (Koordinaten der Mobilfunkzellen) der tatsächlichen Position. In urbanen Räumen mit hoher Antennendichte beträgt die Positionsgenauigkeit über GSM/UTMS etwa 500 m; im ländlichen und alpinen Raum von Österreich weichen die Positionen gegenüber der tatsächlichen Position teilweise über 10 km voneinander ab (siehe Bild 1). Die tägliche Datenmenge des iTraffic Data Stream beläuft sich auf 50 bis 70 GB mit ca. 500 Millionen Events.

Bild 1: Positionsgenauigkeit – Distanz zwischen realer und Mobilfunkdatenposition als Vergleich für den städtischen und ländlichen Bereich in Österreich

2.1 Generierung von Mobilfunkzellen

Im Mobilfunknetz der Telekom Austria AG werden Sektor-Antennen und Rundstrahler als Mobilfunkanlagen verwendet. Die Unterschiede zwischen diesen liegen in der horizontalen und vertikalen Strahlungscharakteristik.

Rundstrahlantennen besitzen eine in alle Richtungen gleichförmige horizontale Abstrahlung. Bei der 3-Sektor-Antennenanlage befinden sich 3 Sektor-Antennen in einem Winkelabstand von 120° zueinander auf einem Mast oder in geringem Abstand auf unterschiedlichen Masten. Dadurch wird eine Funkzelle in drei unterschiedliche, aneinandergrenzende Bereiche geteilt (siehe Bild 2). Durch die Verwendung von Richtantennen kann die Strahlungscharakteristik zusätzlich verändert werden [8].

Bild 2: Positionsgenauigkeit – Distanz zwischen realer und Mobilfunkdatenposition als Vergleich für den städtischen und ländlichen Bereich in Österreich

Um alle Mobilfunkanlagenpositionen zu ermitteln, wurden die Daten von 7 Tagen im Juni 2013 aus dem iTraffic Data Stream ausgelesen und gefiltert. Insgesamt ergeben sich 19.544 verschiedene Standorte für Österreich, die entweder den Standort eines Rundstrahlers, den Standort des Mittelpunktes einer 3-Sektor-Antennenanlage oder den empirisch ermittelten Aufenthaltsort des Mobilfunkteilnehmers in einer dieser 3 Sektoren angeben. Für die richtige Ermittlung der Mobilfunkzellen dürfen im Fall einer 3-Sektor-Antennenanlage entweder die Position des Mastmittelpunktes oder die Positionen der Aufenthaltsorte in den jeweiligen Sektoren gegeben sein, nicht aber beide, da sonst die Position der Mobilfunkzellen in diesem Bereich falsch generiert wird.

Die Generierung der Mobilfunkzellen wurde mittels einer Delaunay-Triangulation und Voronoi Tesselation [9] durchgeführt. Die gegebenen Standorte der Mobilfunkanlagen wurden von WGS84 in ein kartesisches Koordinatensystem (UTM, Universal Transverse Mercator) transformiert. Mittels Delaunay-Triangulation wurde ein Dreiecksnetz gebildet, sodass jeder Standort der Mobilfunkanlage die Umkreisbedingung erfüllt; d.h. nur genau ein Mastpunkt liegt in einem Dreieck. Die Umkreismittelpunkte der Delaunay-Dreiecke bilden die Ecken der Voronoi-Zellen. Durch Verbindung der Umkreismittelpunkte angrenzender Dreiecke erhält man die Kanten eines Voronoi-Polygons. Jedes Voronoi-Polygon bildet die gesuchten Mobilfunkzellen (siehe Bild 3).

Bild 3: Generierte Mobilfunkzellen mittels der Voronoi Tesselation

2.2 Methode zur Berechnung der Mobilfunkbewegungsdaten

In diesem Abschnitt wird ein eigens entwickeltes Softwarewerkzeug zur Ermittlung von Quelle-Ziel Bewegungen aus Mobilfunkdaten (QZ-Mobilfunktool) vorgestellt. Auf einem Parallelrechnersystem werden die Mobilfunkdaten des iTraffic Data Streams räumlich und zeitlich gefiltert und anschließend sortiert. Danach wird jede Eventinformationen der IDs auf einer digitalen Karte positioniert.

Die Anwendung Quelle-Ziel-Mobilfunktool ermöglicht im Speziellen die Ermittlung von Quelle-Ziel-Beziehungen in einem definierten Zeitraum. Es werden die Zellinformationen einer Quell- bzw. Zielzelle in Form von Polygonen (räumliche Zuordnung) und der zu untersuchende Zeitraum vorgegeben (siehe Abbildung 4). Ausgegeben werden alle relevanten Mobilfunkbewegungen zwischen der angegebenen Quell- und Zielzelle. Mit dem Quelle-Ziel-Mobilfunktool sind diese Auswertungen auch zeitgleich für viele Zellen (Polygone), z.B. alle Verkehrsbezirke des Verkehrsmodells Österreich, aufgrund der hohen Rechenkapazität des Parallelrechnersystems möglich. Ebenso ist es möglich alle Mobilfunkbewegungen jeder einzelnen ID innerhalb einer Zelle für einen definierten Zeitraum auszuwerten („Binnenbewegungen bzw. Binnenverkehre“).

Bild 4: QZ-Mobilfunktool (hier mit 20 Quellzellen in Rot und einer Zielzelle in Blau) erlaubt zeitlich und räumliches Filtern der Mobilfunkdaten (Kartenbasis OSM)

3 Verschneidung des Mobilfunkbewegungsmodells mit dem Verkehrsmodell

Die TU Graz verfügt über ein multimodales Verkehrsnachfragemodell für den Großraum Graz (GUARD) mit knapp 1.000 Verkehrsbezirken und 120.000 Strecken. Die Verkehrsnachfrage ist für einen typischen Werktag stunden- und verkehrsmittelfein aufgelöst und für den mIV und ÖV kalibriert. Die Nachfragematrizen des Verkehrsmodells werden für die Validierung und Ermittlung von Explorationskoeffizienten der Mobilfunkdaten herangezogen. Um die Quelle-Ziel-Beziehungen der Mobilfunkdaten mit den Daten des vorhandenen Verkehrsmodells vergleichen zu können, müssen sich die Quelle-Ziel-Beziehungen auf identische räumliche Einheiten beziehen. Die Verkehrsbezirke des Verkehrsmodells basieren auf Zählsprengeln und stimmen dadurch nicht mit den generierten Mobilfunkzellen überein. Diese Problematik wird über den Flächenanteil eines Verkehrsbezirkes (VB) an einer Mobilfunkzelle (MZ) gelöst. Der flächenmäßige Anteil (1) eines Verkehrsbezirkes an einer Mobilfunkzelle bestimmt somit den Anteil der Quelle-Ziel-Beziehungen, der diesem Verkehrsbezirk zuzuordnen ist (siehe Bild 5).

Formel (1) siehe PDF.

Bild 5: Verschneidung eines Verkehrsbezirks (grün) mit mehreren Mobilfunkzellen (blau)

Werden zum Beispiel von der MZ 20 zu einer anderen Zelle 100 Wege zurückgelegt, dann gehören, bei einem 35%igen Flächenanteil der VB 2 an der MZ 20, 35 Wege zu VB 2 und 65 Wege zu VZ 1 (siehe Bild 6).

Bild 6: Flächenmäßiger Anteil des Verkehrsbezirks 2 (VB 2) an der Mobilfunkzelle 20 m (MZ 20)

3.1 Extrapolationskoeffizienten für das Mobilfunkbewegungsmodell

Die zuvor generierte Flächenanteil-Matrix, die für jeden Verkehrsbezirk den Flächenanteil an jeder Mobilfunkzelle angibt, bildet die Grundlage für die Korrekturberechnung der Mobilfunkbewegungsdaten. Diese sogenannten Extrapolationskoeffizienten des einzelnen Verkehrsbezirks sind von unterschiedlichen Faktoren abhängig:

•    Größe des Verkehrsbezirks

•    Anzahl der Einwohner

•    Anzahl der Mobilfunkanlagen im analysierten Verkehrsbezirk

•    Geografische Position des Verkehrsbezirks (urbaner bzw. ländlicher Bereich)

•    Verkehrsbezirk beinhaltet keine Mobilfunkanlage

Diese einzelnen Parameter werden in einem sogenannten Korrekturfaktor für Mobilfunkbewegungsdaten in der Auswertung berücksichtigt (2).

Formel (2) siehe PDF.

Unabhängig von den Verkehrsbezirkseigenschaften spielen in die Berechnung der Extrapolationskoeffizienten auch verschiedene Faktoren der Mobilfunkdaten eine signifikante Rolle:

•    Anteil der A1 Kunden an der Gesamtheit aller Mobilfunkanbieter – gewichteter Korrekturfaktor auf Basis von Altersverteilung und Geschlecht der Mobilfunkteilnehmer

•    Anzahl der auftretenden IDs bzw. Events (Häufigkeitsverteilungsanalyse)

•    Tageszeitabhängigkeit der auftretenden Events

•    Berücksichtigung des sogenannten Mobilfunk-Durchgangsverkehrs mittels Distanzwiderstandsfunktion (3): speziell im urbanen Bereich hat dieser Faktor eine übergeordnete Rolle (Übergang von Quellezelle zu direkter Nachbarzelle wird überrepräsentiert), da für einen Vergleich mit dem Verkehrsmodell nur die QZ- Beziehungen relevant sind. Es wurde für den urbanen und ländlichen Raum eine Distanzwiderstandsfunktion mit unterschiedlichen Widerstandsparametern entwickelt und für die Analyse angewendet.

Formel (3) siehe PDF.

4 Ergebnisse des Vergleichs von Mobilfunkbewegungsmodell mit Verkehrsmodell

In einer Analyse wurden für zwei definierte Gebiete (urbaner und ländlicher Raum) die Auswertungen der QZ-Beziehungen des Mobilfunkbewegungsmodells mit den Daten aus dem Verkehrsnachfragemodell GUARD (Werktag) verglichen. Für den urbanen Raum wurde das Zentrum der Stadt Graz und für das ländliche Gebiet die Gemeinde Leibnitz in der Südsteiermark herangezogen. In den nachfolgenden Tabellen 1 und 2 sind allgemeine Struktur- und Mobilfunkdaten dazu angeführt.

Tabelle 1: Allgemeine Struktur- und Mobilfunkdaten von Graz (Urbaner Raum) – Grundlage für den Korrekturfaktor für Mobilfunkbewegungsdaten

Tabelle 2: Allgemeine Struktur- und Mobilfunkdaten von Leibnitz (Ländlicher Raum) – Grundlage für den Korrekturfaktor für Mobilfunkbewegungsdaten

Es wurden bei den Mobilfunkdaten zwei Werktage (3. (Montag) und 6. (Donnerstag) Juni 2013) als Untersuchungszeitraum herangezogen. Für den Durchgangsverkehr der Mobilfunkdaten und der Strukturdateneinflüsse wurden die Korrekturfaktoren (2) und (3) für das Untersuchungsgebiet als Gewichtungsfaktor berücksichtigt. Für die Ergebnisse in diesem Beitrag werden die relativen Beziehungen als Vergleichsgröße zwischen Verkehrs- bzw. Mobilfunkbewegungsmodell herangezogen.

Die Abbildungen 7 und 8 zeigen die relative Verteilung der QZ-Beziehung für das Zentrum von Graz von Quellzelle 5 zu 20 verschiedenen Zielzellen mit der Widerstandsfunktion für das urbane Gebiet. Zuerst für den 3. Juni 2013 (Bild 7) und danach für den 6. Juni 2013 (Bild 8).

Bild 7: Graz (urbanes Gebiet): Vergleich Quelle-Ziel-Beziehung von Mobilfunkbewegungen und Verkehrsmodell für den 3. Juni 2013 (Montag)

Bild 8: Graz (urbanes Gebiet): Vergleich Quelle-Ziel-Beziehung von Mobilfunkbewegungen und Verkehrsmodell für den 6. Juni 2013 (Donnerstag)

Die Ergebnisse für das urbane Gebiet Graz zeigen auf den ersten Blick eine gute Übereinstimmung der relativen Verteilung der Mobilfunkbewegungen mit den Verkehrsmodellbeziehungen, auch in Bezug auf die große Anzahl der untersuchten Verkehrbezirke (21). Einzelne Beziehungen sind über alle Auswertungen hinweg etwas unter- bzw. überrepräsentiert und zeigen keine signifikanten Zusammenhänge. Speziell die Ergebnisse für den 6. Juni zeigen in Bild 8 für einzelne Beziehungen (Verkehrbezirk 1 und 20) große Unterschiede zwischen den Mobilfunkbewegungen und dem Verkehrmodell.

Die Abbildungen 9 und 10 zeigen die relative Verteilung der QZ-Beziehung für Leibnitz von Quellzelle 3 zu 5 verschiedenen Zielzellen mit der Widerstandsfunktion für das ländliche Gebiet. Zuerst für den 3. Juni 2013 (Bild 9) und danach für den 6. Juni 2013 (Bild 10).

Bild 9: Leibnitz (ländliches Gebiet): Vergleich Quelle-Ziel-Beziehung von Mobilfunkbewegungen und Verkehrsmodell für den 3. Juni 2013 (Montag)

Bild 10: Leibnitz (ländliches Gebiet): Vergleich Quelle-Ziel-Beziehung von Mobilfunkbewegungen und Verkehrsmodell für den 6. Juni 2013 (Donnerstag)

Die Ergebnisse für das ländliche Gebiet Leibnitz zeigen, ebenso wie Graz, auf den ersten Blick eine gute Übereinstimmung der relativen Verteilung der Mobilfunkbewegungen mit den Verkehrsmodellbeziehungen. Auch hier sind einzelne Beziehungen über alle Auswertungen hinweg etwas unter- bzw. überrepräsentiert und auf Basis statistischer Hypothesentests nicht signifikant. Jedoch zeigen die Auswertungen für alle QZ-Beziehungen für das ländliche Gebiet Leibnitz, auch aufrgund der geringeren Anzahl der Verkehrsbezirke, einen signifikant höheren Zusammenhang zwischen den Mobilfunkbewegungs- und Verkehrsmodellbeziehungen als der urbane Raum Graz.

5 Zusammenfassung und Ausblick

Mit dem QZ-Mobilfunktool lassen sich bisher Quelle-Zielbeziehungen für Wege ab ca. 500 m Wegelänge im städtischen Bereich und ca. 3 km im ländlichen Bereich gut erkennen. Sofern die Mobilfunkdaten über einen längeren Zeitraum vorliegen, ist eine Auswertung der Fahrtenmatrizen über die Zeit besonders interessant, da nur sehr wenige Mobilitätserhebungen einen Längsschnitt auf der Ebene von Fahrtenmatrizen zulassen.

Die Ergebnisse der relativen Verteilungen zwischen den einzelnen Quell-Ziel-Beziehungen der Mobilfunk- und Verkehrsmodelldaten zeigen signifikante Ergebnisse für den ländlichen und urbanen Raum.

Für kurze Wege (100 m) reicht die Ortungsgenauigkeit der Mobilfunkdaten nicht aus, da zumindest in Österreich nur sehr wenige Mobilfunkevents mit genauer GPS-Information versehen sind. In einem weiteren Forschungsprojekt wird aber auch an der zusätzlichen Integration von Social Media Daten (inhaltliche Textinformation und GPS-Information von Smartphone-Applikationen) neben den Mobilfunkdaten gearbeitet, um zum Beispiel Fußgängerverkehr bei Großveranstaltungen abbilden zu können.

Ebenso wurde testweise auf Basis der Mobilfunkdaten für Fernreisen eine Verkehrsmittelunterscheidung zwischen Straße und Schiene vorgenommen, indem ein Map-Matching Algorithmus die Eventpunkte mit dem Straßen- und Schienennetz verortet und mit dem Bahnfahrplan abgleicht.

6 Literatur

[1]    Steenbruggen, J., M. Borzacchiello, P. Nijkamp, and H. Scholten (2013) Mobile phone data from GSM networks for traffic parameter and urban spatial pattern assessment. GeoJournal , Vol. 78, Issue 2, 2013, pp. 223-243

[2]    Schlaich, J. (2010) Nutzung von Mobilfunkdaten für die Analyse der Routenwahl; Dissertation; Institut für Straßen- und Verkehrswesen, Universität Stuttgart

[3]    Schlaich, J. Analyses of Route Choice Behavior using Mobile Phone (2010). In Transportation Research Record: Journal of the Transportation Research Board, No. 2157, Transportation Research Board of the National Academies, Washington, D.C., 2010, pp. 13–20

[4]    Sánchez, N.C., L. M. Pérez, F. Benítez, and J. M. Del Castillo (2012) Traffic Flow Estimation Models Using Cellular Phone Data. IEEE Transactions on Intelligent Transportation Systems, Volume 13, Issue 3, 2012

[5]    Thiagarajan, A. (2011) Probabilistic Models For Mobile Phone Trajectory Estimation. Dissertation, Dept. of Electrical Engineering and Computer Science. Massachusetts Institute of Technology, 2011

[6]    Reiter, T., Cik, M., Haberl, M., Breitwieser, C., Scherer, R., Kröll, M., Horn, C., Müller- Putz, G., Lindsteadt S., Fellendorf, M. (2013) Traffic incident detection with cellular network data, OPTIMUM 2013 – International Symposium on Recent Advances in Transport Modelling, 21.-23.04.2013, Brisbane, Australien

[7]    Nachbagauer, G., Schosteritsch, P., Reiter, T., Scherer, R., Cik, M., Fellendorf, M. (2012) Traffic Analysis using Cellular Network Data, 19th ITS World Congress, Vienna, Austria, 22-26 October 2012

[8]    Sauter, M. (2010) Grundkurs Mobile Kommunikationssysteme: UMTS, HSDPA und LTE, GSM, GPRS und Wireless LAN; Vieweg+Teubner Verlag, Auflage: 4

[9]    Aurenhammer, F., Klein, R., Der-Tsai, L. (2013) Voronoi Diagrams and Delaunay Triangulations, World Scientific Publishing Company; 1 edition