Volltext |
Der Fachvortrag zur Veranstaltung ist im Volltext verfügbar. Das PDF enthält alle Bilder und Formeln.
1 Einleitung
In den Jahren bis zum Ausbruch der COVID-19-Pandemie konnte der Städtetourismus ein bemerkenswertes Wachstum verzeichnen. So stieg zwischen 2014 und 2019 der Marktanteil von Städtereisen an allen Reisen weltweit von 22 % auf 30 % [1, 2]. Die steigende Zahl an Städtereisenden in Verbindung mit der Tatsache, dass sich der Tourismus auf bestimmte Gebiete und Zeiträume konzentriert, führt zu wachsenden Problemen für betroffene Städte [3]. Darüber hinaus kann der Tourismus erhebliche Auswirkungen auf den Ausstoß von Treibhausgasen haben, insbesondere durch die An- und Abreise [4], aber auch durch das Mobilitätsverhalten am Urlaubsort, wenn der Pkw genutzt wird.
Bislang werden touristische Verkehre in der städtischen Verkehrsplanung kaum berücksichtigt. Bewährte Instrumente wie Verkehrsnachfragemodelle, die für die Prognose des Verkehrsaufkommens und zur Wirkungsabschätzung von Maßnahmen eingesetzt werden, basieren in der Regel auf Struktur- und soziodemografischen Daten des Untersuchungsgebiets und seiner Bevölkerung. Die von Gästen erzeugte Verkehrsnachfrage wird in diesen Modellen nur selten berücksichtigt. Einige regionale Modelle, insbesondere in Gebieten, in denen der Tourismus einen großen Wirtschaftsfaktor darstellt, enthalten erste Ansätze zur Berücksichtigung von Gästen in ihren Modellen, um die Modellqualität zu verbessern. Beispiele hierfür sind das Verkehrsmodell des Schweizer Kantons Graubünden [5] und eine Modellerweiterung für das österreichische Bundesland Salzburg [6].
Bestehende Ansätze beruhen häufig auf Annahmen statt auf empirischen Daten und nutzen vorhandene Daten zum Mobilitätsverhalten der Bevölkerung, da es an Daten über das Verhalten von Gästen mangelt. Gäste müssen während ihres Aufenthalts eine Reihe von Entscheidungen treffen. Zunächst müssen sie eine Folge von Aktivitäten festlegen, aus denen sich ihre Aktivitätenkette des Tages ergibt. Darüber hinaus wählen sie Verkehrsmittel für ihre Wege am Urlaubsort. Ein entscheidender Faktor für diese Wahl ist die Entscheidung über das Anreiseverkehrsmittel. Falls eine Person nicht mit dem Auto anreist, hat sie an ihrem Urlaubsort keinen Zugang zu einem privaten Auto. Wird kein Auto gemietet, sind Gäste gezwungen, sich mit öffentlichen Verkehrsmitteln oder zu Fuß fortzubewegen. Dies wurde in mehreren Studien nachgewiesen, z. B. in Gutiérrez und Miravet (2016) [7] und Bieland et al. (2016) [8]. Die Verkehrsmoduswahl für die Anreise kann als analoge Größe zur Verkehrsmodusverfügbarkeit in konventionellen Verkehrsnachfragemodellen gesehen werden.
Während Einflussfaktoren auf die Verkehrsmoduswahl von Gästen am Urlaubsort bereits häufiger untersucht wurden, fehlt es an dezidierter Forschung zum touristischen Anreiseverhalten. Ein möglicher Grund dafür liegt darin, dass bei vielen Reisezielen relevante Gästegruppen kaum andere Möglichkeiten haben, als mit dem Flugzeug anzureisen. Betrachtet man Fernreisen insgesamt, zeigt sich jedoch, dass reisespezifische Variablen wie die Reisezeit und die Reisekosten [9] aber auch die Anzahl an Umstiegen mit öffentlichen Verkehrsmitteln [10] als wichtige erklärende Faktoren für die Moduswahl betrachtet werden. Hinzu kommen soziodemografische Variablen wie das Einkommen [11], Geschlecht [12] oder die Zusammensetzung des Haushaltes, insbesondere bezogen auf Kinder [12].
In diesem Beitrag werden die Einflussfaktoren für die Verkehrsmoduswahl von Städtereisenden für ihre Anreise untersucht. Dafür werden diskrete Wahlmodelle genutzt, die auf Daten aus einer in Kassel durchgeführten Gästebefragung basieren. Die Befragung und die Verkehrsmoduswahlmodelle sind in ein Modellierungs-Framework eingebettet, welches als erster Vorschlag entwickelt wurde, um touristische Verkehr in Strukturen bestehender Verkehrsnachfragemodelle einbinden zu können. Die Schätzung der Wahlmodelle geschah deswegen sowohl unter den Gesichtspunkten der Anwendbarkeit in einem Modellierungs-Framework als auch zur Exploration von Signifikanz und Effektstärke verschiedener abhängiger Variablen. Die Erhebungen und Modellierungen waren Teil des von der Deutschen Forschungsgemeinschaft (DFG) geförderten Forschungsprojekts "Modellierung der Verkehrsnachfrage von Tagesgästen, Kurzurlaubern und Urlaubern in Großstädten", Projektnummer 409499825.
2 Gästebefragung
Die Daten für diesen Artikel basieren auf einer zweiphasigen Befragung, die in Kassel in zwei Zeiträumen durchgeführt wurde: einmal im September/Oktober 2020 und einmal im August/September 2021. Die ausgewählten Monate wiesen die höchsten Übernachtungszahlen in den jeweiligen Jahren auf, lagen aber zwischen 30 und 45 % unter dem Niveau des Vor-COVID-19-Jahres 2019. In beiden Zeiträumen waren die Infektionszahlen in Deutschland sehr niedrig, so dass es praktisch keine COVID-19-bedingten Einschränkungen für Inlandsreisende gab. Die Bedingungen für inländische Reisende waren daher vergleichbar mit der Zeit vor der Pandemie. Im Gegensatz dazu waren die Bedingungen für ausländische Gäste aufgrund der weltweit geltenden Reisebeschränkungen schwieriger, insbesondere hinsichtlich ihrer An- und Abreise. Natürlich hatte COVID-19 einen gewissen Einfluss auf die erhobenen Daten, insbesondere auf den Anteil ausländischer Gäste1. Die Übernachtungszahlen in Kassel haben sich aufgrund von COVID-19 im Jahr 2022 noch nicht vollständig erholt. Es bleibt ungewiss, wann der Tourismus wieder das Niveau von vor der Pandemie erreichen wird. Zielgruppe der Befragung waren Personen, die Kassel aus nicht geschäftlichen Gründen besuchten. Dazu gehörten sowohl Übernachtungs- als auch Tagesgäste, die aus Gemeinden anreisten, die mehr als 25 km von der Kasseler Innenstadt entfernt liegen. Die Befragung wurde in zwei zeitlich voneinander getrennte Phasen aufgeteilt.
Die erste Befragungsphase diente dazu, allgemeine soziodemografische sowie ökonomische Informationen über die Gäste und Details ihrer Urlaubsreise zu erheben. Sie wurde an mehreren Wochenenden an touristischen Schwerpunkten in Kassel als computergestütztes persönliches Interview (CAPI) durchgeführt. Die Zeiten und Orte wurden so gewählt, dass möglichst viele Gäste befragt werden konnten. Das Befragungspersonal wurde so geschult, dass sie die Befragten nach dem Zufallsprinzip auswählten. In der Praxis bedeutete dies, dass das Befragungspersonal aufgrund des ständigen Zustroms an Gästen nach einem erfolgreichen Interview oder einem erfolglosen Interviewversuch den nächsten ankommenden Gast ansprachen. Die Befragung an den touristischen Hotspots war alternativlos, da es keine praktikable Möglichkeit gab, Gäste vor Antritt ihrer Reise zu kontaktieren. Dies hat zur Folge, dass die erhobenen Daten nicht repräsentativ für alle Gäste Kassels sind und mit einer gewissen Verzerrung zu rechnen ist. Durch die Beschränkung der Grundgesamtheit auf die Besuchenden der touristischen Hotspots an den gegebenen Tagen und Uhrzeiten kann die Stichprobe aufgrund des gewählten Ansatzes dennoch als weitgehend zufällig angesehen werden.
Die Gäste wurden durch mehrere Screening-Fragen von der lokalen Bevölkerung abgegrenzt und anschließend zu soziodemografischen Angaben, dem Hauptgrund für den Besuch Kassels, dem Verkehrsmittel für die Anreise, der Aufenthaltsdauer sowie den geplanten und besuchten touristischen Attraktionen in Kassel befragt. Zusätzlich wurden bei Übernachtungsgästen Informationen zur Unterkunft während des Aufenthaltes erhoben. Im ersten Teil der Untersuchung wurden insgesamt 2.050 Gäste befragt. Diese setzten sich aus 760 Tagesgästen und 1.290 Übernachtungsgästen zusammen.
Angelehnt an die verhaltenshomogenen Personengruppen aus Verkehrsnachfragemodellen der Alltagsmobilität, wurden die Gäste anhand ihres Anreiseverkehrsmodus (MIV bzw. ÖV) und der Länge ihres Aufenthaltes (Tagesgast bzw. Übernachtungsgast) eingeteilt. Für zwei Personengruppen (Tagesgäste, die mit dem MIV angereist sind und Übernachtungsgäste, die mit dem MIV angereist sind) sollte detaillierter das Aktivitäten- bzw. Mobilitätsverhalten am Urlaubsort erhoben werden. Dazu wurden befragte Personen aus Phase 1, die zu einer der beiden Gruppen gehörten, für die Befragungsphase 2 ausgewählt.
Ziel der zweiten Befragungsphase war es, alle durchgeführten Aktivitäten der befragten Personen zu erfassen, die sie an dem Tag der Befragungsphase 1 durchgeführt haben. Dies wurde auf zwei Arten durchgeführt. Die meisten Gäste wurden ein bis zwei Tage nach der ersten Befragung erneut telefonisch kontaktiert und mit Hilfe eines computergestützten Telefoninterviews (CATI) befragt. Auf diese Weise konnten die Befragten alle Aktivitäten ihres Urlaubstages wiedergeben. Des Weiteren wurde zur Erhöhung der Ausschöpfung bei Tagesgästen, die keine weiteren Aktivitäten an dem Tag durchführen wollten und zeitnah die Rückreise nach Hause antraten, die Erhebung der Aktivitäten direkt vor Ort nach Befragungsphase 1 durchgeführt. Wie bei Bursa et al. (2022) [13] wurde das Konzept der Reisetagebücher als Grundlage für die Erhebung der Aktivitäten der Gäste genutzt. Für jede Aktivität wurden u. a. folgenden Informationen erhoben:
- Anfangs- und Endzeit der Aktivität,
- Art der Aktivität,
- Punktuelle oder räumliche Aktivität2),
- Ort der Aktivität,
- genutzten Verkehrsmittel auf dem Weg zur Aktivität.
2) Räumliche Aktivitäten unterscheiden sich von punktuellen Aktivitäten darein, dass sie einen Start- und Zielpunkt haben können, die entweder gleich oder unterschiedlich sein können. Dies sind vor allem Aktivitäten bei denen die Aktivität aus der Bewegung an sich besteht, zum Beispiel der Spaziergang durch eine Parkanlage. Des Weiteren werden mehrere aufeinanderfolgende Aktivitäten derselben Art, die in einem begrenzten Raum stattfinden zu einer räumlichen Aktivität zusammengefasst (z. B. der Besuch mehrerer Läden in einer Fußgängerzone).
Insgesamt wurden in Befragungsphase 2 1.186 Aktivitäten vor Ort von 397 Gästen erhoben. Diese setzen sich aus 229 Tages- und 168 Übernachtungsgästen zusammen. Ausführlich wurden Methodik und Ergebnisse der Gästebefragung in Harz und Sommer (2022a) [14] veröffentlicht.
3 Modellframework
Das in diesem Beitrag vorgestellte Wahlmodell für den Anreiseverkehrsmodus ist eingebettet in ein Modellframework zur Modellierung der Verkehrsnachfrage von touristischen Verkehren in Großstädten. Das Framework modelliert einzelne Gäste mit ihren Aktivitätenketten.
Da im Gegensatz zur Wohnbevölkerung grundlegende Daten zu den Gästen einer Region fehlen, sind vorgelagerte Modellschritte erforderlich, um eine Grundlage für die Modellierung zu schaffen:
- Abschätzung der Anzahl an Tages- und Übernachtungsgästen: Wesentlich für die Modellierung des touristischen Verkehrsaufkommens ist es zu wissen, wie viele Gäste eine Stadt in einem bestimmten Zeitraum besuchen. Offizielle Statistiken geben lediglich Auskunft über die Anzahl an Ankünften und Übernachtungen in Übernachtungsbetrieben. Zahlen zum grauen Beherbergungsmarkt, also Übernachtungen bei Freunden oder Verwandten sowie in nicht registrierten Ferienwohnungen (z. B. AirBNB) existieren nicht. Für Tagesgäste existieren Zahlen des Tagesreisenmonitors des dwif [15], jedoch liegen diese nicht für jede Stadt in einem für die Modellierung erforderlichen Detailierungsgrad vor. Die Abschätzung über Anzahl und zeitliche Verteilung der Gäste bedarf deswegen eines eigenen Verfahrens, welches anhand von Erfahrungswerten und empirischen Daten möglichst genaue Abschätzungen vornimmt.
- Verkehrsmoduswahl für die Anreise: Die Wahl des Anreiseverkehrsmodus hat erwiesenermaßen einen direkten Einfluss auf die Verfügbarkeit von Verkehrsmitteln am Urlaubsort. Während für die Wohnbevölkerung einer Region Daten zum Pkw-Besitz in die Verkehrsmodellierung einfließen, ist für Gäste eine Verkehrsmoduswahl erforderlich.
- Modellierung der Unterkunftswahl: Für Übernachtungsgäste stellt die Unterkunft den temporären Wohnort während des Aufenthaltes dar. Die Wahl der Art der Unterkunft (Hotel, bei Freunden oder Verwandten, AirBNB etc.) sowie des konkreten Ortes sollte ursprünglich mit Hilfe eines eigenen Teilmodells geschehen. Im Rahmen des Projektes wurde aufgrund mangelnder Datengrundlage jedoch darauf verzichtet. Die Wahl der Unterkunft erfolgt stattdessen im Rahmen der Zielwahl.
Die Modellierung des Mobilitätsverhaltens am Urlaubsort besteht darauf aufbauend auf den folgenden Modellschritten:
- Erzeugung synthetischer Aktivitätenketten: Aus den Befragungsdaten wurden Übergangswahrscheinlichkeiten zwischen den Aktivitätentypen innerhalb der Aktivitätenketten bestimmt. Diese bilden die Grundlage um mit Hilfe eines absorbierenden Markov-Prozesses [16] neue Ketten in beliebiger Anzahl erzeugen zu können.
- Verkehrserzeugung und Zielwahl: Die Aktivitätenorte jeder Aktivitätenkette werden disaggregiert nach Aktivitätentypen ausgewählt. Für den Auswahlprozess spielt die Attraktivität einer Zielzelle in Form von Strukturdaten wie Anzahl an Zielgelegenheiten oder Gästezahlen bei touristischen Attraktionen eine wichtige Rolle. Hinzu kommt der Widerstand in Form der Luftlinienentfernung zu vor- und nachgelagerten Aktivitäten. Die Auswahl erfolgt stochastisch mit einem Logit-Modell.
- Verkehrsmoduswahl der Wege am Urlaubsort: Auf Basis der in der Revealed-Preference-Befragung erhobenen Wege wurde ein diskretes Wahlmodell für Moduswahl der Wege am Urlaubsort geschätzt. Die Methodik und Ergebnisse wurde in Harz und Sommer (2022b) [17] veröffentlicht.
Das Ergebnis des Frameworks sind Wegeketten, mit den Wegen zugeordneten Verkehrsmodi. Diese können als Grundlage für Multiagentensimulationen, z. B. in MATSim genutzt werden oder in modusfeine Quelle-Ziel-Matrizen transformiert werden, um sie in bestehende aggregierte Verkehrsnachfragemodelle einzuspeisen.
4 Modellierung des Anreiseverkehrsmodus
4.1 Datenaufbereitung
Für die Modellierung wurden zunächst aus den Befragungsdaten der ersten Befragungsphase die Anreisewege für die befragten Gäste abgeleitet, die innerhalb Deutschlands anreisten. Es wurde angenommen, dass der Anreiseweg jeder Person am Wohnort beginnt und an einem einheitlichen Punkt in Kassel endet. Der Wohnort der befragten Personen liegt jeweils als Kombination aus Postleitzahl und Gemeinde vor. Genauere Adressdaten wurden aus Gründen des Datenschutzes nicht erhoben. Für die Modellierung wurde sich auf die zwei Anreiseverkehrsmodi Motorisierter Individualverkehr (MIV) und Schienenpersonenverkehr (SPV) beschränkt. Anreisen mit dem Wohnmobil (ca. 3,3 % der Fälle) wurden aufgrund der besonderen Urlaubsform nicht mit betrachtet. Ebenso wenig wurden Anreisen mit dem Fernlinienbus und dem Fahrrad aufgrund der niedrigen Fallzahlen berücksichtigt. Insgesamt wurden in der Modellierung 1765 der 2037 befragten Gäste berücksichtigt.
Aus den Informationen zum gewählten Verkehrsmodus zur Anreise und den Daten zum Wohnort der Gäste wurde je Gast ein Choice Set erstellt, welches alternativenspezifische und fallspezifische erklärende Variablen enthält. Alternativenspezifische Variablen sind Merkmale, die sich sowohl zwischen den Gästen als auch zwischen den beiden zur Wahl stehenden Verkehrsmodi unterscheiden. Häufig genutzte Variablen, die darunterfallen, sind die Reisezeit und die Reisekosten. Dadurch, dass die Variablen sich zwischen den Verkehrsmodi unterscheiden, müssen zu den Informationen zum gewählten auch immer Informationen zum nicht gewählten Verkehrsmodus vorliegen. Diese Informationen können jedoch nicht durch eine Revealed-Preference-Befragung erhoben werden. Hierfür ist eine Rekonstruktion der Daten erforderlich, wofür alternative Datenquellen erforderlich sind, beispielsweise Routing-Algorithmen. Für jeden Weg wurden jeweils für den MIV und den SPV die Reisezeiten sowie die Entfernung ermittelt. Außerdem wurden für Verbindungen des SPV mittlere Umstiegshäufigkeiten abgeleitet. Auf eine Rekonstruktion der Reisekosten wurde insbesondere aufgrund der Komplexität durch Faktoren wie dem Yield Management der Deutschen Bahn und der Preissensitivität der Gäste verzichtet [18]. Es wurden ausschließlich Personen abgebildet, die in Deutschland wohnen, da bei ausländischen Gästen teilweise andere Wahlentscheidungen vorgelagert sind (z. B. Anreise mit dem Flugzeug) und sich Merkmale wie die Reisezeit für diese Personen nicht eindeutig rekonstruieren lassen.
Für die Rekonstruktion wurden Start- und Zieladressen zunächst in Geokoordinaten überführt. Die Rekonstruktion der Reisezeiten, Entfernungen und Anzahl an Umstiegen wurde mit Hilfe von Programmierschnittstellen erledigt. Zunächst wurde das Routing API-Paket von here verwendet [19]. Im Gegensatz zu vielen anderen Schnittstellen kann diese deutschlandweite Verbindungsauskünfte für den öffentlichen Verkehr, inklusive dem lokalen ÖPNV, liefern. Zudem können die Verbindungsauskünfte adressfein mit Zu- und Abgangsetappen zu Fuß angefordert werden.
Mithilfe der API wurden die Pkw-Reisezeiten und Entfernungen für die Anfahrt mit dem Pkw ermittelt. Dazu wurde die sogenannte „typical duration“ der API genutzt, welche zeittypische Verkehrszustände mitberücksichtigt und so einer realitätsnahen Reisezeit entspricht. Es wurde angenommen, dass die Gäste sich für die schnellste Route entscheiden. Alternativrouten, die länger dauern, wurden nicht berücksichtigt.
Die Ermittlung der Reisezeiten für den Öffentlichen Verkehr erfolgte zuerst ausschließlich mit der Public Transit Routing API von here [20]. Da jedoch bei einer stichprobenartigen Prüfung der Ergebnisse auffiel, dass vor allem Verbindungen aus NRW nach Kassel deutlich zu hohe Reisezeiten aufwiesen, was an fehlenden Fahrplandaten von zwei wichtigen Regionalexpresslinien lag, wurde zusätzlich eine zweite Schnittstelle, die TRIAS API der Landesnahverkehrsgesellschaft Baden-Württemberg genutzt [21]. Da auch bei dieser Schnittstelle fehlerhafte Verbindungsauskünfte auftraten, wurden sämtliche Anreiserelationen bei beiden Schnittstellen abgefragt und bis auf einzelne Ausnahmen die Ergebnisse weiterverwendet, die die geringste Reisezeit von beiden Schnittstellen aufwiesen.
Da beim Routing standardmäßig sämtliche öffentlichen Verkehrsmittel berücksichtigt werden, wurde für die Ermittlung der Reisezeiten die Verkehrsmittel Fernlinienbus sowie Flugzeug ausgeschlossen. Im Gegensatz zum MIV-Routing wurden bei der Ermittlung der Reisezeiten des Öffentlichen Verkehrs mehrere mögliche Verbindungen betrachtet. Dies ist zum einen sinnvoll, da eine zeitliche Variabilität in der Angebotsqualität, je nach Abfahrtszeit, existieren kann, mit der Folge stark unterschiedlicher Reisezeiten. Es wurden je Relation sechs Verbindungen mit der Public Transit Routing API bestimmt und aus den ermittelten Reisezeiten und Umstiegshäufigkeiten der Mittelwert gebildet.
Zusätzlich wurde das Choice Set mit fallspezifischen Variablen aus der ersten Befragungsphase angereichert. Dies sind Variablen, die sich zwischen den verschiedenen Fällen, also den Gästen unterscheiden, aber keine unterschiedlichen Werte zwischen den Wahlalternativen besitzen. Dazu zählen in diesem Fall personen- und haushaltsbezogene Variablen der Gäste sowie Variablen der Urlaubsreise.
4.2 Modellierung
Für die Modellierung des Anreiseverkehrsmittels wurden binominale Logit-Modelle genutzt. Logit-Modelle werden häufig mit Daten von diskreten Wahlexperimenten verwendet, insbesondere für Modelle der Verkehrsmoduswahl. Wie von Train (2022) [22] beschrieben, ermittelt das Logit-Modell die Auswahlwahrscheinlichkeiten Pni einer entscheidenden Person Pni für jede Alternative n aus einem Choice Set An wie folgt.
Formel in der PDF
Der deterministische Nutzen Vnk besteht aus einer oder mehrerer beschreibender Variablen Xik mit den Faktoren bik und einer alternativenspezifischen Konstante ASCi, welche den durchschnittlichen Nutzen von Variablen berücksichtigt, die nicht im Modell enthalten sind:
Formel in der PDF
Logit-Modelle verlangen als Eingangsgrößen metrische Variablen. Da auch kategoriale Variablen im Modell untersucht werden sollen, müssen diese dummy-kodiert werden. Dies bedeutet, dass aus einer kategorialen Variabel mit n Kategorien n-1 Dummy-Variablen erzeugt werden, die nur die Werte 0 (trifft nicht zu) oder 1 (trifft zu) haben können. Als Referenzvariable wird dabei in den Modellen immer die Variablenausprägung mit den meisten Fällen genommen.
Die Schätzung der Modelle erfolgte mit Hilfe von „Biogeme“, einem Open Source Python-Paketes, welches die Schätzung von Modellparametern diskreter Wahlmodellen durch die Maximum-Likelihood-Methode erlaubt [23]. Mit der Maximum-Likelihood-Methode werden die Modellparameter iterativ ermittelt, bis die reale Wahlsituation sich möglichst gut durch das Modell abbilden lässt und ein maximaler Log-Likelihood-Wert erreicht wird [24]. Zur Lösung dieses iterativen Prozesses wird in Biogeme standardmäßig das Newtonverfahren verwendet. Als Ergebnis werden für das konvergierte Modell die Modellparameter sowie der finale Log-Like-lihood-Wert übermittelt [23].
4.3 Schätzung der Modellparameter
Aufgrund der Vielzahl an zu untersuchenden Variablen, die mehr oder weniger miteinander korrelieren, wurde der Einfluss der verschiedenen Merkmale auf die Verkehrsmoduswahl zunächst mit Einzelmodellen geschätzt, in dem die jeweilige Variable isoliert betrachtet wird. Im ersten Schritt wurden Parameterschätzungen mit den alternativenspezifischen Wegemerkmalen durchgeführt, da bei diesen zu erwarten war, dass diese bereits einen Großteil der Varianz erklären. Signifikante alternativenspezifische Variablen bilden anschließend das sogenannte Grundmodell. Aufbauend auf dem Grundmodell wurden dann die Merkmale der Urlaubsreise, des Haushaltes und der Person in Einzelmodellen hinzugefügt. Aus den signifikanten Variablen der Einzelmodelle wurde dann ein Gesamtmodell erstellt. Die Anpassungsgüte der Modelle wird mit dem korrigierten McFadden R2 bewertet. McFadden vertritt die Auffassung, dass Werte zwischen 0,2 und 0,4 eine ausgezeichnete Übereinstimmung darstellen [25].
4.3.1 Grundmodell der alternativenspezifischen Wegemerkmale
Die Modellschätzungen für die alternativenspezifischen Wegemerkmale Reisezeit, Entfernung und Anzahl der Umstiege erfolgte zunächst getrennt in einzelnen Modellen. Für die Reisezeit und Entfernung wurden zudem anfangs getrennte Faktoren für die beiden Wahlalternativen geschätzt.
Die Schätzung eines Modells, in dem ausschließlich die Reisezeiten enthalten sind, ergab, dass diese erwartungsgemäß hoch signifikant für die Verkehrsmoduswahl sind und die Modellgüte bereits durch diese eine Variable einen Wert von ̅R2 = 0,348 aufweist. Der Hypothesentest auf Gleichheit der beiden nach Verkehrsmodi getrennt geschätzten Faktoren weist einen robusten t-Wert von 0,49 auf. Da dieser Wert kleiner als 1,96 ist, kann die Hypothese, dass die beiden Faktoren gleich sind, nicht verworfen werden. Deswegen wurde ein weiteres Modell geschätzt, indem ein gemeinsamer Faktor für beide Verkehrsmodi genutzt wurde. Ein gemeinsamer Faktor bedeutet, dass wenn beide Verkehrsmodi dieselbe Reisezeit für einen Weg aufweisen, diese auch denselben negativen Nutzen generiert. Hieraus folgt, dass lediglich Reisezeitunterschiede zwischen den Verkehrsmodi eine Rolle spielen.
Ebenfalls hoch signifikant ist die Entfernung. Die nach Verkehrsmodi getrennt geschätzten Entfernungs-Parameter sind signifikant und im Gegensatz zur Reisezeit wird der Hypothesentest auf Gleichheit verworfen. Dies bedeutet, dass Anreisen mit gleicher Entfernung im MIV und SPV einen unterschiedlichen negativen Nutzen zwischen den beiden Alternativen aufweisen. Die Modellgüte liegt bei ̅R2 = 0,337.
Der Parameter für die mittlere Anzahl an Umstiegen im öffentlichen Verkehr wurde in einem eigenen Modell geschätzt. Es zeigt sich, dass – isoliert betrachtet – die Anzahl der Umstiege einen signifikanten Einfluss auf die Wahl des SPV aufweist: Je mehr Umstiege notwendig sind, umso geringer wird der Nutzen für den SPV. Die Modellgüte ist mit einem Wert von ̅R2 = 0,315 jedoch niedriger als bei Reisezeit und Entfernung.
Da alle geschätzten Parameter allein betrachtet signifikant sind, wurde ein Modell erstellt, welches Reisezeit, Umstiege und Entfernung zusammenführt. Da die Variablen stark untereinander korrelieren, ist es nicht verwunderlich, dass in einem gemeinsamen Modell mit der Reisezeit die Variablen Umstiege und Entfernung keinen signifikanten Einfluss aufweisen. Deswegen wird das Reisezeitmodell AS1b als Grundmodell für die weiteren Modellschätzungen verwendet (siehe Tabelle 1).
Tabelle 1: Modellergebnisse des Grundmodells
4.3.2 Fallspezifische Merkmale
Aufbauend auf dem Grundmodell wurden anschließend fallspezifische Variablen, die die Person, den Haushalt und die Urlaubsreise beschreiben, in die Modellschätzungen eingebunden.
Bei den Personenmerkmalen zeigte sich, dass Männer einen signifikant positiven Nutzen für die Wahl des MIV aufweisen. Das Alter der Personen wurde sowohl in linearer als auch in Form einer quadratischen Funktion in die Nutzenfunktionen des Modells eingebunden und erwies sich als signifikant. Dabei zeigte sich, dass die quadratische Form eine bessere Modellgüte erreicht. Diese quadratische Funktion hat ihren Scheitelpunkt bei einem Alter von 53,5 Jahren. Das bedeutet, dass Personen, die 53 oder 54 Jahre alt sind, den größten positiven Nutzen für die Alternative MIV besitzen. Bei jüngeren und älteren Personen sinkt der Nutzen, wodurch die Auswahlwahrscheinlichkeit für den SPV größer wird. Bei den Tätigkeiten der befragten Personen zeigte sich, dass allein Auszubildende und Studierende einen signifikanten Einfluss haben, und zwar für den SPV. Aufgrund des Hypothesentests aus Gleichheit wurden die beiden Gruppen zu einer zusammengefasst. Beim höchsten erlangten Bildungsabschluss der befragten Personen zeigten sich signifikante Faktorenwerte bei den Gruppen Fachhochschulreife und Realschulabschluss. Auch hier konnte die Hypothese, dass die beiden Faktoren gleich sind, nicht verworfen werden, weswegen beide Gruppen im Weiteren mit einem gemeinsamen Modellfaktor geschätzt wurden.
Unter den Haushaltsmerkmalen erwies sich das Merkmal Pkw-Besitz im Haushalt als hoch signifikant. Existiert bei einer Person kein Pkw im Haushalt, wird der Nutzenfunktion des SPV ein Wert von 2,7 addiert. Mit Berücksichtigung des Pkw-Besitzes im Haushalt steigt die Modellgüte deutlich von ̅R2 = 0,349 auf 0,441.
Bei der Analyse des monatlichen Haushaltsnettoeinkommens können aufgrund des höheren Item-Non-Response der entsprechenden Frage in der Befragung nur 73 % der befragten Personen im Modell betrachtet werden. Insgesamt drei Einkommensklassen erwiesen sich als signifikant: Einkommen unter 900 Euro, zwischen 900 und 1500 Euro sowie zwischen 5000 und 6000 Euro. Bei den beiden niedrigen Einkommensklassen zeigte sich beim Hypothekentest auf Gleichheit, dass die beiden Einkommensklassen zusammengefasst werden sollten. Der geschätzte Faktor für die Einkommensklasse unter 1500 Euro ist positiv, was bedeutet, dass Personen aus Haushalten mit niedrigem Einkommen eine höhere Wahrscheinlichkeit haben, den SPV zu wählen. Bei der Einkommensklasse 5000 bis 6000 Euro sieht dies anders aus. Aufgrund des negativen Faktors sinkt die Wahrscheinlichkeit den SPV zu wählen. Der Einfluss der Wohnorte der befragten Personen bzw. Haushalte wurden in Form der sogenannten zusammengefassten regionalstatischen Raumtypen (RegioStaR 7) untersucht. Dabei zeigte sich ein positiver Einfluss auf die Nutzenfunktion des SPV bei Befragten, die in einer Metropole, einer Regiopole bzw. Großstadt oder einer zentralen Stadt im ländlichen Raum wohnen. Die drei signifikanten Faktoren wurden auf Gleichheit hin überprüft. Die Hypothese, dass die Faktoren gleich sind, konnte nicht verworfen werden. Deswegen wurden alle drei Gruppen in Weiteren mit dem gleichen Faktor geschätzt.
Unter den Merkmalen der Urlaubsreise wurde zunächst die Zusammensetzung der Reisegruppe untersucht. Es zeigt sich, dass Alleinreisende einen signifikant höheren positiven Nutzen für den SPV aufweisen als Nicht-Alleinreisende. Zählen Kinder zur Reisegruppe, ergibt sich zudem ein signifikant positiver Nutzen für den MIV. In einem weiteren Modell wurden Nicht-Alleinreisende nach Gruppengröße untergliedert. Hierbei ergibt sich jedoch kein signifikanter Einfluss der Gruppengröße auf die Moduswahl. Des Weiteren wurde der Einfluss des Urlaubsgrundes auf die Moduswahl untersucht. Es zeigte sich, dass nur der Besuch von Freunden oder Familie einen signifikanten (positiven) Einfluss auf die Wahl des SPV besitzt. Bei Betrachtung der Aufenthaltsdauer zeigte sich, dass Tagesgäste einen signifikant positiven Einfluss auf die Wahl des MIV haben. Die weitere Untergliederung der Aufenthaltsdauer in Klassen zeigte keine weiteren signifikanten Faktoren.
Wieso dieser Unterschied zwischen den beiden Gruppen auftritt, kann nicht erklärt werden. Da Tagesausflüge nicht immer von zuhause gestartet werden müssen, sondern auch Teil einer mehrtägigen Urlaubsreise in der Region sein können, wurde dieser Einfluss auf das Wahlverhalten ebenfalls untersucht. Dabei zeigte sich, dass dies einen signifikant positiven Einfluss auf die Wahl des MIV hat.
4.3.3 Gesamtmodell
Sämtliche Variablen mit signifikanten Faktoren aus den Einzelmodellen wurden einem Gesamtmodell zusammengeführt. Durch Korrelationen der Variablen untereinander verlieren jedoch einige geschätzte Faktoren ihre Signifikanz. Beispielsweise besteht ein Zusammenhang zwischen dem Einkommen und dem Autobesitz. Haushalte mit niedrigem Einkommen besitzen weniger häufig einen Pkw. Individuell betrachtet sind beide Merkmale signifikant. In einem gemeinsamen Modell kann es jedoch vorkommen, dass eines der betrachteten Merkmale nicht mehr signifikant ist, weil das andere Merkmal den Zusammenhang besser abbilden kann. Dieser Sachverhalt trifft auf das Alter, den Tätigkeitsstatus der Studierenden oder Auszubildenden, den Urlaubsgrund „Besuch von Freunden oder Familie“ und den Status als Tagesgast zu. Beim Haushaltsnettoeinkommen zeigt sich, dass die Einkommensklasse „< 1500 €“ ihre Signifikanz verliert (p = 0,67). Die Klasse „5000 – 6000 €“ ist mit einem p-Wert von 0,048 ganz knapp unter dem Signifikanzniveau von p < 0,05 und damit gerade noch signifikant. Aufgrund der in den Einzelmodellen beobachteten Abweichungen hinsichtlich der Modellgüte bei Modellen mit und ohne Einkommen sowie den nicht oder nur sehr knapp signifikanten Faktoren, wird das Haushaltsnettoeinkommen im Weiteren nicht weiter betrachtet. In Modell G2a werden für sämtliche Variablen von Modell G1 abzüglich der Einkommensklassen Faktoren geschätzt. Auch hier zeigt sich, dass die bereits genannten Faktoren nicht signifikant sind. Deswegen wurde in Modell G2b ein lediglich die signifikanten Variablen betrachtet. Dieses Modell weist eine Modellgüte von ̅R2 = 0,49 auf. Die Modellergebnisse aller drei Modelle sind in Tabelle 2 und Tabelle 3 zusammengefasst. Anzumerken ist, dass bei der Schätzung alle fallspezifischen Variablen zunächst in die Nutzenfunktion des SPV eingehen. Negative Faktoren beim SPV ergeben einen positiven Einfluss auf die Nutzenfunktion des MIV.
Tabelle 2: Modellergebnisse des Gesamtmodells G1
4.3.4 Finales Modell für die Modellierung
Mit der Anzahl an Variablen steigt die Komplexität eines Modells und die Anforderungen an die Datenbasis. Deswegen wurde geprüft, inwiefern die Anzahl der Variablen reduziert werden kann, ohne die Modellgüte wesentlich zu verringern. Dabei konnte das Modell um die Variablen der Aufenthaltsdauer der Übernachtungsgäste sowie den höchsten Bildungsabschluss für Personen mit Fachhochschul- bzw. Realschulabschluss reduziert werden mit einem minimalen Verlust der Modellgüte von ̅R2 = 0,49 auf 0,485. Bei diesen Variablen zeigte sich in den Einzelmodellen, dass die trotz Signifikanz der geschätzten Faktoren nur eine geringe Steigerung der Modellgüte erreicht wird. Dies liegt vor allem daran, dass die den dummy-kodierten Variablen zugrundeliegenden Gruppen im Vergleich zur gesamten Stichprobe nur sehr klein sind (z. B. Übernachtungsgäste mit längeren Aufenthaltsdauern als sieben Tage). Ein ̅R2 -Wert von 0,485 deutet auf eine sehr große Anpassungsgüte des Modells hin und befindet sich deutlich oberhalb dem von McFadden (1977) [25] festgelegten Wertebereich von 0,2 bis 0,4 für eine ausgezeichnete Übereinstimmung. Die Modellergebnisse des finalen Modells sind in Tabelle 4 zusammengefasst. Zur besseren Verständlichkeit und Interpretierbarkeit werden im Folgenden sämtliche negativen fallspezifischen Faktoren vom SPV der Nutzenfunktion des MIV zugeschlagen.
4.4 Interpretation und Anwendung des finalen Modells
Wie bereits beschrieben, ist bei der Reisezeit der Unterschied zwischen MIV und SPV entscheidend. Stellt man das Modell um, sodass der Reisezeitunterschied tdiff = tSPV − tMIV in die Nutzenfunktion des SPV eingeht, ergibt sich dasselbe Modell mit denselben geschätzten Faktoren. Der Faktor für den Reisezeitenunterschied entspricht dementsprechend dem Faktor für die Reisezeit. Zur Interpretation des Einflusses der binären Variablen wurde in Tabelle 4Tabelle 5 der Nutzen dieser Variablen ins Verhältnis zur Reisezeitendifferenz gesetzt.
Tabelle 5: Äquivalenter Reisezeitenunterschied der binären Modellvariablen
Wendet man das Modell auf die beobachteten Eingangsdaten an und geht davon aus, dass der Verkehrsmodi gewählt wird, der eine Auswahlwahrscheinlichkeit größer 50 % besitzt, wird insgesamt bei 86,8 % aller Personen der Verkehrsmodi richtig bestimmt (siehe Tabelle 6). Zwischen den Verkehrsmodi unterschiedet sich die Quote richtiger Fälle jedoch deutlich. Während beim MIV 96,9 % aller Fälle richtig vorhergesagt wurden, sind dies beim SPV nur 42,3 %.
Tabelle 6: Klassifizierungstabelle für das finale Modell, Trennwert bei 50 %
Mit Hilfe des binominalen Logit-Modells lassen sich auf Basis der Nutzenfunktionen die Auswahlwahrscheinlichkeiten berechnen. Zur Demonstration wurde das Moduswahlmodell für zwei hypothetische Reisende angewandt. Diese beiden Reisenden stellen dabei mit den Eigenschaften ihrer Person, ihres Haushaltes und ihrer Reise jeweils entgegengesetzten 'Extremwerte' dar. Die Zusammensetzung der Nutzenfunktionen für die beiden Personen wird in Abbildung 1 und Abbildung 2 dargestellt. Die farbigen Balken stellen die positiven und negativen Nutzenkomponenten der Nutzenfunktionen von MIV und SPV dar. Der gestrichelte graue Balken ist der Gesamtnutzen, also die Summe aller einzelnen Nutzenkomponenten. Auf Basis des Gesamtnutzen wurden mit dem Logit-Modell die Auswahlwahrscheinlichkeiten berechnet. Person 1 (Abbildung 1) ist ein männlicher Urlauber aus Grafenau im Bayrischen Wald, der seinen mehrtägigen Urlaub in Nordhessen verbringt und von dort aus einen Tagesausflug nach Kassel unternommen hat.
Abbildung 1: Aufschlüsselung der Nutzenkomponenten und Auswahlwahrscheinlichkeiten der Verkehrsmodi für einen männlichen Urlauber aus Grafenau (Bayrischer Wald)
Abbildung 2: Aufschlüsselung der Nutzenkomponenten und Auswahlwahrscheinlichkeiten der Verkehrsmodi für eine allein reisende weibliche Urlauberin aus München
Person 2 ist eine weibliche Urlauberin aus München (Abbildung 2), die allein reist und in deren Haushalt kein Pkw vorhanden ist. Bei einer Anreise aus München ist der Schienenpersonenverkehr deutlich schneller im Vergleich zum Pkw (120 Minuten schneller). Anders sieht es bei der Anreise aus Grafenau aus. Hier zeigt sich, dass eine Anreise mit dem Zug deutlich langsamer ist (150 Minuten Differenz). Dementsprechend ergeben sich deutlich unterschiedliche Auswahlwahrscheinlichkeiten. Person 1 aus Grafenau wird mit einer Wahrscheinlichkeit von 99,81 % den MIV zur Anreise wählen. Person 2 wird dagegen mit einer Wahrscheinlichkeit von 98,4 % den SPV nutzen.
5 Fazit
Die vorgestellten Ergebnisse zeigen, welche Faktoren für Städtereisende mit fixiertem Zielort (Kassel) relevant sind. Dies ist besonders interessant, da die bestehende Forschung sich vor allem mit Fernreisen insgesamt beschäftigt.
Wie zu erwarten war, erweist sich die Reisezeit als wichtigster Faktor der Verkehrsmoduswahl von Städtereisenden. Hierbei ist interessant, dass diese für den MIV und den SPV gleich bewertet wird, weswegen lediglich Reisezeitunterschiede zwischen den Verkehrsmodi einen Einfluss haben. Zusammen mit der Variable Autobesitz im Haushalt ist bereits eine Modellschätzung möglich, die einen großen Teil der Varianz erklären kann. Die Modellgüte ist dabei nur unwesentlich geringer als beim Gesamtmodell G2b (mit allen signifikanten Faktoren), weist jedoch deutlich weniger erklärende Variablen auf. Dies erlaubt eine Nutzung des Modells in Modellsituationen, bei denen wenig Informationen über die Gäste vorhanden sind. Liegen bessere Daten vor, lässt sich mit dem finalen Modell die Modellgüte und damit die Vorhersagequalität erhöhen. Hierbei zeigte sich, dass das Geschlecht der reisenden Person, die Größe der Reisegruppe (alleinreisend oder in einer Gruppe), der Ausgangspunkt von Tagesausflügen sowie die Raumtypologie des Wohnortes die Modellqualität verbessern. Anders als in anderen Forschungsarbeiten, erwies sich das Haushaltseinkommen als weniger signifikant zur Erklärung der Moduswahl. Da das Einkommen jedoch mit anderen erklärenden Variablen korreliert, vor allem mit dem Autobesitz im Haushalt, ist dies nicht überraschend. Es ist zu erwarten, dass sich das Modell mit Berücksichtigung der Reisekosten noch einmal verbessern ließe. Aufgrund der Schwierigkeiten, die Kosten für Fahrkarten des Schienenpersonenverkehrs bei Revealed-Preference-Daten zu rekonstruieren, wären hierfür jedoch vermutlich andere Datenquellen erforderlich, z. B. Ergebnisse von Stated-Choice-Experimenten.
6 Literatur
[1] IPK International (2015): World Travel Trends Report 2015 / 2016. Online verfügbar unter: https://www.aptservizi.com/wp-content/uploads/2013/03/ITB_World_Travel_Trends_Re-port_2015_2016.pdfac
[2] IPK International (2020): World Travel Trends 2020. Online verfügbar unter: https://bw.tourismusnetzwerk.info/wp-content/uploads/2020/03/ITB_World_Travel_Trends_Report_2020.pdf
[3] Gao, Y., Liao, Y., Wang, D., Zou, Y. (2021): Relationship between urban tourism traffic and tourism land use: A case study of Xiamen Island. Journal of Transport and Land Use, 14, 1, 761–776, DOI: 10.5198/jtlu.2021.1799.
[4] Gühnemann, A., Kurzweil, A., Mailer, M. (2021): Tourism mobility and climate change - A review of the situation in Austria. Journal of Outdoor Recreation and Tourism, 34, 100382, DOI: 10.1016/j.jort.2021.100382.
[5] Arendt, M., Oswald, P. (2012): Schlussbericht - Gesamtverkehrsmodell Kanton Graubünden.
[6] Hofer, K., Haberl, M., Fellendorf, M. (2016): Travel Demand Modelling of Touristic Trips in the Province of Salzburg. Conference: European Transport Conference 2016.
[7] Gutiérrez, A., Miravet, D. (2016): The Determinants of Tourist Use of Public Transport at the Destination. Sustainability, 8, 9, 908, DOI: 10.3390/su8090908
[8] Bieland, D., Sommer, C., Witte, C. (2017): Uncommon leisure traffic – Analyses of travel behaviour of visitors. Transportation Research Procedia, 25, 3971–3984, DOI: 10.1016/j.trpro.2017.05.236
[9] González-Savignat, M. (2004): Competition in Air Transport. Journal of Transport Eco-nomics and Policy (JTEP), 38, 1.
[10] Creemers, L., Cools, M., Tormans, H., Lateur, P.-J., Janssens, D., Wets, G. (2012): Identifying the Determinants of Light Rail Mode Choice for Medium- and Long-Distance Trips. Transportation Research Record: Journal of the Transportation Research Board, 2275, 1, 30–38, DOI: 10.3141/2275-04
[11] Reichert, A., Holz-Rau, C. (2015): Mode use in long-distance travel. Journal of Transport and Land Use, 8, 2, DOI: 10.5198/jtlu.2015.576
[12] Limtanakool, N., Dijst, M., Schwanen, T. (2006): On The Participation In Medium‐ And Long‐Distance Travel: A Decomposition Analysis For The Uk And The Netherlands. Tijdschrift voor Economische en Sociale Geografie, 97, 4, 389–404, DOI: 10.1111/j.1467-9663.2006.00347.x
[13] Bursa, B., Mailer, M., Axhausen, K. W. (2022): Intra-destination travel behavior of alpine tourists: a literature review on choice determinants and the survey work. Transportation, DOI: 10.1007/s11116-022-10267-y.
[14] Harz, J., Sommer, C. (2022): Collection of Revealed Preference Mobility data of City Tourists – a Two-part Survey Design. 27th International Conference on Urban Development, REAL CORP 2022, DOI: 10.48494/REALCORP2022.7107.
[15] Bundesministerium für Wirtschaft und Energie (2014): Tagesreisen der Deutschen.
[16] Xia, C., Hu, Y., Chen, J. (2023): Community time-activity trajectory modeling based on Markov chain simulation and Dirichlet regression. Computers, Environment and Urban Systems, 100, 101933, DOI: 10.1016/j.compenvurbsys.2022.101933.
[17] Harz, J., Sommer, C. (2022): Mode choice of city tourists: Discrete choice modeling based on survey data from a major German city. Transportation Research Interdisciplinary Perspectives, 16, 100704, DOI: 10.1016/j.trip.2022.100704.
[18] Krämer, A., Jung, M., Wilger, G. (2014): Preisdifferenzierung und Erlösmanagement im Bahnferverkehr. ZEVrail, 138.
[19] here (2023): HERE Routing API 8. Develover Guide. Online verfügbar unter: https://deve-loper.here.com/documentation/routing-api/dev_guide/index.html.
[20] here(2023):HERE Public Transit API 8.DeveloverGuide.Online verfügbarunter:https://developer.here.com/documentation/public-transit/dev_guide/index.html.
[21] MobiData BW(2023): Fahrplandaten ÖPNV Baden-Württemberg.Online verfügbar unter:https://www.mobidata-bw.de/dataset/trias.
[22] Train, K. (2012): Discrete choice methods with simulation. Cambridge University Press,Cambridge, DOI:10.1017/CBO9780511805271.
[23] Bierlaire,M.(2020): A short introduction to PandasBiogeme.Technical reportTRANSP-OR 200605.
[24] Maier,G.,Weiss,P.(1990):Modelle diskreterEntscheidungen.Theorie und Anwendungin den Sozial-und Wirtschaftswissenschaften.Springer, Wien New York, N.Y, ISBN:3211821848.
[25] McFadden, D. (1977):Quantitative Methods for Analyzing Travel Behaviour ofIndividuals:Some Recent Developments.
|