FGSV-Nr. FGSV 002/106
Ort Stuttgart
Datum 02.04.2014
Titel Ermittlung der Überlastung an mehrstreifigen Signalzufahrten
Autoren Jürgen Mück, Vytautas Pranckus
Kategorien HEUREKA
Einleitung

Siemens ITS verwendet seit 2007 als Teil des modellbasierten Netzsteuerungsverfahrens Sitraffic Motion die Methode zur selbstkalibrierenden fahrstreifenweisen Schätzung von Staulängen vor Signalanlagen gemäß [1]. Erfahrungen in verschiedenen Projekten haben allerdings gezeigt, dass komplexere Geometrien von Knotenpunkt-Zufahrten eine nachteilige Auswirkung auf die Qualität der Zustandsschätzung haben können. Deshalb ist bei Siemens im Rahmen einer Masterarbeit ein neues Verfahren zur Schätzung der Überlastung unter Berücksichtigung der Mehrstreifigkeit entstanden [2]. Es wird hier vorgestellt und unter verschiedenen verkehrstechnischen Gesichtspunkten diskutiert. Anschließend werden einige Evaluierungsergebnisse vorgestellt. Sie bestätigen, dass das neue Verfahren grundsätzlich in der Lage ist, Überlastungen auch bei ungünstigen Zufahrtsgeometrien zu schätzen, zeigen aber auch Verbesserungsbedarf auf. Anregungen zu weiteren Untersuchungen werden im Ausblick gegeben .

PDF
Volltext

Der Fachvortrag zur Veranstaltung ist im Volltext verfügbar. Das PDF enthält alle Bilder und Formeln.

1 Einleitung

Modellbasierte Netzsteuerungen optimieren auf Basis ihrer Einschätzung der Verkehrssituation Umlaufzeiten, Freigabezeitverteilungen und Koordinierung der angeschlossenen Lichtsignalanlagen (LSA). Neben der Bestimmung der Verkehrsstärken ist für diese Einschätzung insbesondere die Ermittlung von Indikatoren für Überlastung von zentraler Bedeutung, um Freigabezeiten bestmöglich optimieren zu können.

Das in [1] beschriebene Verfahren schätzt die maximale Staulänge jedes Umlaufs2. Es wird dabei für jeden Fahrstreifen separat anwendet und verwendet als überlastungssensitives Kriterium die sogenannte Füllzeit. Diese ist definiert als Zeitdauer dt zwischen Beginn des Gesperrtzustands eines Signals und der darauffolgenden Dauerbelegung des stromaufwärtigen Bemessungsdetektors (Abbildung 1).

Abbildung 1: Die Füllzeit in Abhängigkeit vom Belastungszustand eines Fahrstreifens (aus der Präsentation zu [1])

Die Füllzeit wird in jedem Umlauf gegen eine konstante, nur von der Geometrie abhängige Schwelle dtO geprüft, so dass sich ein binärer Staukennwert o ergibt ([1], dort Gleichung (1)):

Formel (1) siehe PDF.

Der Staukennwert wird anschließend exponentiell geglättet und mit einem durch das Verfahren kalibrierten Faktor m multipliziert, der typischerweise etwa der Zahl der Fahrzeuge entspricht, die das zugeordnete Signal während 2-3 Umläufen passieren können. Der schätzbare Wertebereich für maximale Staulängen ergibt sich damit direkt zu L ∈ [0, m].

Kennzeichnend für dieses Verfahren ist die separate Betrachtung jeder Einzelspur3 ohne Berücksichtigung der Wechselwirkung mit Vorgängen auf benachbarten Spuren und an vorgelagerten Spurverzweigungen. Interessanterweise lag der Fokus auch in vergleichbaren Verfahren anderer Autoren, die während der Literaturrecherche analysiert wurden, nur auf der spurbezogenen Schätzung von Verkehrskenngrößen. Ein Überblick hierzu findet sich in [2]. Effekte aus Spuraufweitungen und benachbarten Spuren, die möglicherweise noch über verschiedene Signale bedient werden, spielen in den gesichteten Quellen keine verfahrensrelevante Rolle4. Auch aus der Praxis sind den Autoren der vorliegenden Arbeit keine entsprechenden Verfahren bekannt.

Kurze Fahrspuren und damit Spurverzweigungen vor Signalanlagen sind andererseits sehr häufig anzutreffen, um beispielsweise abbiegende Ströme, die wartepflichtig sind, zur Vermeidung von Rückwirkungen auf andere Ströme auszufädeln, oder um bei kurzen Freigabedauern die Kapazität von Zufahrten deutlich zu erhöhen. Dem Verkehrsplaner ist vertraut, dass kurze Fahrstreifen Auswirkungen auf die für die Bemessung festzulegenden Zeitlücken-Grenzwerte von Detektoren haben [4].

An Abbildung 2 kann die grundsätzliche Wirkung von Verzweigungspunkten in LSA-Zufahrten auf nachfolgend angeordnete Detektoren verdeutlicht werden. Exemplarisch sind zwei Fahrstreifen dargestellt, die über ein gemeinsames Signal gesteuert werden, aber im weiteren Fahrtverlauf teilweise verschiedene Fahrtrichtungen aufweisen. In erster Näherung spielt es für die vorliegende Betrachtung keine Rolle, ob eine der Fahrspuren durchgehend geführt wird und die zweite neu beginnt, oder ob beide Fahrstreifen nach der Aufweitung gleichrangig entstehen, entscheidend ist die Aufteilung der (fließenden oder stehenden) Fahrzeuge am Entscheidungspunkt.

Abbildung 2: Typische Spurbelegungen durch Verzweigungspunkte (aus [2], S. 34)

Diese Aufteilung wechselt typischerweise nicht nur über den Tag, sondern kann sich sehr stark von Umlauf zu Umlauf ändern, insbesondere bei den Auffüllvorgängen während der Gesperrt-Zeiten. Eine wichtige – und oft nicht vorhersehbare – Rolle spielen dabei Abwägungsprozesse der die Fahrzeuge Führenden mit Blick auf den jeweils erwarteten Nutzen. Je nach Verkehrsführung wird dieser Prozess natürlich auch durch die Richtungswünsche der Verkehrsteilnehmer bestimmt; dann ist die Aufteilung unter Umständen bereits daraus festgelegt, aber dennoch über den Tag veränderlich.

Überfährt ein Fahrzeugstrom mit einer gewissen Dichte den Verzweigungspunkt, teilen sich die Fahrzeuge auf zwei oder mehrere Fahrspuren auf, und die Dichten hinter dem Verzweigungspunkt sind entsprechend reduziert. Relevant für die Messsignale der lokalen Detektoren sind die daraus entstehenden Zeitlücken. Deren Dauern können bei freiem Fluss durchaus ein Mehrfaches der Zeitlücken vor der Aufzweigung betragen.

Entscheidend für die Ermittlung von Indikatoren für die Überlastung ist allerdings auch das Verhalten der Fahrzeuge während des Aufstellvorgangs nach Freigabeende: Eine wesentliche Quelle von Informationen für Schätzverfahren ist der Verlauf der Messsignale ab diesem Zeitpunkt bis zu einer eventuellen Dauerbelegung auf dem Detektor. Der hier relevante Staulängenschätzer nach [1] verwendet beispielsweise eben genau diese Dauer als einzige überlastungssensitive Kenngröße.

Abhängig von der unter Umständen hochdynamischen Aufteilung der Ströme können diese Füllzeiten selbst bei Überlastung massiv schwanken, sie sind allerdings nicht kürzer als im einstreifigen Verkehrsfluss. Je nach Dynamik können die Fahrzeuge verstärkt auf der einen oder auf der anderen Spur zurückstauen; oder der Rückstau einer Spur verhindert gar das Befüllen des zweiten Fahrstreifens, obwohl auch für die darauf erreichbaren Ziele eine hohe Nachfrage vorliegen kann.

Spätestens in Verbindung mit anderen kritischen Randbedingungen, etwa sehr langen Umlaufzeiten (z.B. 140s) oder Freigabedauern (etwa über 100s), besteht nach unserer Erfahrung beim Staulängenschätzer nach [1] das Risiko, dass sich kurze Fahrstreifen in LSA-Zufahrten soweit auf die Qualität der Ergebnisse der Schätzung auswirken, dass im Einzelfall geprüft werden muss, ob diese noch für die Optimierung der Freigabezeiten verwendet werden können.

Aus dieser Situation heraus begann die Entwicklung des in diesem Paper dargestellten Verfahrens. Es konzentriert sich auf die Schätzung eines binären Überlastungs-Indikators, etwa entsprechend dem oben erwähnten Staukennwert, allerdings unter der Maßgabe einer höheren Genauigkeit und angemessener Robustheit auch bei komplexeren Spurgeometrien in Zufahrten. Gegenstand des Kapitels 2 ist die Beschreibung dieses Verfahrens in der aktuellen Ausprägung. Nach der Darstellung des Gesamtablaufs werden dort einzelne algorithmische Schritte näher erläutert und diskutiert.

Kapitel 3 widmet sich den bisher erfolgten Tätigkeiten und Ergebnissen zur Evaluierung des neuen Verfahrens. Obwohl das Schätzergebnis als binäre Größe eine einfache Evaluierung erwarten lässt, ist es notwendig, zuerst bestimmte Aspekte der Methodik näher zu erläutern. Im zweiten Teil dieses Kapitels werden wichtige Ergebnisse der genannten Masterarbeit präsentiert, anschließend erfolgt die vertiefte Bewertung eines Bausteins des neuen Algorithmus.

Der Artikel schließt mit einem Ausblick. Da das Verfahren noch recht „jung“ ist, enthält er im wesentlichen Fragen, die die anstehenden nächsten Schritte prägen werden.

2 Schätzung der Überlastung mit Bemessungsdetektoren

2.1 Anforderungen an das neue Verfahren

Wesentlich für das zu entwickelnde Verfahren war eine möglichst große Zuverlässigkeit bereits bei der Einzelschätzung je Umlauf, ohne Unschärfen durch Glättung in Kauf nehmen zu müssen5. Um die Aufgabe innerhalb der gegebenen Bearbeitungszeit lösbar zu halten, wurde im Gegenzug darauf verzichtet, einen kontinuierlichen Ausgabewert (etwa eine Staulänge) zu schätzen. Fokusiert wurde auf die Schätzung eines ja/nein-Indikators für Überlastung (zur Definition der Überlastung und Bestimmung von Referenzwerten für die Evaluierung siehe Kapitel 3), mit der Option, das Verfahren im Erfolgsfall zu erweitern, um auch einen kontinuierlichen Indikator für die Überlastungssituation zu schätzen. Bei den Arbeiten wurde durchgehend von Zeitlücken-Bemessungsdetektoren, wie sie die RiLSA [4] definiert, ausgangen, realisiert als Induktionsschleifen.

Wesentliche Einzelanforderungen waren:

•  Berücksichtigung der aus Spuraufweitungen entstehenden geringeren stromabwärtigen Dichten bei der Anwendung eines Füllzeit-Kriteriums

•  Kompensation fehlender Belegt-Zustände (und damit nicht gemessener kurzer Füllzeiten) bei „Lücken“ auf dem Detektor während der Gesperrtzeiten

•  Auswertung weiterer Charakteristika des Verkehrsflusses zur Verbesserung der Schätzergebnisse

Der nachfolgende Abschnitt fasst den Zwischenstand des Verfahrens, wie er durch [2] erarbeitet wurde, zusammen.

2.2  Ablauf des Verfahrens

Die Bearbeitungsschritte des Verfahrens für einen Umlauf werden anhand Abbildung 3 skizziert, ausgewählte Elemente werden in den Folgeabschnitten näher erläutert.

Abbildung 3: Ablauf des Verfahrens für jede Fahrspur

Die Berechnung erfolgt wie bei [1] für jeden Fahrstreifen separat, allerdings werden Detektor- und Signaldaten der direkten Nachbarfahrstreifen in verschiedene der Berechnungsschritte einbezogen.

•  Eingangsdaten (1):
Zur Verfügung stehen dem Verfahren die Signal- und Detektordaten der eigenen (zu schätzenden) Spur sowie der direkten Nachbarspuren. Die Daten liegen als „Rohdaten“, d.h. zeitlich aufgelöst als Zustandsänderungen (für Signalfreigabe bzw. Belegung) vor.

•  Korrektur fehlender Dauerbelegung (2):
Es wird geprüft, ob der Detektor trotz Rückstau während der Gesperrtzeit ohne (Dauer-) Belegung bleibt, weil die stehenden Fahrzeuge eine Lücke über dem Detektor bilden. Istdas verschiedenen Kriterien entsprechend der Fall, wird durch Modifikation der Messdaten künstlich eine Dauerbelegung nachgebildet (siehe dazu Abschnitt 2.3.1).

•  Berechnung der Überlastungsindikatoren (3):
Wie in [1] wird auch hier die Füllzeit gegen eine Schwelle geprüft, um einen Staukennwert zu erhalten. Sind die Nachbarspuren nicht relevant oder nicht vorhanden, ergibt sich das in Gleichung (1) formulierte Verhalten. Nachbarspuren werden bei Bedarf allerdings durch einen dynamisch verlängerten Grenzwert für die Füllzeit berücksichtigt, dazu mehr in Abschnitt 2.3.2.
Die Analyse einer Reihe von Videoaufnahmen aus [5] hat zur Entwicklung eines zweiten Überlast-Kriteriums geführt, das alternativ erfüllt sein kann. Es wird geprüft, ob eine gewisse, der Kapazität der jeweiligen Grünzeit entsprechende Zahl an Fahrzeugen innerhalb kurzer Zeit nach Grünbeginn vom Detektor erfasst wurde („dichter Pulk“), was ebenfalls als „Überlastung“ gewertet wird.

•  Prüfung der Überlastungsindikatoren (4), (5):
Wenn keiner der Indikatoren erfüllt ist, ist die Berechnung abgeschlossen (5). Das Schätzergebnis für diesen Umlauf lautet „nicht überlastet“.
Wenn mindestens ein Kriterium erfüllt ist, erfolgen weitere, gegengerichtete Prüfungen:

•  Berechnung der Ausschluss-Kriterien (6) und Prüfung (7):
Im aktuellen Verfahren wird über vier aus Experimenten heuristisch ermittelte Kriterien geprüft, ob die Überlastung überhaupt plausibel ist. Eines davon wird in Abschnitt 2.3.3 näher beschrieben. Trifft mindestens eines dieser vier Kriterien zu, hat dieses Vorrang gegenüber einer (vorläufig) erkannten Überlastung in (3)6.
Ist keines der Kriterien für Überlast (3) oder Ausschluss (6) erfüllt, gilt ebenfalls „Nicht-Überlast“ als Ergebnis.

2.3  Einzelne Bausteine

Neben der Beschränkung auf die Bestimmung der Überlast statt der Schätzung von Staulängen bestehen einige verfahrenstechnische Unterschiede zu [1]. Die wesentlichen werden nachfolgend dargestellt und – soweit in diesem Rahmen möglich – diskutiert.

2.3.1 Nachbildung fehlender Dauerbelegung bei Gesperrt

Je nach Geometrie kann ein Bemessungsdetektor aufgrund seiner aufgabenbedingten7 kurzen Ausdehnung in Fahrtrichtung während der Rotzeit trotz zurückstauender Fahrzeuge ohne Dauerbelegung bleiben, wenn sich über ihm zufällig eine Lücke zwischen Fahrzeugen einstellt. Bei [1] ist das implizit durch den Kalibrierprozess des bereits erwähnten Faktors berücksichtigt, der vom geglätteten Staukennwert auf die maximale Staulänge führt. Es gibt vereinzelt Beobachtungen, die nahelegen, dass (im Sinne einer gewissen „Elastizität“) die Wahrscheinlichkeit für diese Lücken mit hohen Staulängen sinkt und so die „Sichtbarkeit“ des Verfahrens stromaufwärts vergrößert.

Die im Abschnitt 2.1 beschriebenen Erwartungen an das neue Verfahren erfordern allerdings eine „Korrektur“ solcher fehlenden Dauerbelegungen, da das Verfahren möglichst ohne stochastische Anteile (und damit Glättungen über Einzelschätzungen hinweg) bleiben soll.

Die Korrektur basiert auf einfachen Regeln:

•  Werden während kurzer Zeit nach Beginn des Gesperrtzustands genügend Fahrzeuge gezählt, um den Stauraum zwischen Haltlinie und Detektor zu füllen, bleibt aber der Detektor ohne Dauerbelegung, wird die fallende Flanke des zuletzt erfassten Fahrzeugs künstlich bis kurz vor der steigenden Flanke des nächsten erfassten Fahrzeugs verzögert, um eine fiktive Dauerbelegung zu erhalten.

•  Ist der Stauraum durch kurz nach Grünende eingezählte Fahrzeuge nicht vollständig gefüllt, tritt aber dann die nächste Belegung innerhalb kurzer, vom Detektorabstand abhängigen Zeit nach Freigabebeginn (also nicht schon während des Gesperrt-Zustands) ein, so wird die Ankunft dieses auslösenden Fahrzeug auf dem Detektor virtuell zeitlich vorgezogen, um eine Dauerbelegung zu bewirken.

2.3.2  Dynamische Schwelle für die Berechnung des Staukennwerts

In der Einleitung wurde das Problem erläutert, dass das Ausfädeln von Fahrzeugen stromaufwärts von Detektoren zu reduzierten Dichten des betrachteten Fahrstreifens führt und mit den entstehenden verlängerten Füllzeiten den Mechanismus des Staukennwerts konterkariert. Frühere Versuche, den Schwellwert dtO für Gleichung (1) in diesen Fällen über einen planerisch festzulegenden (Relaxations-) Faktor zu erhöhen, scheiterten am Kalibrieraufwand und an typischerweise sehr volatilen Aufteilungsraten der Ströme an Verzweigungspunkten kurz vor Signalanlagen.

Die gefundene Lösung bestand schließlich darin, den Grenzwert dtO für die gemessene Füllzeit mit einer zusätzlichen Dauer zu beaufschlagen, die sich aus Messungen auf den benachbarten Spuren ergab:

Formel (2a und 2b) siehe PDF.

Dabei werden die Fahrzeuge ni der direkt benachbarten Spuren i gezählt und summiert, die während der Messung der Füllzeit (des betrachteten Detektors) durch die Detektoren ihrer Spuren erfasst werden. Für jedes erfasste Fahrzeug wird die Schwelle um einen festen Betrag erhöht (gute Erfahrungen liegen mit einem Aufschlag von 3s vor).

Damit ergibt sich wie in [1] ein Staukennwert, der als Indikator weiterverwendet werden kann.

2.3.3 Ausschlusskriterien

Die Parametrierung einer Schwelle dtO, gegen die die Füllzeit für die Bestimmung des Staukennwerts geprüft wird, bleibt auch mit der oben beschriebenen Ergänzung schwierig. Insbesondere die damit durchzuführende Unterscheidung von kurzen Füllzeiten, wie sie aus Überlastung entstehen, gegen solche, die aus einer schlechten Koordinierung (ein dichter Pulk wird durch Freigabe-Ende getrennt) resultieren, ist für die Ergebnisgüte  jeder Schätzung wesentlich. Ein wesentlicher Anteil der Anstrengungen zur Identifikation optimaler Parameter für das Verfahren zur Staulängenschätzung zielte darauf, solche Situationen zumindest statistisch richtig durch die geeignete Wahl der Füllzeitschwelle unterscheiden zu können [6].

Die Parametrierung der Füllzeitschwelle dtO und des neuen Faktors f erfordert selbstverständlich weiterhin Sorgfalt. Zudem steigt mit der erhöhten Sensitivät des Staukennwerts aus den beschriebenen Kriterien die Wahrscheinlichkeit für Fehlerkennung von Überlastung (false positive-Einschätzung).

Hier bestand der neue Ansatz darin, ergänzende „gegenspielende“ Prüfungen anhand der vorliegenden Rohdaten durchzuführen, um sicherzugehen, dass tatsächlich Überlastung vorliegt. Im Moment werden vier verschiedene Plausibilitätsprüfungen durchgeführt, die jede für sich nur anschlägt, wenn mit einiger Sicherheit keine Überlastung vorliegt.

Beispielhaft wird hier das „Fast Vehicle Check“ (Abschnitt 3.5.2 in [2]) skizziert:

Die ersten Fahrzeuge, die sich während der Rotzeit aufgestellt haben, müssen im Falle einer Überlastung zu Grünbeginn anfahren und beschleunigen, weisen also verhältnismäßig lange Belegungsdauern auf. Umgekehrt können also wegen Überlastung aufgestellte Fahrzeuge im Sinne einer Plausibilitätsprüfung ausgeschlossen werden, wenn unter diesen ersten Fahrzeugen schnell fahrende Fahrzeuge vorhanden sind. Diese lassen sich über ihre Belegungsdauern identifizieren.

Jedes der vier Kriterien sollte für sich hinreichend für fehlende Überlastung sein, aber es kann natürlich nicht ausgeschlossen werden – da heuristisch erarbeitet –, dass nicht alle Fälle freien Verkehrsflusses abgedeckt sind. Grundsätzlich stellt der Ansatz allerdings sicher, dass ein Teil der „False Positive“-Einschätzungen für Überlastung korrigiert werden.

2.3.4  Zusammenfassung

Zusammenfassend ergeben sich damit die folgenden wesentlichen Unterschiede des aktuellen Verfahrens zu [1]:

•  Fokus auf Ermittlung der Überlastung (binär) statt der Staulängen (kontinuierliche Werte)

•  Messwert-„Korrektur“ zur Nachbildung von Dauerbelegung während Gesperrtzeiten

•  Erhöhung der Wahrscheinlichkeit zur Erkennung von Überlast durch Erweiterung der bisherigen Füllzeit-Prüfung um die Berücksichtigung von Nachbarspuren sowie durch Einführung eines weiteren, alternativen Überlast-Kriteriums zum Pulkverhalten

•    Ergänzen von Plausibilitätsprüfungen als „Gegenspieler“, mit denen Überlast ausgeschlossen werden kann.

Insbesondere die Ergänzung von Plausibilitätsprüfungen, die (zu empfindsam erkannte) Überlast wieder „stornieren“, scheint nach detaillierter Sichtung der Messdaten gleichzeitig eine Erhöhung der Sensitivität des Verfahrens und eine größere Robustheit der Ergebnisse möglich.

Letztlich zählen allerdings nicht Annahmen und Einzelbeobachtungen, sondern die Prüfung von Ergebnissen des Verfahrens durch geeignete Evaluierungen. Den aktuellen Stand der Evaluierungstätigkeiten beschreibt das nächste Kapitel.

3 Bisherige Evaluierungsergebnisse

3.1 Methodik

3.1.1 Eingangsdaten

Die vorliegende Version des Verfahrens wurde nach der Realisierung anhand von 10 Fahrstreifen verschiedener geometrischer Ausprägungen und Signalisierungen mit Realdaten evaluiert. Verwendet wurden als Referenzdaten über Videoaufzeichnungen ermittelte Staulängen aus [5], die Eingangsdaten für das Verfahren wurden dem Verkehrsrechner-System entnommen.

Zusätzlich wurden verschiedene vorliegende VISSIM-Simulationsprojekte mit Regelbereichen typischer deutscher Städte (Gelsenkirchen und Münster) zur Abdeckung weiterer geometrischer und verkehrlicher Situationen für die Evaluierung herangezogen. Eine möglichst große Zahl relevanter simulierter Signalzufahrten wurden für die Evaluierung ausgewählt in der Absicht, mit den im Projekt zur Verfügung stehenden Ressourcen durch eine weite Streuung an verkehrlichen und geometrischen Bedingungen möglichst viele in der Praxis relevante Fälle auszuwerten. Für die Gelsenkirchen-Simulation wurde außerdem die Start-Zufallszahl (Random Seed) variiert.

Auch aus den Simulationsdaten mussten als Zwischenschritt Referenz-Staulängen ermittelt werden. Aufgrund der teilweise komplexen Modellierung der Netze wurde hierfür ein eigenes Skript entwickelt, das die Zahl der aufgestellten Fahrzeuge zu jedem Freigabebeginn der entsprechenden Signale aus den Trajektorien ermittelte und den Fahrspuren / Detektoren zuordnete.

3.1.2 Aufbereitung der Referenzdaten

Das Verfahren liefert im Gegensatz zu den Staulängen aus [1] keine direkt auch als Referenz messbare Größe. Die vorliegenden Referenzdaten (Staulängen zu Freigabebeginn) mussten also für die Evaluierung erst konvertiert werden. Um zukünftig bei einem weiterentwickelten Schätzverfahren auch Schätzergebnisse anderer Natur, beispielsweise verschiedene Grade von Überlastung, evaluieren zu können, wurde die Entscheidung getroffen, auch die Bestimmung der Soll- oder Referenzgrößen für die Evaluierung in den Versuchsaufbau aufzunehmen. Abbildung 4 zeigt das Konzept des Referenz-Konverters, wie er für die Untersuchungen verwendet wurde.

Abbildung 4: Konzept des "Referenz-Konverters" und Ablauf des Evaluierungs-Vorgangs

Wenn auch auf den ersten Blick eine eher realisierungs- oder softwaretechnische Betrachtung, zeigt die Abbildung doch auf, dass der Evaluierungsvorgang eines Verfahrens neben dem eigentlichen – zu bewertenden – Schätzvorgang des Algorithmus (3) aus zwei weiteren Blöcken besteht, nämlich der Ermittlung der Soll-Größen (5) und der eigentlichen Bewertung (7). Die Ansätze für diese beiden Schritte liegen nicht immer automatisch auf der Hand.

Für das vorliegende Verfahren bestand die Aufgabe, aus den gemessenen Referenz-Staulängen zu Freigabebeginn auf den (Referenz-) Überlastungszustand der LSA zu schließen.
Als „Überlastet“ wird ein Umlauf in den bisher durchgeführten Evaluierungen bezeichnet, wenn die Zahl der zu Freigabebeginn aufgestellten Fahrzeuge größer ist als die Zahl der Fahrzeuge, die ab diesem Zeitpunkt bis zum nächsten Freigabebeginn die Haltlinie passieren. Überlastet ist dann der Signalumlauf, der durch dieses Intervall festgelegt ist. Die Zahl der passierenden Fahrzeuge wird durch die Erfassung der steigenden Flanken des Detektors während dieses Intervalls bestimmt.

Das mag trivial erscheinen, enthält aber bei exakter (mikroskopischer) Betrachtung tatsächlich eine Ungenauigkeit: Die auf dem Detektor zwischen den Beginn-Zeitpunkten der Freigaben erfassten Fahrzeuge sind nur teilweise die Fahrzeuge, die im bezeichneten Intervall die Haltlinie überfahren (wie es die Definition vorgibt). Zu Beginn der Freigabe wird die Haltlinie erst von Fahrzeugen überfahren, die vor dem Detektor aufgestellt waren und die nicht in die Berechnung einbezogen sind, dafür werden während der anschließenden Gesperrtzeit Fahrzeuge erfasst und zur Bestimmung der Referenzgröße des Umlaufs (des Überlastungs-Status) verwendet, die die Haltlinie erst im nächsten Evaluierungsintervall passieren.

Fehler können entsprechend durch unterschiedliche Fahrzeuglängen sowie durch Zu- und Abflussvorgänge zwischen Haltlinie und Bemessungsdetektor entstehen. Die erste Fehlerart mittelt sich über die Umläufe, die zweite ist bei den typischen Abständen von Bemessungsdetektoren zur Haltlinie in der Regel meist nicht relevant. Aus pragmatischen Gründen wird die beschriebene Ungenauigkeit deshalb toleriert.

Die eigentliche Evaluierung bzw. statistische Bewertung (7) besteht aufgrund der binären Soll- und Ist-Größen naheliegenderweise aus einer statistischen Aufbereitung des Anteils der False Positive- und False Negative-Schätzungen der ausgewerteten Umläufe. Allerdings entstehen auch hier methodisch ungünstige Randbedingungen, wenn beim Vergleich der beiden hier betrachteten Verfahren [1] und [2] eine kontinuierliche mit einer binären Ergebnisgröße verglichen werden muss. Dazu mehr in Abschnitt 3.2.1

3.2 Überblick über erste Evaluierungsergebnisse

In der grundlegenden Arbeit zum hier vorgestellten Verfahren finden sich erste Auswertungen zu verschiedenen Gesichtspunkten. Hier präsentiert Abschnitt 3.2.1 ausgewählte Ergebnisse aus [2], anschließend versucht Abschnitt 3.2.2, den Genauigkeitsgewinn statistisch zu bewerten, der durch die Ergänzung der Stauindikatoren um „gegenspielende“ Plausibilitätsprüfungen des freien Verkehrsflusses entsteht.

3.2.1 Grundlegende Evaluierungsergebnisse

Der naheliegende erste Evaluierungsschritt ist der Vergleich des hier vorgestellten Verfahrens zur Ermittlung der Überlastung mit Ergebnissen des Staulängenschätzers [1], der den Ausgangspunkt der vorliegenden Arbeiten gebildet hat. Dieser Schritt dient im wesentlichen der Kontrolle, ob das neue Verfahren grundsätzlich geeignet ist, Aussagen über den Verkehrszustand zu schätzen.

Um den Vergleich durchführen zu können, müssen die Ergebnisse der Staulängenschätzung vorab in eine binäre Schätzung „zurückgerechnet“ werden, ob für einen Umlauf jeweils Überlastung vorlag oder nicht. Die Umwandlung wurde aus den geschätzten Staulängen entsprechend dem Vorgehen für den Referenz-Konverter (Abschnitt 3.1.2) durchgeführt.

Aus verschiedenen Gründen bedeutet dies eine Qualitätsverringerung gegenüber den ursprünglich geschätzten Staulängen8 von [1], konnte aber aus methodischen Gründen nicht umgangen werden. Die konkreten statistischen Ergebnisse in der nachfolgenden Tabelle 1 müssen unter diesem Vorbehalt bewertet werden.

Ein weiterer allgemeiner Vorbehalt gilt der Repräsentativität der Aussagen. Es wurde versucht, innerhalb der zur Verfügung stehenden Projektlaufzeit möglichst großen Nutzen aus vorliegenden Simulations- und Realdaten zu ziehen, allerdings stehen umfassendere Evaluierungen (mit einem weiterentwickelten Verfahren), bei denen die Auswahl der Eingangsdaten nach repräsentativen Kriterien erfolgt, aus. Insbesondere ist für die Aussagekraft auch die Verteilung bzw. Häufigkeit von Überlastzuständen relevant, da beispielsweise nur bei Überlast „False Negative“-Fehler auftreten können.

Tabelle 1: Gesamtbewertung des hier vorgestellten Verfahrens [2] im Vergleich zu einem modifizierten Verfahren nach [1]

Die Tabelle zeigt die Ergebnisse aus der Daten zweier simulierter Testfelder (mit je 27 bzw. 42 Detektoren / Fahrstreifen) sowie aus Daten von 10 Detektoren / Fahrstreifen drei realer Knotenpunkte, wo über Videoaufnahmen Staulängen gemessen wurden. „[1]*“ steht für den Staulängenschätzer mit der oben beschriebenen Modifikation, „[2]“ ist das hier vorgestellte neue Verfahren.

Beide Verfahren zeigen in den simulierten Fällen über alle Detektoren im Mittel einen Anteil von 8% bis 14% der Umläufe, in denen der Überlastungszustand fehlerhaft geschätzt wurde. Deutlich erkennbar liegen bei beiden Verfahren dabei häufiger Fehlalarme (vermeintliche Überlast) als nicht erkannte Überlast-Zustände vor.

Spannend ist das Ergebnis der Realdaten bei [1]*. Dort stechen die 28% unerkannten Überlastungen über die zehn Fahrstreifen hervor. Die Analyse der Detaildaten zeigt, dass auf fünf der zehn Spuren lang anhaltende Überlastzustände in bis zu 70% der Umläufe nicht erkannt wurden. Bei sechs der zehn Spuren, die im Test alle paarweise angeordnet sind, ist jeweils eine der beiden Spuren nur ca. 100m lang, Detektorabstände zur Haltlinie sind 40m bzw. 50m. Auf mindestens je einer dieser Fahrstreifen zeigen sich bis zwischen 25% und 70% False Negative-Werte, was faktisch bedeutet, dass die während der Aufzeichnungen massiv vorhandenen Überlastungen aufgrund der Effekte der Spuraufweitung auf die Füllzeiten vom Verfahren [1] in seiner hier beschriebenen Erweiterung (Berechnung des Überlast-Status) nicht erkannt wurden9.

Das neu entwickelte Verfahren weist bei der Auswertung von Realdaten lediglich auf einer Spur große False Negative-Fehler (nicht erkannte Überlastung) auf. Vermutlich besteht dort ein Zusammenhang mit dem kurzen Abstand zwischen Detektor und Haltlinie, das ist Gegenstand zukünftiger Untersuchungen. Alle anderen Zufahrten weisen einen False Negative-Fehler im Bereich von 0 bis maximal 16% (Mittelwert 6%) auf.

Auch wenn die Evaluierung als vorläufig bezeichnet werden muss, kann daraus doch gefolgert werden, dass das Konzept der dynamischen Füllzeitschwelle (Abschnitt 2.3.2) erhöhte Füllzeiten wegen der Aufteilung von Fahrzeugströmen vor Knotenpunkten gut kompensiert.

In [2] finden sich weitere Analysen, die im Rahmen der Masterarbeit erstellt werden konnten.

3.2.2 Abschätzung des Nutzens gegenspielender Indikatoren

Ein wesentlicher Entwurfsschritt bei der Entwicklung des neuen Verfahrens war die Ergänzung von Ausschlusskriterien, die vorläufige Einschätzungen als „überlastet“ wieder aufheben (Verfahrensschritte (6)/(7) in Abbildung 3). Die Zusammenhänge lassen sich mit Mitteln der Wahrscheinlichkeitsrechnung formalisieren und interpretieren.

Da hier binäre Kenngrößen betrachtet werden, können die Wahrscheinlicheiten p für Fehlerkonstellationen einfach über bedingte Wahrscheinlichkeiten beschrieben werden:

Tabelle 2: Allgemeine Wahrscheinlichkeiten für die Fehlerarten

Dabei steht E (Estimation) für das Ergebnis der Schätzung und T (Truth) für den tatsächlichen Zustand. Die möglichen Zustände sind OS (Oversaturation) für Überlastung und US (Undersaturation) für fehlende Überlastung.

Für das vollständige Verfahren ergibt sich ein „Überlastet“ als Schätzergebnis, wenn über den Schritt (3) in Abbildung 3 eine Überlastung erkannt und nicht wieder über die Plausibilitätsprüfung ausgeschlossen wurde. „Nicht überlastet“ als Schätzergebnis kann sich aus nicht vorhandener Überlastung gemäß Schritt (3) oder als erkannter freier Fluss – also Schritt (6) – ergeben:

Formel (3a) siehe PDF.

EOS und EUS bilden in den Formeln die Berechnungen gemäß Schritten (3) und (6) ab.

Wird auf die Prüfung von freiem Verkehrsfluss verzichtet, vereinfacht sich die Formulierung:

Formel (3b) siehe PDF.

mit E ̃als Ergebnis der vereinfachten Schätzung.

Die nachfolgende Tabelle wiederholt Tabelle 2 mit eingesetzten Gleichungen (3a) und (3b):

Tabelle 3: Wahrscheinlicheiten für Fehler mit und ohne Plausibilitätsprüfung

Da die Einzelwahrscheinlichkeiten nicht unabhängig voneinander sind, lassen sich die Terme nicht weiter auflösen. Dennoch lässt sich die Auswirkung der „Gegenprüfung“ oder Plausibilisierung durch Vergleich der Terme leicht ableiten, wenn die Parameter der einzelnen Berechnungsschritte unverändert bleiben. Die Auswirkung entspricht der Erwartung, die man an Plausibilitätsprüfungen hat:

• Die Wahrscheinlichkeit für False Positive-Schätzungen sinkt, da erschwerend neben einer Einschätzung des Zustands als Überlastung gleichzeitig auch (i.S.v. logisch „und“) erfüllt sein muss, dass die Plausibilitätsprüfung den Zustand nicht auf „unterlastet“ klassifiziert

• Die Wahrscheinlichkeit für False Negative-Fehler steigt, da aus der Plausibilitätsprüfung (Schritt (6)) heraus bei tatsächlich vorhandener Überlastung alternativ (logisch „oder“) zum falschen Ergebnis aus Schritt (3) fälschlicherweise auf freien Verkehrsfluss (fehlende Überlastung) erkannt werden kann.

Eine Plausibilitätsprüfung ist demnach umso zielführender, je häufiger sie False Positive-Ereignisse vermeidet, wenn sie dabei gleichzeitig so wenige zusätzliche False Negative-Einschätzungen wie möglich verursacht. Dieses Wissen hilft generell beim Design und der Kalibrierung eines Verfahrens.

Beim vorliegenden Verfahren kann die Wirkung der Ausschlussprüfung durch Auswertung der Evaluierungsergebnisse10 analysiert werden.

Abbildung 5 visualisiert die absoluten Häufigkeiten der False Positive- und False Negative-Fehler beim vereinfachten Verfahren (nur Überlast-Erkennung, „Schätzung ohne Korrektur“) und beim vollständigen Verfahren, wie es in diesem Text beschrieben wurde. Aus darstellungstechnischen Gründen11 sind alle Werte in x- und y-Richtung mit einem gleichverteilten Zufallswert aus [−0.5, 0.5] überlagert und als halbtransparente Kreise dargestellt (daraus erklärt sich auch die untere Begrenzung der Achsen auf −1 statt auf 0).

Abbildung 5: Verteilung der Fehlerarten ohne (links) und mit Plausibilitätsprüfung

Der Vergleich zeigt deutlich, dass eine Vielzahl von False Positive-Schätzungen korrigiert wird. False Positive-Schätzungen mit zweistelligen Vorkommen werden erheblich reduziert. Gleichzeitig nimmt die Zahl der False Negative-Fehler zu, allerdings nicht in vergleichbarem Maße.

Wie die nachfolgende Tabelle 4 zeigt, entstehen die positiven Wirkungen bei der Evaluierung mit simulierten Daten:

Tabelle 4: Mittlere Häufigkeiten der Fehlerarten ohne / mit Plausibilitätsprüfung (abs. Werte)

Die Zahl der Fehlalarme (False positive) wird im Mittel von 6.6 um 4.7 auf 1.9 reduziert, während die Zahl der undetektierten Umläufe mit Überlastung nur um 0.8 steigt. Im Saldo werden damit fast 4 Umläufe (etwa 10% aller Umläufe bei meist einer Stunde Simulationszeit) zusätzlich korrekt geschätzt.

Bei der Anwendung der Ausschlusskriterien auf die realen Daten wird die Zahl der Fehlalarme ebenfalls deutlich reduziert, allerdings auf Kosten einer vergleichbaren Zahl an zusätzlichen, nicht detektierten Überlastungen. Das Verfahren zur Plausibilitätsprüfung ist also noch zu verbessern.

4 Ausblick

Der aktuelle Stand des Verfahrens und der Evaluierung legt eine Reihe von Fragen nahe:

•    Warum weicht die Schätzgüte bei einzelnen Zufahrten / Fahrstreifen stark von den generell akzeptablen Werten ab (etwa das in Abschnitt 3.2.1 erwähnte Ergebnis mit Realdaten, wo die Plausibilitätsprüfung zu einer hohen Zahl an False Negative-Schätzungen führt)?

•    Ab welchen Spurlängen spielen Nachbarspuren keine Rolle mehr?

•    Was muss beim Praxiseinsatz noch kalibriert werden?

•    Wie können die Ergebnisse am besten in Steuerungsverfahren verwendet werden?

•    Welche Schätzgüte ist dafür überhaupt ausreichend?

Die geplanten stichprobenartige Untersuchungen von „Problemfällen“ und die anstehenden Sensitivitätsuntersuchungen werden hoffentlich bereits Hinweise auf mögliche Antworten auf einige der Fragen geben.

Im Moment kann noch nicht abgeschätzt werden, welche Ergebnisgüten und welche Einsatzmöglichkeiten sich ergeben werden. Festgehalten werden kann jedenfalls, dass die Entwicklung des Verfahrens noch am Anfang steht und dass die weiteren Arbeiten am Algorithmus eng mit einer Ausweitung der Evaluierungsmethodik und des dafür schon angelegten Test-Frameworks verbunden sein werden.

5 Literatur

[1]    MÜCK, J. (2002). Schätzverfahren für den Verkehrszustand an Lichtsignalanlagen unter Verwendung halteliniennaher Detektoren. Heureka 2002, Tagungsband, Karlsruhe, 06./07. März 2002, FGSV Verlag, Köln

[2]    PRANCKUS, V. (2013). Estimating the Service Level on Signalized Intersections. Masterarbeit, TU München, München.

[3]    WU, X., LIU, H.X., GETTMAN, D. (2010): Identification of Oversaturated Intersections using Highresolution traffic signal data. Transportation Research Part C 18, p.626–638.

[4]    FGSV (2010). Richtlinien für Lichtsignalanlagen. Ausgabe 2010, FGSV Verlag, Köln

[5]    YANG, Y. (2011). Empirical Analysis of the Queuing Process at Signalized Intersections. Masterarbeit, TU München, München.

[6]    MÜCK, J. (2002). Kalibrierung, Test und Bewertung eines adaptiven Verfahrens zur Stauerfassung an Lichtsignalanlagen, Berichte zu den Arbeitspaketen 1-3; Studie im Auftrag der Bayerische Motorenwerke AG, München; TRANSVER GmbH, München; 2002