FGSV-Nr. FGSV 002/106
Ort Stuttgart
Datum 02.04.2014
Titel Qualitätsmodellierung und -bewertung im Verkehr mittels eines probabilistischen Rahmenkonzepts
Autoren Dr.-Ing. Thorsten Neumann
Kategorien HEUREKA
Einleitung

In nahezu allen Lebensbereichen spielt Qualität eine entscheidende Rolle. Auch im Verkehr bzw. im Verkehrs- und Mobilitätsmanagement erfährt das Thema seit einiger Zeit besonderes Interesse. Aber was ist Qualität vom Grundsatz her überhaupt und wie lässt sie sich abstrakt beschreiben? Der vorliegende Beitrag diskutiert diese Fragen und verknüpft dabei die Definitionen einschlägiger Normen sowie bekannte Qualitätskonzepte mit einer neuen, stochastischen Sichtweise. Qualität ist demnach allgemein die Wahrscheinlichkeit der Erfüllung vorgegebener Anforderungen (bei ggf. unvollständiger Information). Formalisiert wird der Qualitätsbegriff beispielhaft über sogenannte Bayes’sche Netze, die hier auf mathematischer Seite den „grammatikalischen“ Rahmen vorgeben. Anhand konkreter Anwendungsfälle werden die grundlegenden Prinzipien des Ansatzes erläutert.

PDF
Volltext

Der Fachvortrag zur Veranstaltung ist im Volltext verfügbar. Das PDF enthält alle Bilder und Formeln.

1 Einführung

In seinem Buch „Quality is free: The art of making quality certain“ [1] beschreibt Philip B. Crosby Qualität als „conformance to requirements”. In dieselbe Richtung zielt beispielsweise die Norm DIN EN ISO 8402. Hier wird Qualität als „die Gesamtheit von Merkmalen einer Einheit bezüglich ihrer Eignung, festgelegte und vorausgesetzte Erfordernisse zu erfüllen“ definiert. Gleiches gilt für die neuere DIN EN ISO 9000, die sich den Grundbegriffen des Qualitätsmanagements widmet.

Übertragen auf das Verkehrs- und Mobilitätsmanagement mit seinen vielfältigen Komponenten (z.B. Detektionsinfrastruktur, Verkehrsdaten, Verkehrslageinformationen, Verkehrsbeeinflussungsanlagen, Steuerungsmaßnahmen) bedeutet dies, dass Qualität maßgeblich von jeweils zu beschreibenden Anforderungen abhängt. Oder beispielhaft formuliert: Die Qualität einer Verkehrsmeldung ist keineswegs eine eindeutige Größe, sondern variiert unter anderem als Funktion des nutzer- bzw. anwendungsabhängigen Anspruchsniveaus mitunter stark.

Man stelle sich etwa einen Autofahrer auf einem Autobahnabschnitt gewisser Länge ohne Ausfahrt vor. Erhält der Fahrer nun über Verkehrsfunk eine Staumeldung über einen bekannten Stau am Ende des Streckenabschnitts (vgl. Bild 1), so kann deren Qualität sehr unterschiedlich bewertet werden.

Bild 1: Qualität als Funktion der Anforderungen.

Ist nur die Aussage „Stau ja oder nein“ von Relevanz, so kann die Qualität der Staumeldung auf Grundlage der gegebenen Informationen – d.h. da der Stau laut Annahme bekannt ist – zweifelsohne mit 100% angegeben werden. Spielt darüber hinaus auch die Genauigkeit der durch den Stau verursachten Verlustzeit (ggf. innerhalb gewisser Toleranzgrenzen) eine Rolle, so dürfte die Qualität im Allgemeinen geringer ausfallen (z.B. 80%). Soll die Staumeldung schließlich zur Ableitung von Umleitungsempfehlungen verwendet werden, so ist ihr Nutzen wegen fehlender Wende- und Umfahrungsmöglichkeiten sogar gleich Null. Die Meldung hat in diesem konkreten Sinne also selbst bei hoher Genauigkeit der enthaltenen Information eine Qualität von 0%.

Noch schwieriger wird die Qualitätsbewertung, wenn der persönliche Nutzen für den betroffenen Autofahrer betrachtet wird, da dieser maßgeblich von individuellen Präferenzen und anderen Faktoren abhängen kann. Dabei wird unmittelbar der Bereich der zwangsläufig subjektiven, vom Nutzer „wahrgenommenen Qualität“ (vgl. [2]) gestreift, die zugleich wesentlich ist für die Akzeptanz und Befolgung von verkehrssteuernden Maßnahmen wie etwa bei den inzwischen weit verbreiteten Strecken- oder Netzbeeinflussungsanlagen auf Autobahnen.

In der verkehrlichen Praxis wird die Qualität von Verkehrsdaten, Stauinformationen, Steuerungsmaßnahmen, Verkehrsfluss usw. in der Regel über verschiedene Kennzahlen oder Qualitätsindikatoren abgebildet, die vor allem auf Datenebene häufig zu übergeordneten Kriterien (Verfügbarkeit, Aktualität, Genauigkeit, Konsistenz, …) zusammengefasst werden. Beispiele sind die klassischen LOS-Konzepte aus HBS [3] und amerikanischem HCM [4], aber auch die umfassenden Bewertungssystematiken aus Projekten wie Traffic IQ [5] oder QUANTIS [6].

Großer Wert wird dabei auf die Messbarkeit der definierten Qualitätskennzahlen gelegt. Umgekehrt haben zum Beispiel Stauinformationen für einen Verkehrsteilnehmer aber auch dann eine Qualität, wenn keinerlei Möglichkeit für ihn besteht, die Meldungen per Messung zu verifizieren. Das Gleiche gilt, wenn selbst einfache Qualitätsindikatoren in der Praxis aus technischen, organisatorischen oder anderen Gründen häufig nur mühsam zu bestimmen sind. In all diesen Fällen wird eine Schätzung oder „Prognose“ der Qualität auf Basis persönlicher Erfahrungen oder anderer Messungen benötigt.

Tatsächlich ist dies das Grundprinzip jeder Stichprobe, bei der räumlich-zeitlich und/oder im Umfang begrenzt die Qualität etwa von Meldungen eines Verkehrsinformationssystems bestimmt und anschließend auf das ganze System übertragen wird (Stichwort: Messkampagne). Ein anderes Beispiel ist die modellbasierte Bestimmung einer flächendeckenden Verkehrslage, bei der ein Verkehrsmodell o.ä. anhand von Daten lokaler Messquerschnitte kalibriert wird, um damit auch abseits der Messstellen die Verkehrsqualität (z.B. als Level of Service) angeben zu können (vgl. [7]-[8]).

In beiden Fällen ist die auf Basis unvollständigen Wissens geschätzte Qualität natürlich mit Unsicherheit behaftet, sodass man sie formal über eine statistische Verteilung beschreiben muss. Die richtige Frage lautet also, wie wahrscheinlich es ist, dass zum Beispiel der Verkehrsfluss auf einem gegebenen, nicht-detektierten Streckenabschnitt zur betrachteten Zeit einen bestimmten Level of Service aufweist. Qualität ist somit nicht mehr nur eine gemessene sondern auch eine modellierte Größe.

Man kann sich in der Folge überlegen, ob es nicht sinnvoll ist, Qualitätsindikatoren für beliebige Objekte im Verkehrs- und Mobilitätsmanagement mit ihren Abhängigkeiten untereinander und zu anderen Einflussfaktoren (Merkmalen) grundsätzlich stochastisch zu beschreiben. Bezogen auf das Kriterium „Technische Verfügbarkeit“ in der Detektion oder Steuerung wäre beispielsweise die Frage nach der Wahrscheinlichkeit, dass ein bestimmtes Hardwaremodul aktuell Daten liefert, denkbar. Oder: Wie wahrscheinlich ist es, dass eine gegebene, nicht an den Verkehrsrechner angeschlossene Lichtsignalanlage gerade ordnungsgemäß funktioniert?

Messungen oder Beobachtungen sind dabei Zusatzinformationen (Evidenz), die eine verbesserte Schätzung der jeweiligen Qualität erlauben. Ist etwa im letzten Beispiel bekannt, dass sich auf allen Zuflüssen der betroffenen Kreuzung ungewöhnlich lange Rückstaus bilden, so könnte dies auf einen Ausfall der Lichtsignalanlage hindeuten. Eine direkte Beobachtung der Nicht-Verfügbarkeit würde indes die Wahrscheinlichkeit des Ausfalls auf 100% erhöhen, was sicherem Wissen entspräche. In diesem Sinne umfasst die stochastische Qualitätsmodellierung übrigens auch rein auf Qualitätsmessung beruhende, deterministische Konzepte.

Entscheidend ist also letztlich die allgemein formulierte Kernfrage:

Wie wahrscheinlich ist es, dass ein jeweils betrachtetes Objekt bei gegebenen (unvollständigen) Informationen bestimmte Anforderungen erfüllt?

Dabei sei angemerkt, dass die Frage bewusst nicht lautet, wie gut bestimmte Anforderungen erfüllt werden, sondern nur, ob sie erfüllt werden. Qualität ist demnach die Wahrscheinlichkeit der Übereinstimmung mit einem vorgegebenen Anforderungsprofil. Das in der Praxis verbreitete Verständnis, das Qualität als Grad der Übereinstimmung mit bestimmten Anforderungen (z.B. „hohe“, „mittlere“, „niedrige“ Qualität) auffasst, entspricht im Endeffekt einer impliziten Abstufung des Anforderungsprofils, wobei jede der dadurch entstehenden Qualitätsklassen streng betrachtet als neues Anforderungsprofil verstanden werden kann, dem das betrachtete Objekt entweder genügt oder nicht.

Die gängige Frage, wie gut ein gegebenes Objekt bestimmte Anforderungen erfüllt, ist folglich insofern schlecht gestellt, als dass sie eine Abstufung des Anforderungsprofils voraussetzt, ohne diese jedoch explizit zu benennen. Eine Antwort hängt somit zwangsläufig von impliziten, nicht formulierten und ggf. nicht überprüfbaren Annahmen ab, wodurch eine objektive Qualitätseinschätzung unmöglich wird. Sobald aber die Anforderungsstufen vollständig definiert sind, ist die Frage nach der „Güte“ bzw. dem Grad der Übereinstimmung mit einer beliebigen dieser Stufen inhaltlich sinnlos, da – mit den entsprechenden Wahrscheinlichkeiten – nur noch die Optionen „Übereinstimmung ja/nein“ möglich sind. Die Frage, wie wahrscheinlich es ist, dass das betrachtete Objekt zum Beispiel eine hohe/mittlere/niedrige Qualität hat, ist hingegen natürlich weiterhin zulässig – vorausgesetzt, es ist klar, was unter hoher/mittlerer/niedriger Qualität zu verstehen ist.

2 Modellierung

2.1 Konzept

Eine der Herausforderungen besteht nun darin, eine geeignete „Sprache“ zu finden, mit der sich die in Abschnitt 1 skizzierten Ideen und Fragestellungen sinnvoll und effizient abbilden lassen. Dabei haben sich sogenannte „Probabilistic Graphical Models (PGM)“ (vgl. [9]) bzw. speziell Bayes’sche Netze (vgl. [10]) als ein vielversprechender Kandidat herauskristallisiert.

Ursprünglich im Zusammenhang mit der Erforschung künstlicher Intelligenz entwickelt, lassen sich mit ihrer Hilfe komplexe Systeme, die von einer Vielzahl unsicherer Faktoren abhängen, stochastisch modellieren. Als prominentestes Beispiel darf hier sicher das von David Heckerman et al. entwickelte Expertensystem „Pathfinder“ (s. [11]-[12]) gelten, das in den 1990er Jahren erfolgreich zur medizinischen Diagnose von Lymphknotenerkrankungen eingesetzt wurde.

Eines der Hauptmerkmale Bayes’scher Netze ist, dass sich mit ihrer Hilfe Verbundwahrscheinlichkeitsverteilungen P(X1, …, Xn) auf einer gegebenen Menge X von Zufallsvariablen X1, …, Xn effizient und kompakt repräsentieren lassen. Dazu werden die durch P induzierten (bedingten) stochastischen Unabhängigkeiten zwischen Teilmengen von X in Form eines azyklischen, gerichteten Graphen kodiert, dessen Knoten durch die Zufallsvariablen X1, …, Xn gebildet werden. Bild 2 zeigt exemplarisch ein sehr einfaches Modell für die Bewertung eines FCD-Systems (FCD = Floating Car Data) bestehend aus den drei Zufallsvariablen F (FCD-Abdeckung), R (Reisezeitengenauigkeit) und K (Kosten des Systems).

Bild 2: Ein einfaches Bayes’sches Netz.

Die auftretenden Pfeile (Kanten) beschreiben dabei einen direkten Einfluss der jeweiligen Zufallsvariablen aufeinander und können häufig (aber nicht immer) im Sinne eines kausalen Zusammenhangs interpretiert werden. Im Bayes’schen Netz aus Bild 2 impliziert eine hohe FCD-Abdeckung z.B. eine prinzipiell hohe Genauigkeit der ermittelten Reisezeiten, aber auch höhere Kosten für Aufbau und Betrieb des Systems aufgrund einer entsprechend großen Fahrzeugflotte. Zugleich haben die Kosten keinen direkten Einfluss auf die Qualität der Reisezeiten, sondern wirken sich nur indirekt über die FCD-Abdeckung aus: Sei etwa bekannt, dass die Kosten des Systems sehr niedrig sind, so kann vermutet werden, dass auch Fahrzeugflotte und damit die FCD-Abdeckung eher klein sind. Dies wiederum macht eine eher niedrige Qualität der ermittelten Reisezeiten wahrscheinlicher. In diesem Sinne sind also die Zufallsvariablen R und K stochastisch abhängig. Umgekehrt liefert mögliches Wissen über die Kosten keine zusätzlichen Informationen bezüglich der Qualität der Reisezeiten, wenn die FCD-Abdeckung bereits bekannt ist, da im Modell letztlich nur diese den Wert von R unmittelbar beeinflusst. Es folgt, dass R und K unabhängig sind gegeben F.

Quantifiziert wird der wechselseitige Einfluss der einzelnen Knoten eines Bayes’schen Netzes mit den Zufallsvariablen X1, …, Xn, indem für jeden Knoten Xi die bedingte Wahrscheinlichkeitsverteilung P(Xi|Pa(Xi)) gegeben seine Elternknoten Pa(Xi) bestimmt wird. Elternknoten eines Knotens Xi sind dabei all die Knoten des Graphen, von denen aus eine Kante (Pfeil) auf Xi zeigt. Gibt es keine solchen Knoten, so ist die Menge Pa(Xi) leer und P(Xi|Pa(Xi)) wird zur Randverteilung P(Xi). Der Knoten Xi heißt in diesem Fall auch Wurzelknoten. In Bild 2 haben beispielsweise R und K denselben Elternknoten F, und nur diesen; F besitzt keine Elternknoten. Für eine vollständige Spezifikation des Bayes’schen Netzes aus Bild 2 werden also neben der dargestellten Graphenstruktur nur die Wahrscheinlichkeitsverteilungen P(F), P(R|F) und P(K|F) benötigt.

Die vollständige Verbundwahrscheinlichkeit auf der Menge X = {X1, …, Xn} aller Knoten eines Bayes’schen Netzes kann dann gemäß der sogenannten Kettenregel (vgl. [9]) berechnet werden. Der Vorteil dieser Faktorisierung besteht vor allem darin, dass zur vollständigen Spezifikation der bedingten Wahrscheinlichkeiten auf der rechten Seite im Allgemeinen deutlich weniger freie Parameter zu bestimmen sind als für eine direkte Beschreibung der Verbundwahrscheinlichkeiten ohne die Kodierung stochastischer Unabhängigkeiten mittels Bayes’scher Netze. Unter der Annahme binärer Zufallsvariablen F und K sowie einer ternären Variable R im Modell aus Bild 2 reduziert sich die Anzahl freier Parameter beispielsweise von 22 * 31 – 1 = 11 auf 1 + 2*1 + 2*2 = 7. Vor allem bei großen Netzen macht sich der Vorteil bemerkbar. Im günstigsten Fall hängt die Anzahl festzulegender, freier Parameter durch die Faktorisierung gemäß Gleichung (1) nicht mehr exponentiell, sondern nur noch linear von der Knotengesamtanzahl ab. Der Nutzen dieses Sachverhalts darf keineswegs unterschätzt werden und begründete in den 1990er Jahren zu einem entscheidenden Teil den Durchbruch in der probabilistischen Modellierung komplexer (Experten-)Systeme (vgl. [9]).

Formel (1) siehe PDF.

Um auf die ursprüngliche Fragestellung zurückzukommen, stelle man sich nun ein Bayes’sches Netz bestehend aus zwei formal gleichen, aber inhaltlich verschiedenen Typen von Knoten vor. Merkmalsknoten seien dabei all solche Knoten (Zufallsvariablen), die nicht unmittelbar die Qualität eines Objekts repräsentieren, aber diese typischerweise in irgendeiner Form beeinflussen. Qualitätsknoten hingegen beschreiben, ob das jeweils zugehörige Objekt einem bestimmten Anforderungsprofil genügt oder nicht bzw. mit welcher Wahrscheinlichkeit.

Im Modell aus Bild 2 sind beispielsweise R und K die Qualitätsknoten, und F ist der einzige Merkmalsknoten. Entscheidend ist, dass sich mittels der zugehörigen Verbundwahrschein- lichkeitsverteilung P(F, R, K) dann unmittelbar Kernfragen des Typs aus Abschnitt 1 beantworten lassen: Sei z.B. bekannt, dass das betrachtete FCD-System nur geringe Kosten K verursacht (K = niedrig). Die FCD-Abdeckung F sei unbekannt, da sie z.B. zusätzlich von der (in diesem Fall nicht gemessenen) Gesamtverkehrsdichte abhängt. Eine Frage könnte dann lauten: „Wie wahrscheinlich ist es, dass die ermittelten Reisezeiten eine hohe Genauigkeit (R = hoch) aufweisen (gegeben niedrige Kosten K des Systems)?“

Dies ist offensichtlich äquivalent zu der Frage nach der Wahrscheinlichkeit die sich mittels Marginalisierung leicht aus P(F, R, K) berechnen lässt, wobei die f (i) und r(j) in Gleichung (2) alle zulässigen Werte von F bzw. R durchlaufen.

Formel (2) siehe PDF.

Es sei nur am Rande darauf hingewiesen, dass die Berechnung solcher Wahrscheinlichkeiten – auch Inferenz genannt – mittels der Verbundwahrscheinlichkeit P(X1, …, Xn) eines beliebigen Bayes’schen Netzes über der Menge X = {X1, …, Xn} bei großer Knotenanzahl numerisch sehr aufwändig bis unmöglich werden kann (vgl. [9]). Es gibt allerdings effiziente Algorithmen, die eine Bestimmung (approximativ und exakt) auch ohne die explizite Berechnung von P(X1, …, Xn) erlauben.

2.2 Beispiel

Anhand eines fiktiven Zahlenbeispiels (angelehnt an [9]) soll das oben formulierte Konzept im Folgenden noch einmal näher erläutert werden. Hierzu wird das Modell aus Bild 2 um zwei weitere Knoten (Straßentyp S und Nutzerbewertung N) erweitert. Zusätzlich wird der Knoten K (Kosten des Systems) durch einen Knoten W (Wirtschaftlichkeit) ersetzt. Abschließend werden die erforderlichen bedingten Wahrscheinlichkeitsverteilungen P(S), P(F), P(R|S,F), P(N|R) und P(W|F) mit fiktiven Zahlenwerten belegt.

Bild 3: Fiktives Beispiel zur Bewertung eines FCD-Systems (erstellt mit Netica 4.16; s. [13]).

Bild 3 zeigt das vollständig spezifizierte Bayes’sche Netz mit Angabe aller möglichen Zustände der einzelnen Knoten. Die ebenfalls angegebenen Prozentwerte (Balken) zu jedem dieser Zustände entsprechen dabei jeweils den sich aus der implizit definierten Verbundwahrscheinlichkeit P(S, F, R, N, W) durch Marginalisierung ergebenden Randwahrscheinlichkeiten.

Wie in Abschnitt 2.1 zählt auch im erweiterten Modell die FCD-Abdeckung F zu den qualitätsbeeinflussenden Merkmalen des betrachteten FCD-Systems, indem eine gute Abdeckung insbesondere eine höhere Reisezeitengenauigkeit R impliziert. Zusätzlich spielt in diesem Fall aber auch der Straßentyp S eine Rolle: Der prinzipiell homogenere Verkehrsfluss auf Autobahnen (im Vergleich zu innerstädtischen Straßen) erlaubt beispielsweise auch bei schlechter FCD-Abdeckung F eine ggf. noch gute bis mittelgute Reisezeitschätzung. Ferner ist auch bei hoher FCD-Abdeckung die Qualität der errechneten Reisezeiten (im Sinne der Übereinstimmung mit den tatsächlichen Reisezeiten) tendenziell höher als in der Stadt (vgl. P(R|S,F) in Bild 3). Allerdings machen Autobahnen nur einen kleinen Teil des betrachteten Gesamtstraßennetzes aus (vgl. P(S) in Bild 3).

Die Bewertung N des FCD-Systems durch den Verkehrsteilnehmer hängt in vereinfachter Form nur von der Genauigkeit R der Reisezeiten ab in dem Sinne, dass genaue Reisezeiten mit hoher Wahrscheinlichkeit auch eine gute Einschätzung durch den Endnutzer implizieren. Kriterien wie FCD-Abdeckung F oder Kosten des Systems (Wirtschaftlichkeit W) haben keinen direkten Einfluss auf die Nutzerwahrnehmung. Umgekehrt ist bei einer geringen Genauigkeit der gelieferten Reisezeitinformationen kaum von einer guten Nutzerbewertung auszugehen (vgl. P(N|R) in Bild 3).

Für den Knoten W sei angenommen, dass für den Aufbau und Betrieb des FCD-Systems, welches dem Endnutzer kostenfrei Reisezeitdaten bereitstellt, ein fixes (knappes) Budget zur Verfügung steht. Das System sei wirtschaftlich, wenn dieses Budget alle erforderlichen Ausgaben deckt, und nicht wirtschaftlich, wenn die Ausgaben das Budget übersteigen. Es ist plausibel, dass eine große Fahrzeugflotte, wie sie für eine hohe FCD-Abdeckung F erforderlich ist, höhere Kosten verursacht und damit die Gefahr, dass das System nicht wirtschaftlich ist, erhöht (vgl. P(W|F) in Bild 3).

Man erkennt schließlich die Knoten R, N und W als Qualitätsknoten sowie S und F als Merkmalsknoten. Dabei ist auffällig, dass Qualitätsknoten wie im Fall der Nutzerbewertung N nicht notwendig nur von Merkmalsknoten abhängen, sondern auch andere Qualitätsknoten als Eltern haben können. Die Knoten R und N besitzen ferner ein abgestuftes Anforderungsprofil mit drei bzw. zwei Anforderungsstufen. Der binäre Qualitätsknoten W hingegen trifft nur eine Aussage, ob (bzw. mit welcher Wahrscheinlichkeit) das betrachtete FCD-System den eindeutig festgelegten Wirtschaftlichkeitsanforderungen genügt oder nicht.

Auf Grundlage des Modells aus Bild 3 lassen sich dann erneut die Kernfragen des Typs aus Abschnitt 1 beantworten. Man könnte z.B. daran interessiert sein, wie wahrscheinlich es ist, dass das betrachtete FCD-System eine gute Nutzerbewertung N erhält. Ohne weitere Informationen wäre die zugehörige Wahrscheinlichkeit in diesem Fall P(N = gut) ≈ 57,9% (vgl. Bild 3). Ist ferner bekannt, dass die FCD-Abdeckung F schlecht ist, so reduziert sich die Wahrscheinlichkeit zu P(N = gut | F = schlecht) ≈ 29,1%. Beschränkt sich die Bewertung jedoch auf Autobahnabschnitte, so folgt P(N = gut | F = schlecht, S = Autobahn) ≈ 64,4% trotz nach wie vor schlechter FCD-Abdeckung F (vgl. Bild 4).

Bild 4: Beispiel für kausales Schlussfolgern („Causal reasoning“).

Fragestellungen dieses Typs, die ausgehend von (teilweise) bekannten Ursachen die Wahrscheinlichkeit eines bestimmten Effekts abschätzen, fallen in den Bereich des sogenannten „kausalen Schlussfolgerns“ (Causal reasoning). Umgekehrt ist auch „diagnostisches Schlussfolgern“ (Evidential reasoning) möglich, wobei von beobachteten Effekten auf die Wahrscheinlichkeit möglicher Ursachen geschlossen wird.

Sei beispielsweise nach der Wahrscheinlichkeit einer guten FCD-Abdeckung F gefragt. Diese beträgt laut Spezifikation des Bayes’schen Netzes in Bild 3 zunächst P(F = gut) = 60%. Ist jedoch bekannt, dass die Reisezeitengenauigkeit R des FCD-Systems niedrig ist, so impliziert dies einen deutlich kleineren Wert, nämlich P(F = gut | R = niedrig) ≈ 19,8% (vgl. Bild 5). Ähnlich verhält es sich, wenn nicht die Reisezeitengenauigkeit R, sondern nur die Nutzerbewertung N vorliegt. Ist diese wie erwartet schlecht, so ergibt sich als Wahrschein- lichkeit für eine gute FCD-Abdeckung F der Wert P(F = gut | N = schlecht) ≈ 32,6%. Offenbar ist auch dieser kleiner als die ursprünglichen 60%, liegt aber deutlich über der zuvor ermittelten Wahrscheinlichkeit bei bekannter Reisezeitengenauigkeit. Grund hierfür ist, dass eine schlechte Nutzerbewertung N anders als die deterministische Annahme „R = niedrig“ mit gewisser Wahrscheinlichkeit auch eine hohe oder mittlere Reisezeitengenauigkeit R zulässt.

Von besonderer Bedeutung ist schließlich das sogenannte „interkausale Schlussfolgern“ (Intercausal reasoning), bei dem Wissen über eine Ursache die Wahrscheinlichkeit einer anderen Ursache für denselben bekannten (ggf. mittelbaren) Effekt beeinflusst. Sei etwa im Beispiel von Bild 5 zusätzlich bekannt, dass die FCD-Abdeckung F gut ist, so reduziert sich angesichts der niedrigen Reisezeitengenauigkeit R die Wahrscheinlichkeit des Straßentyps Autobahn noch weiter von 3,3% auf P(S = Autobahn | R = niedrig, F = gut) ≈ 2,17%.

Eine Mischung aus interkausalem und diagnostischem Schlussfolgern – andere Mischformen sind ebenso möglich – tritt auf, wenn im letzten Fall beispielsweise nicht die FCD-Abdeckung F sondern „nur“ eine Aussage über die Wirtschaftlichkeit W vorliegt. Unter Annahme eines wirtschaftlichen Systems erhöht sich zunächst die Wahrscheinlichkeit einer schlechten FCD-Abdeckung F auf P(F = schlecht | R = niedrig, W = wirtschaftlich) ≈ 97,0% (diagnostisches Schlussfolgern). Zugleich steigt die Wahrscheinlichkeit für den Straßentyp Autobahn leicht an, d.h. es gilt P(S = Autobahn | R = niedrig, W = wirtschaftlich) ≈ 3,53% (interkausales Schlussfolgern) gegenüber P(S = Autobahn | R = niedrig) ≈ 3,3% (vgl. Bild 6).

Bild 6: Beispiel für interkausales Schlussfolgern („Intercausal reasoning").

Offenbar wird die niedrige Reisezeitengenauigkeit R in diesem Fall teilweise bereits durch die vermeintlich schlechte FCD-Abdeckung F erklärt, sodass der Straßentyp Stadt zumindest zu einem geringen Anteil als Ursache wegfällt. In der Literatur (vgl. [9]) wird dieser Effekt daher häufig auch als „Explaining away“ bezeichnet und ist eine spezielle Form des interkausalen Schlussfolgerns.

Abschließend sei noch kurz auf die in der Modellstruktur kodierten (bedingten) Unabhängigkeiten zwischen Teilmengen der auftretenden Knoten hingewiesen, da hierin die vermeintlich wichtigste Bedeutung des Graphen eines Bayes’schen Netzes liegt (vgl. [9]). Insbesondere beschreibt der Graph, in welcher Form Informationen zwischen gegebenen Ereignissen fließen können, vor allem aber auch, wo mögliches Wissen über bestimmte Knoten unter der Annahme bekannter Zustände anderer Knoten (Evidenz) keinen zusätzlichen Beitrag zur Wahrscheinlichkeit eines betrachteten Ereignisses liefert.

Im Beispiel aus Bild 3 ist etwa der Knoten N unabhängig von allen anderen gegeben R – kurz (N ﬩ S, F, W | R) – wie unter anderem auch ein Vergleich der Wahrscheinlichkeiten von N in Bild 5 und Bild 6 impliziert. Weitere (bedingte) Unabhängigkeiten, die im Graphen aus Bild 3 kodiert sind (vgl. [9]), umfassen z.B. die folgenden: (W ﬩ S, R, N | F), (S ﬩ F, W). Man beachte, dass die letzte Unabhängigkeitsbehauptung nur im nicht bedingten Fall gilt. Ist R oder N gegeben, so ist S nicht mehr unabhängig von F und W.

Der praktische Nutzen dieser Interpretation der Graphenstruktur eines Bayes’schen Netzes liegt vor allem darin, dass bei teilweise bekannten Knotenzuständen – wie schon gesagt – unmittelbar ersichtlich ist, welche zusätzlichen Informationen zur Beantwortung derkonkreten Frage nach der Wahrscheinlichkeit eines bestimmten Ereignisses (z.B. der Qualität eines gegebenen Objekts) überhaupt einen Beitrag leisten können. Unnötige Erhebungen, Messungen oder Recherchen lassen sich dadurch systematisch vermeiden. Besonders effektiv wird der Ansatz zudem, wenn mittels leicht realisierbarer Sensitivitätsanalysen im Bayes’schen Modell vorab die entscheidenden Haupteinflussfaktoren unter der Bedingung bereits verfügbarer Informationen identifiziert werden.

3 Mögliche Anwendungsfälle

Die Ausführungen der vorangegangenen Abschnitte zeigen die große Flexibilität, die Bayes’sche Netze als probabilistisches Rahmenmodell für die Qualitätsbewertung im Verkehr bzw. im Verkehrs- und Mobilitätsmanagement bieten. Beispielsweise gibt es für die Qualitätsknoten mit Ausnahme der Bedingung der Disjunktheit und Vollständigkeit keine Vorgaben bezüglich Anzahl und Art möglicher Qualitätsstufen, die somit theoretisch für jedes Objekt individuell festgelegt werden können, ohne dass die formale Konsistenz des Gesamtmodells beeinträchtigt wird. Disjunktheit meint dabei, dass sich die einzelnen Qualitätsstufen nicht überlappen dürfen, und Vollständigkeit, dass alle möglichen Qualitätszustände abgedeckt sein müssen. Analog können auch Merkmalsknoten beliebig definierte Zustände annehmen.

Mit Hilfe von Wahrscheinlichkeitsverteilungen als vereinheitlichender „Sprache“ oder „Grammatik“ können darüber hinaus praktisch beliebige Objekte und Merkmale effektiv und aussagekräftig (vgl. die verschiedenen Formen des Schlussfolgerns in Bayes’schen Netzen) basierend auf ihren kausalen oder stochastischen Abhängigkeiten miteinander in Beziehung gesetzt werden. Entsprechend groß ist das Spektrum möglicher Anwendungsfälle des oben beschriebenen Rahmenkonzepts, von denen im Folgenden drei exemplarisch herausgegriffen und grob skizziert werden sollen.

3.1 Fehlerdiagnose in der Verkehrsdetektion

Die Fehlersuche in komplexen, technischen Systemen, z.B. Fahrzeugen (vgl. [14]), aber auch die Diagnose von Krankheiten (vgl. [11]-[12]) stellen typische Anwendungen von Expertensystemen, wie sie z.B. mit Bayes’schen Netzen realisiert werden können, dar. Entsprechend interessant erscheint die Übertragung der Ansätze auf die heutzutage eingesetzten, meist hoch komplizierten, räumlich verteilten Systeme zur Verkehrsdetektion in modernen Verkehrsleitzentralen.

Hierzu werden die einzelnen technischen Komponenten in ihrer Verfügbarkeit bzw. einwandfreien Funktionalität als Knoten im Bayes’schen Modell beschrieben und entsprechend ihren logischen Abhängigkeiten – mitunter auch deterministisch – miteinander verknüpft. Daran gekoppelt sind die ebenfalls als Zufallsvariablen modellierten Ergebnisse geeigneter Testroutinen oder Untersuchungen, die kontinuierlich (d.h. automatisiert) oder regelmäßig bzw. nach Bedarf manuell durchgeführt werden. Der Ausfall einer oder mehrerer Komponenten des Detektionssystems wird dann gemäß den Abhängigkeiten im Modell im Idealfall eine Abweichung vom Normalzustand bei mindestens einem der Tests prognostizieren.

Wichtiger jedoch ist, dass das Bayes’sche Modell mittels diagnostischen Schlussfolgerns umgekehrt die effiziente Lokalisierung der Ursache für jeweils beobachtete Abweichungen einzelner Testergebnisse ermöglicht. Durch Inferenz lässt sich dabei auf Basis der verfügbaren Testresultate die jeweils wahrscheinlichste Fehlerursache bestimmen. Darüber hinaus kann mittels Sensitivitätsanalysen im Modell eine Aussage getroffen werden, welche zusätzlichen Untersuchungen den größten Nutzen – gegebenenfalls gewichtet mit dem zugehörigen Aufwand oder den Kosten – in Bezug auf die Eingrenzung des Fehlers liefern (vgl. Abschnitt 2.2). Gerade vor dem Hintergrund der räumlichen Verteilung moderner Verkehrsdetektionssysteme lassen sich so theoretisch insbesondere kostspielige Prüfungen vor Ort, aber auch der zentralseitige Wartungsaufwand reduzieren.

Es sei nur am Rande erwähnt, dass entsprechende Diagnosewerkzeuge basierend auf Bayes’schen Netzen nicht nur in der Detektion, sondern natürlich auch für Systeme der Verkehrsbeeinflussung (z.B. Lichtsignalanlagen, Streckenbeeinflussungsanlagen, …) denkbar sind.

3.2 Bewertung von Verkehrsdaten und -informationen

Eng verwandt mit der Fehlerdiagnose in der Verkehrsdetektion ist die Frage nach der Qualität von Verkehrsdaten und -informationen. Während der Abschnitt 3.1 vor allem die technische Verfügbarkeit der Daten adressiert, umfasst deren Qualität jedoch noch eine Reihe weiterer Aspekte (vgl. Abschnitt 1). Shawn Turner [15] schlägt in diesem Zusammenhang die sechs, in Tabelle 1 genannten Kriterien vor.

Tabelle 1: Qualitätskriterien nach Turner [15].

Große nationale und internationale Projekte wie Traffic IQ (vgl. [5]) oder QUANTIS (vgl. [6]), aber beispielsweise auch die ISO/TR 21707 (s. [16]) verwenden ähnliche Kriterien, die jeweils über geeignete Qualitätsindikatoren und -kennzahlen näher konkretisiert werden. Bild 7 zeigt schematisch, wie die verschiedenen Ebenen in einem graphischen Modell (z.B. einem Bayes’schen Netz) zusammenhängen könnten.

Bild 7: Schematische Darstellung eines graphischen Modells zur Bewertungvon Verkehrsdaten und -informationen.

Umfeldfaktoren können dabei zum Beispiel die Lichtverhältnisse sein, die bekanntlich die Genauigkeit der Verkehrsdetektion mit Videokameras wesentlich beeinflussen. Dasselbe gilt für verkehrliche Faktoren, da dichter Verkehr (z.B. vor einer Lichtsignalanlage) unter anderem zu einer erhöhten Rate von Fahrzeugverdeckungen im Blickfeld der Kamera führt. Ferner nimmt beispielsweise auch die Zählgenauigkeit von Induktionsschleifen im Fall sehr langsam fahrender Fahrzeuge typischerweise ab.

Der Bereich der technischen Faktoren (insbesondere im Hinblick auf die technische Verfügbarkeit) wird vorzugsweise mindestens in Teilen von den Überlegungen aus Abschnitt 3.1 abgedeckt, wobei die zugehörigen Qualitätsindikatoren (vgl. Bild 7) im Wesentlichen den dort genannten Testroutinen und -ergebnissen entsprechen.

3.3 Vergleichende Bewertung städtischer Verkehre

Erst kürzlich hat die internationale Consulting-Agentur Arthur D. Little die zweite Version ihrer Studie zur Zukunftsfähigkeit von insgesamt 84 Städten weltweit hinsichtlich der Bewältigung steigender Mobilitätsanforderungen veröffentlicht [17]. Anhand einer Reihe von Kenngrößen (vgl. [18]) wird hier mittels eines einfachen Punktesystems ein Ranking der untersuchten Städte erstellt. Mögliche Abhängigkeiten zwischen den verwendeten Bewertungsindikatoren wie dem Anteil des Umweltverbundes am Modal Split oder dem Angebot an Bike-Sharing- Systemen werden jedoch nicht berücksichtigt.

Die Verknüpfung der als Zufallsvariablen modellierten Kenngrößen in einem Bayes’schen Netz analog zu dem in Abschnitt 3.2 skizzierten Ansatz hätte den Vorteil, dass genau solche Abhängigkeiten sowie die Beziehungen zu möglichen Einflussfaktoren explizit abgebildet werden können. Darüber hinaus würde ein probabilistisches Modell entsprechend den konzeptionellen Überlegungen des vorliegenden Artikels grundsätzlich eine Bewertung auch im Fall einer unvollständigen Datenbasis erlauben. Dies ist vor allem dann wichtig, wenn die benötigten Informationen zu einzelnen Bewertungsindikatoren für bestimmte, zu untersuchende Städte nicht oder nur mit großem Aufwand beschafft werden können. Eine vergleichende Bewertung unter Unsicherheit könnte in diesem Fall zielführender sein, wodurch sich aufgrund der reduzierten Datenanforderungen zugleich ein größerer Anwendungsbereich des Bewertungsmodells im Sinne einer größeren Anzahl berücksichtigungsfähiger Städte erschließt.

Es sei nur kurz erwähnt, dass bei der Erstellung entsprechender Rankings natürlich nicht zwingend die Zukunftsfähigkeit städtischer Verkehrssysteme – wie in [17]-[18] definiert – im Mittelpunkt stehen muss. Genauso ist beispielsweise die rein verkehrliche Bewertung auf Basis der Qualität des Verkehrsflusses denkbar, die in diesem Fall in Abhängigkeit von Einflussfaktoren wie der Verkehrsnachfrage und des Infrastrukturangebots modelliert würde. Spielen umgekehrt Verkehrslageinformationen bzw. deren Qualität bei der Aufstellung eines gewünschten Rankings eine Rolle, so wäre auch die Integration eines Modells entsprechend Abschnitt 3.2 oder zumindest die Einbindung von dessen Ergebnissen vorstellbar.

4 Schlussfolgerungen

Qualität ist im Allgemeinen ein äußerst komplexes und vielschichtiges Thema. Auch wenn jeder ein intuitives Verständnis davon besitzt, zeigt eine genauere Betrachtung, dass es schon keineswegs trivial ist und einiger gedanklicher Anstrengung bedarf, um im Qualitätskontext überhaupt die richtigen Fragen zu stellen. Fragen der Art „Wie gut ist eine bestimmte Verkehrssteuerung?“ oder auch „Wie gut erfüllen bestimmte Verkehrsdaten gegebene Anforderungen?“ sind in dem Sinne schlecht gestellt, dass sie grundsätzlich oder – wie im zweiten Fall – in Bezug auf die konkrete Abstufung der definierten Anforderungen zu viel Interpretationsspielraum lassen.

In diesem Sinne verfolgt der vorliegende Beitrag systematisch einen stochastischen Ansatz zur Qualitätsmodellierung, bei dem die Wahrscheinlichkeit der Erfüllung explizit beschriebener Anforderungen im Mittelpunkt steht. Über die Definition unterschiedlicher Anforderungsprofile lassen sich dabei (z.B. in Abhängigkeit vom Anwendungsfall) ohne weiteres verschiedene Qualitätswerte für dasselbe Objekt abbilden. Darüber hinaus hat die Diskussion gezeigt, dass die Qualität eines Objekts nicht nur von den zu formulierenden Qualitätsanforderungen, sondern zusätzlich auch vom Wissensstand desjenigen abhängt, der gerade mit dem Objekt umgeht.

Im Einführungsbeispiel aus Abschnitt 1 (vgl. Bild 1) könnte es etwa der Fall sein, dass der Verkehrsinformationsanbieter aufgrund seiner Daten nur mit einer gewissen Verlässlichkeit (z.B. 90%) eine Aussage darüber treffen kann, ob gerade ein Stau vorliegt oder nicht. Ein Verkehrsteilnehmer vor Ort hingegen wird sehr genau sagen können, wie die aktuelle Verkehrslage ist. Eine entsprechende Staumeldung hat bezogen auf den Informationsgehalt „Stau ja oder nein“ aus seiner Sicht somit abweichend vom Anbieter automatisch eine Qualität von 0% oder 100%. Formal entspricht dies einer direkten Qualitätsmessung, die ähnlich wie die Messung indirekter Qualitätsindikatoren oder Einflussfaktoren als Evidenz verstanden werden kann. Der Unterschied zwischen Verkehrsinformationsanbieter und Verkehrsteilnehmer besteht also lediglich in der voneinander abweichenden Verfügbarkeit von zusätzlichen Evidenzinformationen innerhalb desselben probabilistischen Modells.

Besonders hier zeigt sich auch der große Nutzen der wahrscheinlichkeitsbasierten Modellierung mit Bayes’schen Netzen, die effizient und systematisch mit unvollständigen Informationen umgehen können und dabei mit kausalem, diagnostischem und interkausalem Schlussfolgern alle wichtigen Formen der Informationsverarbeitung analog zu menschlichen Denkmustern nachvollziehbar unterstützen. Die Folge ist eine hohe Transparenz und Anschaulichkeit der Modelle. Zugleich ermöglichen Bayes’sche Netze vermöge ihrer universellen „Grammatik“ die konsistente Verknüpfung beliebiger Merkmale und Bewertungskriterien, die als unterschiedliche Knoten in dasselbe Modell integriert werden können. Unter Rückgriff auf das theoretische Beispiel aus Abschnitt 2.2 lassen sich etwa Fragen der Form „Wie wahrscheinlich ist es, dass ein gegebenes FCD-System mit einer guten Nutzerbewertung zugleich wirtschaftlich ist?“ beantworten. Andere Fragen könnten auf die Verbindung von Bewertungsmethoden aus unterschiedlichen Richtliniendokumenten wie dem HBS (s. [3]) oder HCM (s. [4]) abzielen.

Es versteht sich von selbst, dass die große Herausforderung der Modellierung darin besteht, die „richtigen“ Qualitätsindikatoren und Einflussfaktoren (Knoten) sowie deren Abhängigkeiten untereinander zu identifizieren. Es bleibt zu prüfen, inwieweit existierende Lernalgorithmen für Bayes’sche Netze geeignet sind, um im verkehrlichen Kontext unter Berücksichtigung verfügbarer (Qualitäts-)Daten zumindest die Abhängigkeiten zwischen zuvor festgelegten Merkmals- und Qualitätsknoten sinnvoll abzuschätzen. Es sei aber zugleich darauf hingewiesen, dass es laut Koller und Friedman (s. [9]) nur sehr wenige, mathematische Konzepte gibt, die überhaupt in der Lage sind, komplexe Fragestellungen hinsichtlich Modellbildung („Representation“ und „Learning“) sowie Inferenz (Schlussfolgern) umfassend und adäquat abzubilden.

Bayes’sche Netze haben hier den großen Vorteil eines modularen Aufbaus, der bei geschicktem Vorgehen eine sukzessive Modellierung einzelner Teilnetze und deren nachträgliche Integration in einem Gesamtmodell erlaubt (vgl. [9]). Insbesondere lässt sich dabei eine mikroskopische Betrachtungsweise (z.B. Detailanalyse der Datenerfassung wie in Abschnitt 3.1) konsistent mit einer eher makroskopischen Perspektive (z.B. Qualität eines Verkehrsinformationsdienstes in Abhängigkeit von der Qualität der Eingangsdaten wie in Abschnitt 3.2) kombinieren (vgl. Abschnitt 3.2). Ferner hilft die anschauliche, graphische Repräsentation der logischen Zusammenhänge zwischen den Knoten des Systems dem Modellierer, unplausible Annahmen leichter zu vermeiden. Dies gilt vor allem dann, wenn die gerichteten Kanten des Modells (klassischerweise) in einem kausalen Sinn interpretiert werden können.

Zusammenfassend bleibt abzuwarten, inwieweit sich die dargestellten Ideen im Rahmen der weiteren Forschung in konkreten Anwendungsszenarien als tragfähig erweisen. Dabei ist festzuhalten, dass im Verkehr (und nicht nur dort) gerade das Themenfeld „Qualität“ eine besondere sprachliche und inhaltliche Präzision erfordert, wobei die begrifflichen Klärungen zum gegenwärtigen Zeitpunkt keineswegs abgeschlossen sind.

5 Literatur

[1]    CROSBY, P.B. (1979): Quality is free: the art of making quality certain, McGraw-Hill, New York.

[2]    SCHMITT, R.; BETZOLD, M. (2007): Die wahrgenommene Qualität – Der Kunde entscheidet am Produkt, In: Management und Qualität 10/2007, S.14-16.

[3]    FORSCHUNGSGESELLSCHAFT FÜR STRASSEN- UND VERKEHRSWESEN (2001): HBS – Handbuch für die Bemessung von Straßenverkehrsanlagen, FGSV Verlag, Köln.

[4]    TRANSPORTATION RESEARCH BOARD (2010): HCM2010 – Highway Capacity Manual, TRB, Washington, DC.

[5]    VON DER RUHREN, S.; MAIER, P.; KÜHNEL, C.; HOYER, R. (2011): Traffic IQ – Pilotprojekt Informationsqualität im Verkehrswesen, In: Heureka ´11 Tagungsdokumentation, FGSV Verlag, Köln.

[6]    KELLERMANN, A.; POLLESCH, P.; HASPEL, U. (2011): Qualitätsbewertung von Verkehrsinformationsdiensten – Die QUANTIS-Methodik, In: Straßenverkehrstechnik 6/2011, S. 366-373.

[7]    POTTMEIER, A.; HAFSTEIN, S.F.; CHROBOK, R.; WAHLE, J.; SCHRECKENBERG, M. (2003): The Traffic State of the Autobahn Network of North Rhine-Westphalia: An Online Traffic Simulation, In: Proceedings 10th ITS World Congress 2003, Madrid, Spain.

[8]    VORTISCH, P. (2006): Modellunterstützte Messwertpropagierung zur Verkehrslageschätzung in Stadtstraßennetzen, Dissertation, Universität Karlsruhe (TH).

[9]    KOLLER, D.; FRIEDMAN, N. (2009): Probabilistic Graphical Models – Principles and Techniques, MIT Press, Cambridge.

[10]    CHARNIAK, E. (1991): Bayesian Networks without Tears, In: AI Magazine 12(4), S. 50-63.

[11]    HECKERMAN, D.E.; HORVITZ, E.J.; NATHWANI, B.N. (1992): Toward Normative Expert Systems: Part I. The Pathfinder Project, In: Methods of Information in Medicine 31(2), S. 90-105.

[12]    HECKERMAN, D.E.; NATHWANI, B.N. (1992): Toward Normative Expert Systems: Part II. Probability-Based Representations for Efficient Knowledge Acquisition and Inference, In: Methods of Information in Medicine 31(2), S. 106-116.

[13]    www.norsys.com/netica.html, letzter Zugriff: 10.12.2012.

[14]    KRIEGER, O. (2011): Wahrscheinlichkeitsbasierte Fahrzeugdiagnose mit individueller Prüfstrategie, Dissertation, Technische Universität Braunschweig.

[15]    TURNER, S. (2002): Defining and measuring traffic data quality – White Paper, Traffic Data Quality Workshop, Work Order Number BAT-02-006, Washington, DC.

[16]    ISO/TR 21707 (2008): Intelligent transport systems – Integrated transport information, management and control – Data quality in ITS systems, Technical report, Genf.

[17]    VAN AUDENHOVE, F.J.; KORNIICHUK, O.; DAUBY, L.; POURBAIX, J. (2013): The Future of Urban Mobility 2.0 – Imperatives to shape extended mobility ecosystems of tomorrow, www.adlittle.com/future-of-urban-mobility.html, letzter Zugriff: 10.01.2014.

[18]    LERNER, W.; ALI, S.; BARON, R.; DOYON, A.; HERZOG, B.; KOOB, D.; KORNIICHUK, O.; LIPPAUTZ, S.; SONG, K.; ZINTEL, M. (2011): The Future of Urban Mobility – Towards networked, multimodal cities of 2050, www.adlittle.com/future-of- urban-mobility.html, letzter Zugriff: 10.01.2014.