Analyse von Krisenregionen in Bürgerkriegen und Pandemie-Hotspots

Albert Hamzin, Vera Kamp, Reinhard Moratz

Bildagentur PantherMedia / Catherine Greyling

In unserem wissenschaftlichen Bericht analysieren wir neue Anwendungen des Konzepts der Kern-Hülle Repräsentationen von Regionen (englisch egg-yolk representations). Diese wurden von der Forschergruppe von Anthony Cohn an der Universität Leeds in England in den 90er Jahren eingeführt [Cohn 1996]. Dieser Ansatz dient der Darstellung von geografischen Regionen mit unscharfen Grenzen. Geografische Objekte wie beispielsweise Berge oder auch Ozeane haben klar definierte Kernbereiche aber unklare äußere Grenzen. Als anekdotisches Beispiel kann hier ein prominenter Berg wie der Mount Everest dienen.

Everest Region mit Kern und Hülle in Mitte der Karte.
Everest Region mit Kern und Hülle in Mitte der Karte.
Quelle: Lencer, Kartenwerkstatt, Wiki Commons

Der weithin sichtbare Gipfel eines Berges ist der Kernbereich dieses Berges in natürlich-sprachlichen Kontexten. Das gesamte Everest-Massiv (auf tibetisch Chomolungma) ist der äußere Bereich der sprachlich dem Berg Mount Everest zugeordnet wird. Die Kern-Hülle Darstellung bezieht sich in diesem Kontext auf die Region, die auf einer zweidimensionalen Karte eingezeichnet wird.

Bei einem Ozean gehört der Tiefseebereich zum Kern der entsprechenden Region und die Randmeere, die flach sind, da sie sich oberhalb des Festlandsockels befinden (z. B. Nordsee in Bezug auf den Atlantik) stellen die Hülle dar. Kern-Hülle Darstellungen/Repräsentationen sind dann eine geoinformatische Formalisierung entsprechender natürlich-sprachlicher geografischer Begriffe und Benennungen. Dem liegen kognitions-psychologische Sichtweisen zugrunde, die sich auf mentale Modelle im Sinne Johnson-Lairds beziehen. Insbesondere beim Design intuitiver Benutzerschnittstellen für Geoinformationssysteme finden diese Konzepte eine Anwendung.

In unserem Bericht stellen wir erste Ergebnisse dar, bei denen wir diese Darstellung und die entsprechende algorithmische Analyse auf krisenhafte Ereignisse und zugehörige Regionen anwenden. Standardmäßig werden Krisenregionen anhand administrativer Regionen (d. h. in Deutschland beispielsweise Gemeinden oder Landkreise) definiert. Dadurch kann die Auswirkung eines Krisenereignisses auf eine benachbarte Teilregion im ungünstigen Fall aus Versehen nicht hinreichend berücksichtigt werden. Beispielsweise hat sich die Corona-Pandemie-Krise auf Skiregio­nen ausgewirkt in Südtirol, aber auch benachbarten Regionen wie Ischgl im österreichischen Teil Tirols. Die geografische Nähe wird in einer Analyse vernachlässigt, die sich auf Länder und Gemeinden in einzelnen Ländern (in diesem Fall auf Italien allein) einschränkt. Als Verbesserungsansatz kann eine räumliche Analyse dienen, die primär auf der Nachbarschaft der Krisenereignis-Meldungen beruht und eine angemessene statistische Modellierung als Grundlage hat.

Unser neuartiger Ansatz einer Kern-/Hülle-Analyse ist interaktiv und legt algorithmisch anhand einer vom Benutzer vorselektierten Ereignisklasse und Regionsfokus die Grenze der Kernregion fest (als Intervalle von Längen- und Breitengeraden). Dies stellt eine algorithmische Entsprechung und Abstraktion typischer kognitiver Einteilungen dar, die menschliche Analysten in derartigen Fragestellungen aufgrund perzeptiver Gruppierungsmechanismen des menschlichen visuellen Systems vornehmen. Zur statistischen Modellierung und Analyse verwenden wir den im Folgenden beschriebenen sehr leistungsfähigen EM-Algorithmus.

Für das Jahr 2014 identifizierte Kern- und Hülleregion zu Boko...
Für das Jahr 2014 identifizierte Kern- und Hülleregion zu Boko Haram-Konfliktereignisssen.

Der EM-Algorithmus und der ­DCE-Algorithmus

In diesem Abschnitt geben wir eine kurze Übersicht über den EM-Algorithmus, der zur statistischen Modellierung und Identifikation der Kernregion von uns verwendet wird und eine Übersicht zum DCE-Algorithmus, den wir verwenden, um in der Karte die Vorhersage für eine zukünftige Kernregion darzustellen.

Der Erwartungs-Maximierungs-Algorithmus wurde 1977 von Arthur Dempster entwickelt. Es handelt sich dabei um einen allgemeinen Ansatz zur iterativen Berechnung von Maximum-Likelihood-Schätzungen mit unvollständigen Daten. Angenommen, wir haben ein Objekt mit einigen Eigenschaften, die Zufallswerte haben. Dieses Objekt unterliegt einer unbekannten Wahrscheinlichkeitsverteilung. Der Algorithmus arbeitet iterativ und führt in jedem Durchgang zwei Schritte aus, um die unbekannte Wahrscheinlichkeitsverteilung zu bestimmen. Im ersten Schritt, dem sogenannten Erwartungsschritt, werden die fehlenden Werte durch eine Regression geschätzt. Im zweiten Schritt, dem sogenannten Maximierungsschritt, wird die Wahrscheinlichkeitsfunktion maximiert. Das Verfahren läuft so lange, bis der Algorithmus konvergiert.

Die Diskrete Kurvenentwicklung (DCE-Algorithmus) von Longin Latecki ist eine Methode zur Vereinfachung von Umrissformen. Die Idee dahinter ist, dass die Vereinfachung von Formen in Karten verwendet wird, um unbedeutende Details von der Karte zu abstrahieren. Dadurch wird die kognitive Belastung des Kartenlesers reduziert. Darüber hinaus kann die Methode zur Vereinfachung der Darstellung von Informationen genutzt werden.

Die diskrete Kurvenentwicklung schafft es, das wahrnehmbare Erscheinungsbild einer Form zu erhalten und kleinere Verzerrungen zu vernachlässigen. Einzelne Knicke werden Schritt für Schritt iterativ entfernt.

Für das Jahr 2015 identifizierte Kern- und Hülleregion zu Boko...
Für das Jahr 2015 identifizierte Kern- und Hülleregion zu Boko Haram-Konfliktereignisssen.

Ergebnisse der Anwendung auf afrikanische Bürgerkriegsregionen

In einer ersten Anwendung unser Kern- und Hülle-Analyse von Krisenregionen benutzten wir die frei verfügbaren Daten des "Armed Conflict Location & Event Data Project" [ACLED], einer Nichtregierungsorganisation, die sich auf die Sammlung, Analyse und Kartierung von Konfliktdaten spezialisiert hat. ACLED kodiert die Daten und Orte aller gemeldeten politischen Gewalt- und Protestereignisse in über 100 Ländern in Echtzeit. Bild 3 zeigt dann die Punktwolke der gemeldeten Einzelereignisse der bewaffneten Konflikte mit Todesopfern in Bezug auf die Bürgerkriegspartei Boko Haram in Westafrika im Jahre 2014. Mittels der Kern- und Hülle-Analyse sind dabei die Events des Kernbereiches in blau markiert.

Aufgrund einer ähnlichen Verteilung im Folgejahr 2015 und der Robustheit des EM-Algorithmus erhält man eine ähnliche Kernregion in diesem Jahr 2015.

Aufgrund dieser ähnlichen Kernbereiche lässt sich eine automatische Prädiktion für das Jahr 2016 generieren (schwarzes Sechseck auf Bild 5). Aus der Differenz der Erwartungswerte der Verteilungen wird eine Konfidenzschwelle errechnet. Ist diese Konfidenzschwelle in einem Toleranzbereich, kann der Prädiktionsalgorithmus eine Vorhersage für das Folgejahr treffen. Dazu wird die konvexe Hülle der summierten Ereignisse beider Vorjahre mit einer Lateckis DCE-Algorithmus zu einem Sechseck abstrahiert und um die Konfidenzschwelle vergrößert. Diese Methode liefert auf Bürgerkriegsdaten aus dem Sudan und Kongo ebenfalls gute Ergebnisse mit der erwünschten kognitiven Plausibilität.

Für das Jahr 2016 aus den Daten der Jahre 2014 uns 2015 vorhergesagter...
Für das Jahr 2016 aus den Daten der Jahre 2014 uns 2015 vorhergesagter Konfidenzbereich/obere Schranke für den Kernbereich (in schwarz), der den tatsächlichen Kernbereich (in violett) enthält.

Erste Ergebnisse der Anwendung auf ­Pandemie-Teilregionen

In einer ersten Versuchsreihe haben wir unsere egg-yolk-Methodik auch auf Pandemie-Teilregionen angewendet. Die geplante Anwendung sieht dabei so aus, dass der Analyst (beispielsweise im Gesundheitsamt) mit seinem Hintergrundwissen eine Region auswählt in der ein Pandemie-Hotspot liegt. Das Verfahren segmentiert dann einen Kernbereich. Dieser Bereich kann dann analog zu der Anwendung auf Bürgerkriegsregionen in abschätzende Polygone umgewandelt werden.

Da wir noch am Anfang dieser Anwendung stehen, kann man hier lediglich erste positive Anfangserfolge vermelden. Beispielsweise sieht man in dem segmentierten Hotspot auf Bild 6, dass der Hotspot nur den rheinischen Teil Nordrhein-Westfalens umfasst und Ostwestfalen und das Münsterland nicht betroffen sind. Allerdings ist ein einzelner Landkreis im benachbarten Rheinland-Pfalz betroffen aus Sicht des maschinellen Lernens. Im nächsten Schritt werden wir uns bemühen räumlich feiner aufgelöste Daten zu bekommen (beispielsweise auf Gemeinde-Ebene statt auf Landkreis-Ebene) und unsere Ergebnisse mit Pandemie-Praktikern besprechen.

Everest Massiv
Everest Massiv
Quelle: Albert Hamzin, Vera Kamp, Reinhard Moratz

Zusammenfassung

Kern-Hülle Repräsentationen von Regionen (englisch egg-yolk representations) dienen der Darstellung von geografischen Regionen mit unscharfen Grenzen. Kern-Hülle Darstellungen/Repräsentationen sind eine geoinformatische Formalisierung entsprechender natürlich-sprachlicher geografischer Begriffe und Benennungen. In unserem Bericht stellen wir erste Ergebnisse dar, bei denen wir diese Darstellung und die entsprechende algorithmische Analyse auf krisenhafte Ereignisse und zugehörige Regionen anwenden. Standardmäßig werden Krisenregionen anhand administrativer Regionen (d. h. in Deutschland beispielsweise Gemeinden oder Landkreise) definiert. 

Dadurch kann die Auswirkung eines Krisenereignisses auf eine benachbarte Teilregion im ungünstigen Fall aus Versehen nicht hinreichend berücksichtigt werden. Beispielsweise hat sich die Corona-Pandemie-Krise auf Skiregionen in Südtirol ausgewirkt, aber auch benachbarten Regionen wie Ischgl im österreichischen Teil Tirols. Die geografische Nähe wird in einer Analyse vernachlässigt, die sich auf Länder und Gemeinden einzelner Länder (in diesem Fall auf Italien alleine) einschränkt. Als Verbesserungsansatz kann die in diesem wissenschaftlichen Bericht neu eingeführte räumliche Analyse dienen, die primär auf die Nachbarschaft der Krisenereignis-Meldungen beruht und eine angemessene statistische Modellierung als Grundlage hat. 

Literatur bei den Verfassern

Verwandte Artikel

Lagekarte zur Coronavirus Situation

Lagekarte zur Coronavirus Situation

Aktuelle Lagekarte zur Novel Coronavirus (COVID-19) Situation von Esri Deutschland | Schweiz

Corona: NRW-Dashboard zeigt Einfluss auf Wirtschaft und Zusammenleben

Corona: NRW-Dashboard zeigt Einfluss auf Wirtschaft und Zusammenleben

Die Corona-Pandemie stellt uns vor medizinische, soziale und ökonomische Herausforderungen. Das Bundesland Nordrhein-Westfalen hat auf die dynamische Lage reagiert – und stellt der Öffentlichkeit vielschichtige Antworten in visueller Form an...

Corona-Pandemie und ihre Auswirkungen

Corona-Pandemie und ihre Auswirkungen

Ende Dezember 2019 berichtete man im chinesischen Wuhan, einer Stadt in der Provinz Hubei mit elf Millionen Einwohnern, erstmals über eine mysteriöse Lungenkrankheit. Rasch stellten chinesische Wissenschaftler die Ursache fest: ein neues...

: