Historische Topographische Karten, GIS und künstliche Intelligenz (KI): Emilie Lüdicke verbindet in ihrer Bachelorarbeit Vergangenheit, Gegenwart und Zukunft. Im Interview spricht sie über unberechenbare Algorithmen, menschliche Präzision und die Grenzen von KI-Modellen. Zudem hat sie ein paar Tipps für Studierende parat.
Emilie, um was geht es in deiner Bachelorarbeit (BA) zu KI-Modellen?
Ich wollte herausfinden, wie sich Siedlungsgebiete in historischen Topographischen Karten (TK) – möglichst optimal – automatisiert erkennen lassen. Für diesen Prozess testete ich verschiedene, in ArcGIS Pro implementierte und bereits vortrainierte Deep-Learning-Algorithmen (DL-Algorithmen). Eigentlich geht es also um die Vereinfachung von Prozessen mithilfe von KI. Der Titel der Arbeit lautet in voller Länge übrigens: «Evaluierung vortrainierter KI-Algorithmen zur automatisierten Erkennung von Siedlungen in historischen Topographischen Karten».
Das klingt komplex.
Naja, Technik halt. (lacht) Ich befasste mich mit Rasterdaten und Tabellen, mit der Funktionsweise Neuronaler Netze und natürlich mit verschiedenen KI-Modellen – mit folgender Ausgangslage:
Historische, von Hand gezeichnete Karten enthalten viele Informationen für die Analyse der Siedlungsentwicklung. Allerdings sind sie nur auf Papier oder als digitales Bild im Staatsarchiv verfügbar. Die manuelle Digitalisierung einzelner Objekte ist unverhältnismäßig aufwändig. Dementsprechend existieren die Daten grundsätzlich nicht in dieser Form. Mich interessierte also auch, wie KI Effizienz und Qualität der Erfassung steigern kann.
Zusammenfassung der BA
KI-Modelle im Test
Emilie Lüdicke befasste sich in ihrer BA mit der automatisierten Erkennung von Siedlungen in historischen Topgraphischen Karten (TK) durch KI. Sie testete und verglich verschiedene vortrainierte und in ArcGIS Pro integrierte Modelle. Anschließend bewertete sie diese aufgrund ihrer Leistung. Basis für die Tests war eine TK im Bayerischen Wald im Maßstab 1:25’000 aus dem Jahr 1983.
Die Arbeit umfasst im Wesentlichen folgende Schritte:
- Auswahl geeigneter TK
- manuelle Digitalisierung von Siedlungen auf dem Kartenblatt
- Training verschiedener Modelle anhand der Trainingsgebiete mit unterschiedlichen Einstellungen
- Dokumentation der Leistung der einzelnen Modelle
- Genauigkeitsbewertung visuell sowie anhand zufälliger Punkte und Konfusionsmatrix
- Transferstudie mit weiteren Zeitständen
- Diskussion
Fazit: Einzelne vortrainierte KI-Modelle eignen sich mit einer Genauigkeit von 87 Prozent grundsätzlich für die beschriebene Aufgabe. Ein möglichst großer Trainingsdatensatz und leistungsfähige Hardware verbessern die Genauigkeit.
Mögliche Einsatzgebiete: Die Informationen aus historischen TK ermöglichen die zeitliche Analyse der Siedlungs- und Landschaftsentwicklung. Zudem können sie helfen, kausale Zusammenhänge zwischen Entwicklungsanalysen und einem ursprünglich definierten Ziel zu erkennen.
Mögliche Beispiele
- Auswirkungen des Infrastruktur-Ausbaus auf Wanderkorridore für Wildtiere
- Zusammenhang zwischen Siedlungsbau und Themen wie Lebensqualität, Durchschnittseinkommen, Geburtenrate, Kriminalität, Artenrückgang usw.
Welches sind die wichtigsten Erkenntnisse?
Es braucht Geduld – und ganz viele Tests. Die Erkennung von Siedlungen funktioniert, trotz nach wie vor begrenzter Genauigkeit. Aber KI hilft grundsätzlich. Und zwar auch dann, wenn die Karte nur in Graustufen vorliegt. Das Verhalten der Algorithmen lässt sich kaum vorhersagen, eine akribische Dokumentation der vorgenommenen Einstellungen ist essenziell.
Wo sind die Grenzen von KI in diesem Bereich?
Eigentlich nur bei der Datengrundlage bzw. der Erstellung der Trainingsdaten. Eine einheitliche Digitalisierung ist nicht möglich, weil Menschen involviert sind. In historischen Karten gibt es kein Objekt «Siedlungsgebiet».
Grundsätze wurden zwar anhand der aktuellen im ATKIS verwendeten Kriterien festgelegt. Was alles zu einem Siedlungsgebiet zählt, ist jedoch schlussendlich Ermessenssache. Eine sehr genaue Erfassung der Grenzen wie z.B. durch Abstandsmessungen zu Gebäuden würde den Zeitaufwand pro Objekt unverhältnismäßig in die Höhe treiben. Zudem braucht es möglichst viele digitalisierte, mit großem Zeitaufwand generierte Trainingsdaten.
Erkennbare Leistungsunterschiede der KI-Modelle: erkannte Siedlungsflächen (blau) von zwei verschiedenen Modellen gegenüber den manuell digitalisieren «Soll»-Umgrenzungen (rot) (Darstellung: Emilie Lüdicke in ArcGIS Pro)
Was bringt die Zukunft?
Eine Möglichkeit ist eine vollumfassende Segmentierung der Objekte. Ich denke da unter anderem an Straßen oder Waldgebiete – je nach Informationsgehalt der TK. Die Präzision bleibt ein Thema. Jede Karte wird durch unterschiedliche Personen von Hand digitalisiert. Daher ist eine Abschätzung schwierig, wie «genau» die Segmentierung tatsächlich vorgenommen werden kann.
Um Entwicklungsanalysen umzusetzen, braucht es Modelle für jeden Zeitstand, also den entsprechenden Jahrgang der Karte. Ich testete zum Beispiel die Übertragbarkeit des besten Modells auf Topographische Karten aus den Jahren 1972 und 1993. Das funktionierte teilweise gut, aber eine vollständige Anpassung der Modelle wäre sinnvoll gewesen.
Generell können Informationen aus historischen TK bei der zeitlichen Analyse der Siedlungs- und Landschaftsentwicklung oder beim Erkennen von kausalen Zusammenhängen helfen. Die KI könnte eine umfassende Datengrundlage schaffen.
Wie kamst du auf das Thema?
Eigentlich wollte ich in Zusammenarbeit mit der Nationalparkverwaltung Bayerischer Wald eine Analyse der Siedlungsentwicklung rund um den Nationalpark vornehmen. Sie wäre die Basis für eine Abschätzung der Auswirkungen des Infrastrukturausbaus auf potenzielle Wanderkorridore für Wildtiere gewesen. Allerdings fehlten GIS-Daten für den besonders interessanten Zeitraum zwischen 1970 und 2000.
Welche Herausforderungen gab es bei der Umsetzung der BA?
Einerseits beschäftigte mich die Erstellung der Trainingsdaten und die Vergleichbarkeit der verschiedenen Zeitstände. Andererseits war da die Unvorhersehbarkeit der Algorithmen. Das erste Modell erkannte beispielsweise gar keine Siedlungsflächen.
Nach dem Bachelor (dual) in Vermessung und Geoinformatik absolviert Emilie Lüdicke nun ihr Masterstudium in Geodatentechnologie an der Technischen Hochschule Würzburg-Schweinfurt. Ihre berufliche Zukunft sieht sie im Bereich Umweltmonitoring bzw. Katastrophenmanagement – eventuell in Verbindung mit KI/Deep Learning.
Was empfiehlst du Studierenden, die sich für eine BA mit Bezug zu GIS/KI interessieren?
Wichtig ist eine gute Datengrundlage in Bezug auf Qualität und Quantität. Es lohnt sich, genügend Zeit in die Erstellung der Trainingsdaten zu investieren und die Daten ggf. künstlich zu erweitern (Data Augmentation).
Zudem hilft eine sehr leistungsfähige Grafikkarte zwar, aber man sollte sich von der vorhandenen Hardware nicht abhalten lassen, es zu versuchen. Im Laufe meiner Arbeit ließ sich feststellen, dass gewisse Einstellungen wie eine größere Batch-Size für meine Aufgabenstellung tendenziell zu höheren Genauigkeiten führten, und diese sind nun einmal von der Grafikkarte abhängig.
Ich würde anraten, sich bei der Hochschule oder Uni zu erkundigen, ob die Institution einen PC-Raum mit leistungsfähiger Hardware besitzt und diese für die Arbeit genutzt werden kann. KI ist nur ein Werkzeug. Es ist deshalb unerlässlich, mit Verstand zu arbeiten und die Genauigkeitsbewertung kritisch zu hinterfragen sowie das Resultat auch visuell zu beurteilen. Besonders wichtig ist auch eine akribische Dokumentation der eigenen Vorgehensweise, Einstellungen und Tests. Man muss viel ausprobieren und darf sich auf keinen Fall entmutigen lassen.
“Wichtig für eine BA im Bereich GIS/KI: eine gute Datengrundlage, kritisches Denken und vor allem Durchhaltevermögen. Denn man muss viele Dinge ausprobieren.”
Emilie Lüdicke, Masterstudentin Geodatentechnologie
Und zum Schluss: Was fasziniert dich an GIS?
Karten und Satellitenbilder, die Sicht auf unsere Welt aus der Vogelperspektive – das ist unglaublich spannend. GIS ist eine wichtige Orientierungshilfe in allen Fachbereichen.
Vielen Dank für das Gespräch, Emilie.
Sucht ihr ein Thema für eure BA oder MA im GIS-Bereich? Schreibt uns: education@esri.de
Das Interview führte Cello Rüegg.
Cello Rüegg
Über das Esri-Universum kam ich in Kontakt mit GIS – und ich war sofort fasziniert von der Geomatik. Zudem liebe ich Storytelling. Als Redakteur schreibe ich deshalb gerne über technische Innovationen und zukunftsgerichtete Technologien sowie über Menschen und ihre Geschichte(n). Dabei helfen mir meine Aus- und Weiterbildungen, unter anderem ein MAS Marketing Services and Management der Hochschule Luzern.