Workflow zur Erstellung von Trainingsdaten fur die KI-Gebaudeerkennung (fossgis2024)

Published: March 22, 2024, 10:45 a.m.

F\xfcr die KI-Geb\xe4udeerkennung in Luftbildern wird eine gro\xdfe Menge Trainingsdaten ben\xf6tigt. In der Landesvermessung Niedersachsen (LGLN) wurde daf\xfcr ein Workflow unter Verwendung verschiedener Open Source Tools entwickelt. Damit soll der manuelle Aufwand bei der Erstellung der Trainingsdaten m\xf6glichst minimiert werden und ein qualitativ hochwertiger Datensatz mit hoher r\xe4umlicher Abdeckung entstehen, der die Variabilit\xe4t der Geb\xe4ude in Niedersachsen ausreichend abbildet.\n\nAls DecSecOps-Team des Landesamtes f\xfcr Geoinformation und Landesvermessung Niedersachsen (LGLN) entwickeln wir eine Anwendung zur \u201eKI-Geb\xe4udeerkennung\u201c in Luftbildern. Das Ziel dieser Anwendung ist es, \xc4nderungen in den Geb\xe4udedaten im Amtlichen Liegenschaftskataster-Informationssystem (ALKIS) mit Hilfe von KI-detektierten Hausumringen zu finden. Zum Trainieren der KI-Modelle werden Trainingsdaten aus Niedersachsen verwendet. Diese Trainingsdaten bestehen aus 4-Kanal-Orthophotos (DOP) und normalisierten Oberfl\xe4chenmodellen (nDOM), sowie Hausumringen als sogenannte \u201eLabels\u201c.\n\nEine manuelle Erstellung und Korrektur dieser Labels ist sehr aufwendig. Aus diesem Grund wurde ein Workflow entwickelt, der aus mehreren Schritten besteht und bereits vorhandene Daten nutzt. Er erm\xf6glicht es Daten in ausgew\xe4hlten, repr\xe4sentativen Bereichen passend zum jeweiligen Luftbild zu editieren. Als Grundlage f\xfcr diese Labels werden dabei die Geb\xe4ude aus ALKIS verwendet. Dies beruht auf der Annahme, dass der Geb\xe4udebestand in den ALKIS-Daten von Niedersachsen gr\xf6\xdftenteils korrekt ist. Durch eine interaktive Web-GIS-Anwendung in einem Jupyter-Notebook lassen sich mit wenigen Mausklicks Bereiche der Luftbilder anzeigen und mit den vorhandenen ALKIS-Daten \xfcberlagern. Somit k\xf6nnen die Daten schnell gesichtet und Bereiche identifiziert werden, wo die Geb\xe4ude aus ALKIS und das jeweilige Luftbild bereits gut zusammen passen. Diese Bereiche sind 400\xd7400 m bzw. 2000\xd72000 Pixel gro\xdf. Wir bezeichnen sie als \u201eTrainings-Patches\u201c. Die Metadaten dieser \u201eTrainings-Patches\u201c werden in einer Datenbank gesammelt und bilden einen Pool von m\xf6glichen Trainingsdaten.\n\nTeilweise passen die ALKIS-Geb\xe4ude nicht zum Luftbild: Es kommt vor, dass Neubauten oder Abrisse noch nicht erfasst sind oder Geb\xe4ude bzw. Teile von Geb\xe4uden durch Vegetation verdeckt sind. Damit f\xfcr das KI-Training nur Labels zum Einsatz kommen, die zu den Luftbildern passen, ist es erforderlich, die vorhandenen Geb\xe4udeumringe zu bearbeiten. Dazu nutzen wir QGIS und die darin vorhandenen M\xf6glichkeiten zum Editieren von Polygonen. Diese Aufgabe ist der aufwendigste Teil des Workflows und wird von einem \u201eLabel-Team\u201c im LGLN durchgef\xfchrt. Die Herausforderung besteht hier darin, die Daten der \u201eTrainings-Patches\u201c, bestehend aus Bildausschnitt im Luftbild bzw. nDOM sowie den zu editierenden ALKIS-Polygonen in den QGIS-Client der bearbeitenden Person zu laden. Die visuelle Kontrolle der Daten und die Bearbeitung der Polygone kann auch offline erfolgen. Nach der manuellen Bearbeitung der Polygone m\xfcssen die Daten in eine Datenbank geschrieben werden. Daf\xfcr wurde ein auf FastAPI-basierender Microservice gebaut, der die Datenbereitstellung und Kommunikation zwischen QGIS-Client und Datenbank durchf\xfchrt.\n\nIn dieser Demo wird der beschriebene Workflow f\xfcr die Trainingsdaten-Erstellung vorgestellt und die verwendeten Open Source Tools mit ihren interaktiven GIS-Funktionalit\xe4ten demonstriert.\nabout this event: https://pretalx.com/fossgis2024/talk/7S3JKU/