Modellierung von Fuzzyness / Wobbliness in Geodaten (fossgis2024)

Published: March 20, 2024, 3:30 p.m.

Insbesondere bei der Bereitstellung von Open Data nach den FAIR-Prinzipien zur bestm\xf6glichen Offenheit und Transparenz ist die Angabe von Unsicherheiten und Zweifeln f\xfcr den Nachnutzenden von enormer Bedeutung. Bei interdisziplin\xe4rer Zusammenarbeit ist dieser Aspekt umso wichtiger. In diesem Paper werden f\xfcnf data-driven interdisziplin\xe4re Use-Cases f\xfcr den Umgang mit und die Modellierung von vagen und unsicheren Georeferenzen aus dem Bereich der Arch\xe4ologie und Geowissenschaften vorgestellt.\n\n# Einleitung\n\nGeod\xe4tinnen und Geod\xe4ten wissen, dass jede Bestimmung einer L\xe4nge, Winkel, bzw. eine Koordinate mit Unsicherheiten und/oder statistischen Kenngr\xf6\xdfen wie Standardabweichungen, 3-Sigma-Regel etc. belegt ist. Insbesondere bei der Bereitstellung von Open Data nach den FAIR-Prinzipien [1] (Findable, Accessible, Interoperable und Reusable) zur bestm\xf6glichen Offenheit und Transparenz ist die Angabe von Unsicherheiten und Zweifeln f\xfcr den Nachnutzenden von enormer Bedeutung. Bei interdisziplin\xe4rer Zusammenarbeit ist dieser Aspekt umso wichtiger. Insbesondere in den Geistes- und Kulturwissenschaften (Humanities / Cultural Heritage) und auch Geowissenschaften (wie z.B. Geologie) spielen Geodaten eine gro\xdfe Rolle. Georeferenzierungen sind Teil der t\xe4glichen Arbeit und stellen ein Herausforderung bei der Bereitstellung von Open Geodata nach den FAIR-Prinzipien dar. Arch\xe4ologische und geowissenschaftliche Forschung muss bei der Datenmodellierung mit Zweifeln wie Fuzzyness und Mehrdeutigkeiten umgehen. Dies geschieht insbesondere bei der Georeferenzierung [2;3]. Um jedoch reproduzierbare und verst\xe4ndliche Daten f\xfcr die Wiederverwendung zu schaffen und gleichzeitig die Datenqualit\xe4t arch\xe4ologischer Daten zu gew\xe4hrleisten, m\xfcssen diese Zweifel und Unklarheiten offengelegt werden [4]. Dies ist auch f\xfcr die FAIRifizierung von Daten wichtig, die ein gro\xdfer Teil der Nationalen Forschungsdateninfrastruktur (NFDI) ist [5;6]. In diesem Kontext m\xfcssen insbesondere Vagheiten und Unsicherheiten f\xfcr die Arbeit mit und Bereitstellung von Geodaten modelliert werden [7-9]. F\xfcr die Verkn\xfcpfung von Daten und die FAIRifizierung ist jedoch die von Berners-Lee [10] vorgeschlagene graphbasierte Modellierung als Linked Open Data (LOD) die Methode und Technik der Wahl. Aufgrund der gro\xdfen Vielfalt der Forschungsbereiche ist eine interdisziplin\xe4re, allgemein verst\xe4ndliche Modellierung von Unsicherheiten und Vagheiten in Geodaten eine gro\xdfe Herausforderung.\n\nIn diesem Paper werden f\xfcnf data-driven interdisziplin\xe4re Use-Cases f\xfcr den Umgang mit und die Modellierung von vagen und unsicheren Georeferenzen (am Beispiel von Fundstellen) auf der Grundlage von Literatur als LOD aus dem Bereich der Arch\xe4ologie und Geowissenschaften vorgestellt. Die Anwendungsf\xe4lle implementieren drei Modellierungsstrategien [11] unter Verwendung von Wikidata, Linked Open Data sowie einer Ontologie, modelliert in OWL [12] und Wikibase [13] und nehmen zudem M\xf6glichkeiten in Open Street Map unter die Lupe.\n\n# Use Cases\n\n## Use Case A\n\nOgham-Steine sind Monolithen mit der fr\xfchmittelalterlichen irischen Ogham-Primitivschrift, die vor allem auf der Insel Irland und im westlichen Teil Gro\xdfbritanniens zwischen dem 4. und 9 Jhd. n. Chr. errichtet wurden. Die meisten Steine befinden sich nicht mehr an ihrem urspr\xfcnglichen Standort, was f\xfcr die kartografische Erfassung wichtig ist und die Bestimmung ihrer urspr\xfcnglichen Funktion erschwert [14]. Ogham-Steinfunde werden in verschiedenen Katalogen wie B\xfcchern (z. B. 14-16), Online-Datenbanken (z. B. das CISP-Projekt) oder Online-Repositorien (z. B. Ogham in 3D) erw\xe4hnt. Diese Quellen liefern Informationen in unterschiedlicher Granularit\xe4t: Townlands, Beschreibungen und Koordinaten in WGS84/GPS oder irischen GRID-Referenzen. Zudem werden ganze Biographien von Geo-Locations dort erfasst. Wie k\xf6nnten diese Ungenauigkeiten und Unsicherheiten in Community-Hubs wie Wikidata oder Open Street Map abgebildet werden? Ein Beispiel hierf\xfcr ist CIIC 81, der im Stone Corridor des University College Cork (UCC) steht und mit Hilfe von WIkidata [17] und Open Street Map modelliert wurde, vgl. auch Wikidata Q106680733 [18] und OSM Node 11071361392 [19].\n\n## Use Case B\n\nDie Dissertation von S. Baars besch\xe4ftigt sich mit der Silberm\xfcnzpr\xe4gung von Kroton, einer ach\xe4ischen Kolonie in S\xfcditalien, vom 6. bis 3. Jh. v. Chr. Dabei kommen verschiedene numismatische Methoden zum Einsatz, darunter auch die der Hortfundanalyse. S\xe4mtliche Fundorte der untersuchten Horte sind nicht exakt georeferenziert (z. B. anhand der Dokumentation von Grabungsberichten). Die ermittelten Fundorte sind aus der Literatur abgeleitet und weisen unterschiedliche Pr\xe4zisionsgrade hinsichtlich der geografischen Lage auf. Eine recht genaue Angabe bietet z. B. der Hortfund von "Tarent 1938" (IGCH 1902) in der "via Oberdan" in Tarent. Hinweise auf eine Verortung des Fundes im modernen und/oder antiken Stadtkerne liefern z. B. "Paestum 1937" (IGCH 1925) oder "Strongoli 1955" (IGCH 1885; in der Gegend der antiken Stadt Petelia). Teils sind lediglich Hinweise auf gr\xf6\xdfere Regionen vorhanden, z. B. wurden Hortfunde im Jahr 1864 in "Kalabrien" (IGCH 1873) oder 1964 in "S\xfcditalien" (IGCH 1894) gefunden oder stammen von der "Ionischen K\xfcste\u201d (IGCH 1916). Die Modellierung dieser Fundorte wurde mittels RDF und Wikibase durchgef\xfchrt. Ein Beispiel hierf\xfcr ist der Fundort \u201cFiume Esaro 1967 (gennaio)\u201d, der die fuzzy-sl Wikibase ID Q67 [20] und URI site_3003 [21] f\xfchrt.\n\n## Use Case C\n\nEin Teil der Dissertation von F. Schenk befasst sich mit den Nachweisen des Ascheregens des Campanian Ignimbrite (CI) in Mitteleuropa; ein trachytischer Tuff aus einem sp\xe4tpleistoz\xe4nen vulkanischen Ereignis [22;23], der aus der Region Kampanien (Italien) stammt. Vor etwa 40.000 Jahren fand der gr\xf6\xdfte Ausbruch des CI in den Phlegr\xe4ischen Feldern statt. In diesen Tagen ist dies wieder von erh\xf6htem Interesse, da ein weiterer Ausbruch des Supervulkans bevorstehen k\xf6nnte [24]. Nach dem Ausbruch bedeckten massive Glasablagerungen aus dem CI-Ausbruch gro\xdfe Teile des osteurop\xe4ischen Kontinents; vulkanisches Material des CI findet sich h\xe4ufig in isolierten Wasserscheiden und T\xe4lern. Diese Fundorte sind in mehreren Papern festgehalten, z.B. (a) genaue Koordinaten, z.B. "[...] Lago Grande di Monticchio in S\xfcditalien (40\xb056N, 15\xb035\u2032E)" [25], (b) Verweise auf St\xe4dte, z. B. Neapel [26] (c) Verweise auf Regionen, z. B. Altopiano delle Murge [27] oder (d) Verweise auf H\xf6hlen und arch\xe4ologische St\xe4tten, z.B. die Crvena Stiljena-H\xf6hle in Montenegro [28]. Dabei stellt sich die Frage wie diese verschiedenen Granularit\xe4ten von Fundorten modelliert und auf einen WKT-Punkt vereinfacht werden? Ist die Verwendung von \u201cGoogle Maps\u201d oder \u201cgeohack by toolforge\u201d ausreichend? Diese Modellierungen wurden mittels RDF und Wikibase durchgef\xfchrt. Ein Beispiel hierf\xfcr ist der Fundort in der \u201cCrvena Stiljena-H\xf6hle\u201d, der die URI cisite_51 [29] f\xfchrt.\n\n## Use Case D\n\nInsbesondere in M\xfcnzfund-Datenbanken wie z.B. Antike Fundm\xfcnzen in Europa (AFE) werden Fund-Koordinaten hinterlegt. Zu diesem Fundort kann angegeben werden, ob die Koordinaten pr\xe4zise sind oder auch nicht. Ein Fundort kann hier z.B. ein Gr\xe4berfeld, eine Grabungsstelle oder ein Einzelfund eines Sondeng\xe4ngers sein. Alle Fundm\xfcnzen mit allen Details wie bei einer Grabung einzugeben ist weder umsetzbar (da die Details oft fehlen) noch zielf\xfchrend, da die Eingabe zu viel Zeit und die Oberfl\xe4che zu un\xfcbersichtlich werden w\xfcrde. Um die Fundorte vor privaten Sondeng\xe4ngern zu sch\xfctzen, werden Fund-Koordinaten jedoch durch AFE nur auf einer h\xf6heren Ebene (Place) ver\xf6ffentlicht. Hierbei wird m\xf6glichst mit dem einem Ortsverzeichnis, hier: iDAI.gazetteer [30], verbunden. Dies kann jedoch zu Problemen f\xfchren, wenn Fundm\xfcnzen in verschiedenen Systemen eingetragen sind. Da aber das Vorgehen zum Verschleiern der Fund-Koordinaten \xfcber die Systeme nicht vereinheitlicht wurde, k\xf6nnen diese nur bedingt genutzt werden, um Duplikate zu identifizieren. Werden diese Duplikate nicht erkannt, kann dies zu fehlerhaften Auswertungen von Daten aus verschiedenen Quellen f\xfchren.\n\n## Use Case E\n\nDie M\xfcnzst\xe4tte einer M\xfcnze ist nicht immer eindeutig, man hat nicht immer einen Namen dazu und wei\xdf auch nicht, wo diese lag. Wenn man jedoch M\xfcnzen einheitlich einer soche M\xfcnzst\xe4tte zuordnen m\xf6chte, wird dies in nomisma.org durch sogenannte "uncertain mints" verwirklicht. Man wei\xdf also nicht, wo die Mints waren und ob diese nicht vielleicht auch eine andere benannte Mint sein k\xf6nnten. Nomisma listet bei der Suche nach \u201cuncertain\u201d f\xfcr M\xfcnzst\xe4tten immerhin 232 Treffer auf, z.B. [Uncertain Mint 129](http://nomisma.org/id/uncertain_129_sco). In der RDF-Modellierung zu dieser wird die Unsicherheit noch nicht mit modelliert. Daher wurden in zwei Masterarbeiten [31;32] acht M\xf6glichkeiten untersucht, wie Unsicherheiten in RDF modelliert werden k\xf6nnen.\n\n# Referenzen\n\n[1] https://doi.org/10.1038/sdata.2016.18\n[2] https://www.adwmainz.de/fileadmin/user_upload/digitale-akademie/graphentechnologien/Bruhn-Unold-Unsicherheit_Graphdatenbanken.pdf \n[3] https://doi.org/10.5281/zenodo.6380914\n[4] http://dx.doi.org/10.15496/publikation-87762 \n[5] https://doi.org/10.5281/zenodo.5654897\n[6] https://doi.org/10.5281/zenodo.5849841\n[7] https://zfdg.de/sb004_004 \n[8] https://doi.org/10.1023/A:1016740830286 \n[9] https://doi.org/10.5281/zenodo.3252392\n[10] https://www.w3.org/DesignIssues/LinkedData.html\n[11] https://codeberg.org/ResearchSquirrels/fuzzy-sl \n[12] https://github.com/research-Squirrel-Engineers/fuzzy-sl-ontology \n[13] https://fuzzy-sl.wikibase.cloud/\n[14] Macalister, RAS. (1945): Corpus Inscriptionum Insularum Celticarum. Vol. I. Dublin: Stationery Office.\n[15] MacManus, D. (1997): A Guide to Ogam. Maynooth Monographs 4. Maynooth: An Sagart.\n[16] Ziegler, S. (1994): Die Sprache Der Altirischen Ogam-Inschriften. G\xf6ttingen: Vandenhoeck and Ruprecht.\n[17] https://codeberg.org/ResearchSquirrels/fuzzy-sl/src/branch/main/wikidata/fsl_wikidata_ogham_stone_exsitu_onsitesurvey.png \n[18] http://www.wikidata.org/entity/Q106680733 \n[19] https://openstreetmap.org/node/11071361392\n[20] https://fuzzy-sl.wikibase.cloud/wiki/Item:Q67 \n[21] https://research-squirrel-engineers.github.io/croton-geo/site_3003/ \n[22] https://doi.org/10.1007/s007100170010 \n[23] https://doi.org/10.1007/bf02597680 \n[24] https://t1p.de/vtxub \n[25] https://doi.org/10.1016/s1040-6182(00)00066-5 \n[26] https://doi.org/10.1016/s0377-0273(96)00063-7 \n[27] https://doi.org/10.1016/j.jvolgeores.2007.10.007 \n[28] https://doi.org/10.1016/j.yqres.2011.02.005 \n[29] https://research-squirrel-engineers.github.io/campanian-ignimbrite-geo/cisite_51/index.html \n[30] https://gazetteer.dainst.org \n[31] https://t1p.de/fsk91 \n[32] https://t1p.de/yh6us\nabout this event: https://pretalx.com/fossgis2024/talk/VTYCM7/