Semantisches Web und Umweltinformatik

11 Mai, 2008

Neben dem Hype um Web2.0 ist der Begriff des Semantic Web in vieler Munde. Dabei werden die beiden Entwicklungen teilweise gegeneinander ausgespielt, stehen aber eher nebeneinander und befruchten sich gegenseitig.

Bei dem Semantischen Web geht es darum, die Inhalte, die im Internet veröffentlicht werden, auch für Maschinen verständlich zu machen. Dabei geht es tatsächlich um ein „verständlich machen“, nicht um ein zugänglich machen. Das Ziel ist, dass Maschinen eine Seite nach ihrem Inhalt sinnvoll erfassen können und so ein Hilfsmittel zur inhaltlichen Suche nach Informationen werden. Es sollen intelligente Ergebnisse für die Suche geliefert werden, nicht 2.983.293 Treffer. Sie sollen genau das widerspiegeln, was der Suchende gemeint hat, auch ohne, dass die Begriffe, nach denen gesucht wurde auf der Seite auftauchen müssen.

Dies wird über Ontologien versucht, bei denen im Stile eines einfachen Satzes (Subjekt – Prädikat – Objekt) Verbindungen und Beziehungen zwischen Objekten hergestellt werden, die zu einem Netzwerk an Eigenschaften zusammengeschlossen werden. Als simples Beispiel kann vielleicht die Ontologie herhalten: „Ein Hund ist ein Säugetier“. Wenn nun eine Anfrage abgesetzt wird: „Was definiert einen Hund?“, kann der Computer die Anfrage inhaltlich „verstehend“ verarbeiten und sämtliche Eigenschaften eines Hundes mit ausgeben, eben auch die, dass ein Hund ein Säugetier ist, ohne dass das explizit in der Suchanfrage gesucht wurde. Über das dichte Netz an Ontologien kann eine Gewichtung erstellt werden, welche Information die vermutlich relevanteste ist, damit sie an erster Stelle ausgegeben wird. Es wird ersichtlich, dass hier eine spannende und enge Zusammenarbeit von Linguisten und Informatikern gefragt ist.

Um mit Ontologien arbeiten zu können, braucht es natürlich Metadaten (also Informationen über Daten), um Ontologien erstellen zu können bzw. sie sinnvoll anwenden zu können. Diese müssen entweder manuell (was in den meisten Fällen nicht stattfinden würde, weil Mehrarbeit) oder zumindest halbautomatisch erstellt werden. Es laufen einige Forschungen in die Richtung, Metadaten aus den entsprechenden Internetseiten automatisch zu generieren. Die dazu genutzte Auszeichnungssprache RDF beruht auf der XML-Technologie.

Ein Beispiel: Nachrichten sind sehr häufig geolokalisiert sprich einem (oder mehreren) bestimmten Ort zugehörig. Diese können automatisch aus dem Text gezogen, als Metadaten veröffentlicht und über bestimmte Schnittstellen auf einem WebGIS wie GoogleMaps o.ä. ausgegeben werden. Es gibt eine ganze Menge Forschung zu dem „Geospatial Web„. Sehr lesenswert dazu ist Scharl, A./Tochtermann, K (Hrsg.)(2007): The Geospatial Web, London

Für die Umweltinformatik ergeben sich viele Aufgaben und Fragen aus den Potentialen des Semantic Web.

– Wie können aus umweltrelevanten Daten (halb-)automatisch Metadaten generiert werden?

– Gibt es bestimmte Anforderungen umweltrelevanter Daten an Metaangaben?

– Wie können die vorhandenen „offiziellen“ fragmentierten Datenbestände zusammengeschlossen und gecrawlt werden?

– Dazu generell: Wie erreichen wir das „Deep Web„, dass sich in Datenbanken verbirgt und nur bei den entsprechenden Anfragen zum Vorschein kommt?

– Wie können die Ergebnisse aus der GeospatialWeb-Forschung in andere Domänen übertragen werden? Erste Versuche in Form von Wissenslandkarten gibt es hier bereits.

Für den Umweltbereich in Deutschland versucht das PortalU eine solche semantische Suche bereit zu stellen. Dort können Suchabfragen abgesetzt und räumlich, zeitlich und natürlich inhaltlich eingegrenzt werden. Das klappt schon einigermaßen gut, es werden die Datenbestände vieler Behörden durchgesucht und nach Relevanz ausgegeben. Die Technik dahinter ist beschrieben und frei verfügbar. Die Ergebnisse sind auch über einen Webservice abrufbar. Schade ist, dass nur auf die Originalseiten verlinkt wird und die Daten dort bleiben. So kann auch über das PortalU nicht auf die Daten z.B. von www.hamburger-luft.de zugegriffen werden, damit sie automatisch (z.B. in Mashups) weiterverarbeitet werden können.


Potentiale von Web2.0 für die Umweltinformatik

2 Mai, 2008

So lautet der wohlklingende Titel meiner Diplomprüfung, die ich als nächstes zu absolvieren habe. Die Einträge im Blog werden also erst mal etwas mehr in diese Richtung gehen.

Ich habe mich früher schon mit dem Entstehen und Abgrenzen von wissenschaftlichen Disziplinen beschäftigt und hier stellt sich ganz akut wieder die Frage: Was ist eigentlich Umweltinformatik? Was will sie? Was gehört dazu? Was nicht mehr?

Nach meinem bisherigen Erkenntnisstand und Recherchen in Texten und auf Internetseiten der entsprechenden Institute sind die Selbstverständnisse vielfältig. Es geht um die Steigerung der Ressourceneffizienz, dazu können Stoffstromanalysen oder auf neudeutsch Life Cycle Assessments durchgeführt werden. Betriebliche Umweltinformationssysteme (BUIS) bzw. ERPs werden aufgebaut, um eine Umweltrechnungslegung zu ermöglichen. Die Modellierung nimmt einen wichtigen Stellenwert ein. Dabei werden (diskrete und kontinuierliche) Simulationen durchgeführt, um komplexe Probleme zu vereinfachen und greifbarer zu machen. Dies geschieht häufig über eine Visualisierung von (Umwelt-)Daten zum Beispiel auch über Geografische Informationssysteme (GIS). Damit hat die Umweltinformatik nicht zuletzt die Aufgabe, Kommunikationsprozesse zu fördern und Werkzeuge bereitzustellen, Menschen zu helfen, kreativ und kommunikativ mit dem Computer arbeiten zu können.

Eben hier stellt sich die Frage danach, was denn nun alles noch zur Umweltinformatik gehört und was nicht mehr. Fällt alles, sobald es einen Raumbezug hat, in den Kompetenzbereich der Umweltinformatik? Wohl kaum, nicht jede Adresse eines Pizzalieferanten ist für die UI relevant, kann aber georeferenziert werden. Was ist hier die Abgrenzung zur Geoinformatik?
Hat mit Google Earth die Umweltinformatik Einzug in (fast) jeden Haushalt gehalten? Mit diesem „GIS-für-alle-Tool“ kann sich jeder umweltrelevante Informationen auf seinen Bildschirm ziehen. Aber ist es damit ein Werkzeug der UI?

Zur Zeit denke ich in die Richtung, dass eine wesentliche Komponente der UI im Gegensatz zu anderen angewandten Informatiken die kommunikative Komponente ist. Computer sollen genutzt werden, um zu „Strukturieren, Analysieren, Konzipieren, Kooperieren, Kommunizieren und Kontrollieren“ (http://umweltinformatik.uni-lueneburg.de/Portal/index_d.htm 2.5.08). Die UI hat einen interdisziplinären Ansatz, der die Sichtweisen verschiedener Disziplinen auf ein Problem einbinden möchte. Auf diese Weise sollen komplexe Zusammenhänge beleuchtet und dargestellt werden können. Hier ist auf jeden Fall eine Schnittstelle zum Web2.0 vorhanden, die in einem späteren Eintrag noch einmal beleuchtet werden soll. Mit dem Einbinden von verschiedenen Nutzern kommt auch eine Vielzahl von Perspektiven dazu.

Die Unklarheit in der Abgrenzung, was Umweltinformatik ist und was nicht mehr bleibt aber noch größtenteils.