Die Rolle von Daten in der Umweltinformatik

4 Mai, 2008

Um die These vorweg zu stellen:

Daten sind das Lebenselixier der Umweltinformatik.

Bei der Beschäftigung damit, was denn UI eigentlich ist oder möchte ist mir aufgefallen, dass die UI als Teil der angewandten Informatik vor allem Werkzeuge bereitstellt, mit denen Daten manipuliert werden können, um komplexe Sachverhalte handhabbar zu machen und Entscheidungen treffen zu können.
Egal, ob es ein Modellierungs-, Visualisierungs- oder Simulationswerkzeug ist, es muss mit Daten gefüttert werden. Ganz deutlich wird das auch bei Betrieblichen Umweltinformationssystemen (BUIS). Auch Werkzeuge, die ein kooperatives Arbeiten im Sinne einer (interdisziplinären) Zusammenarbeit verschiedenster Akteure fördern, sind nutzlos ohne Daten, die verarbeitet werden können.

Es muss also ein Blick auf die zu Grunde liegenden Daten geworfen werden.
Mögliche Quellen sind:

  • „offizielle“ Daten – Daten werden von einer (anerkannten) Instanz bereit gehalten.
  • eigene Daten – Sie können in einer Datenbank als historische/bestehende Daten vorliegen oder aus Messungen generiert werden
  • User Generated Content – Die Nutzerinnen eines Angebotes bringen „ihre“ Daten ein

Offizielle Daten sind meist gut gepflegt und werden von Institutionen (privat oder öffentlich) gepflegt, die Kompetenz in ihrem Spezialbereich besitzt. Problematisch ist meist der Zugang und die Wiederverwendung der Daten. Sie sind zwar oft über ein Webinterface abrufbar, stehen damit aber nicht anderen Anwendungen zur Verfügung. Steht ein Mechanismus zur Verfügung, der die Daten maschienenlesbar vorhält (z.B. über Webservices), besteht oft das Problem der unterschiedlichen Dateiformate. Hier hat sich mit XML-Derivaten eine Menge getan.

Eigene Daten sind in der Regel spezifischer und haben damit meist einen höheren Informationsgehalt, sind aber auch aufwändiger und damit teurer zu pflegen. Sie können aus einem eigenen Datenbestand kommen oder direkt aus Messungen generiert werden. Auch hier besteht oft das Problem der unterschiedlichen Dateiformate bei der Integration verschiedener Quellen.

User Generated Content wird von den Nutzern des Dienstes beigesteuert und umfasst somit das Wissen und die Perspektiven Vieler. Damit kann viel implizites Wissen nutzbar gemacht werden, problematisch bleibt die unterschiedliche Nomenklatur der Begriffe (typisches Problem [und Chance!] der Folksonomies) und die unterschiedliche Qualität der Beiträge (Stichwort: Weisheit der Masse).

Mit der Nomenklatur ist ein weiterer Zweig der Daten angesprochen: Metadaten. Sie werden benötigt, um Daten zu clustern und sie in sinnvolle Zusammenhänge zu stellen. Das Stichwort ist hier das Semantic Web, über das sehr viel gehaltvollere Informationen generiert werden können als bisher. Ein Beispiel, das eine semantische Suche probiert ist das PortalU.
Mehr zum Semantic Web für die UI in einem gesonderten Beitrag.

Advertisements