B1 Datenbankmanagement und statistischer Modellierung [funded by LOEWE]
PI(s) for this project:
Prof. Dr. Ludger Grünhage
Prof. Dr. Jörg Bendix
Prof Jürg Luterbacher
Abstract:
Die Erstellung einer Datenbank ist eine technische Dienstleistung, die zur Unterstützung des interdisziplinären wissenschaftlichen Forschungsprojektes unabdingbar ist. „Data Warehouse-Systeme“ stellen den Stand der Technik dar, wenn Datensätze aus heterogenen Quellen an einer zentralen Stelle gesammelt und gespeichert werden. Wegen der unterschiedlichen Anforderungen der Benutzer (u.a. Abfrage nach Zeitpunkt, Ort, Methode etc.), werden mehrdimensionale Datenmodelle verwendet. Diese adressieren die gesammelten Daten als Punkte in einem hierarchisch strukturierten, multidimensionalen Datenraum in welchem Parameter wie Zeit und Raum als Dimension dienen können. Solche Datenbanken wurden bereits erfolgreich in verschiedenen Langzeitprojekten wie der Ecuador-Forschergruppe FOR816 oder den Biodiversitäts-Exploratorien entwickelt
Description:
Wissenschaftliche Ziele:
Erstellung einer neuen Datenbank, die zur Sammlung und langfristigen Speicherung, Auf-bereitung sowie einfachen Abrufmöglichkeit von Daten im LOEWE-Schwerpunkt dienen soll. Die bestehende Struktur der FOR816-Datenbank wird an die FACE2FACE Erfordernisse angepasst. Dadurch wird die Kompatibilität mit internationalen Datenbanken gewährleistet. Dies geschieht in Anlehnung allgemeiner Richtlinien der OECD und der DFG.
Arbeitsplan:
Im Rahmen von FACE2FACE werden sehr heterogene Datensätze erstellt. Für alle tabellarisch¬en Daten wird es ein Austauschformat (csv) geben und eine vollständig relationale Datenbank aufgebaut, sowie ein Rastermodul für binäre Rasterdaten (Modell, GIS, Satelitendaten). Zur langfristigen Speicherung der Daten werden die relevanten Datensätze aus verschiedenen Quellen extrahiert, in eine gemeinsame Struktur transformiert, und in die Datenbank geladen (ETL-Prozess) sowie über eine Datenabfrage und -Zugangs-Schnittstelle abgerufen. Es wird auch einen Webservice zum automatischen Datenupload für alle Loggerdaten geben. Die Konzeption, Implementierung und Wartung des Web-Interface mit entsprechenden Steuerungen für Daten-Upload, Zugangskonten-Verwaltung und des Data Warehouse selbst wird vom Datenbank-Koordinator vorgenommen.
Für die Nutzer wird das Web-Interface mit mehreren Suchoptionen zur Daten-Auswahl und Download-Funktionen realisiert. Die verwendete Data Warehouse-Struktur ist bereits für die Art und den Umfang der zu erwartenden Datensätze (5-6 stellige Anzahl von Datensätze) ausgelegt, wie sie auch im geplanten LOEWE-Schwerpunkt und der Verstetigungsphase anfallen werden.
Die verwendete Datenbank (FOR816) erfüllt generelle Standards für Datenbank-Design und führt zu einem logischen, konsistenten und multidimensionalen Datenmodell. Darüber hinaus sorgt diese Struktur dafür, dass die anzupassende Datenbank einfach aktualisiert und modifiziert werden kann, um auch zukünftige Anforderungen erfüllen zu können.
Die Datensätze im neuen FACE2FACE-Data Warehouse werden in einer relationalen Weise abgelegt, wodurch sichergestellt wird, dass alle Datensätze abgefragt und je nach gewünschter Dimension (z.B. Raum, Zeit, Methode, etc.) erneut aggregiert und neu skaliert werden können. Somit wird bei jeder Abfrage gewährleistet, dass nur die relevante Information aus den Datentabellen extrahiert wird.
Für die Visualisierung der Informationen, die in diesen Dateien gespeichert sind (z.B. Landnutzung Klassifizierung, Temperatur-Karte), wird das Data Warehouse-System interaktive Routinen zur Erzeugung von Karten in einem gängigen Desktop-Publishing-Format bereitstellen