dioxindb_begin
 
  Sie sind hier:  Startseite ›› Daten und Downloads ›› Datenmodell ›› Seite 2

Datenmodell der Dioxindatenbank

  

Die Dioxindatenbank des Bundes und der Länder ist ein Archivierungs- und Informationssystem für die "zentrale Dokumentation und Auswertung von Ergebnissen von Untersuchungsprogrammen zur Dioxinbelastung der Umwelt, die durch Bund und Länder initiiert werden". Die auf Oracle 11g basierende Dioxindatenbank bildet wesentliche Informationen eines Monitoringprogramms zu organischen Schadstoffen in zentralen DB-Objekten ab. Fremdschlüssel steuern die Beziehung von Daten, so können z.B. Messdaten zu einer Probe und diese wiederrum zu einem Standort zugeordnet werden. Um in Übereinstimmung mit den Anforderungen an die Qualitätssicherung eine aussagekräftige Qualitätskennzeichnung der Probendatensätze zu ermöglichen, wurde ein Bewertungskatalog mit Ausreißer- sowie Validierungskennzeichnungen hinterlegt.

In einem weiteren Entwicklungsschritt wurde das Datenmodell für die vorgesehene Hinterlegung von Kontaminations- und Quellenmustern, den Kongenerenprofilen, angepasst. Bewusst wurde eine getrennte Datenhaltung von Messprogrammen und Kongenerenprofilen umgesetzt. Mit Hilfe von Fremdschlüsselbeziehungen kann ein Bezug zwischen Profilen und Messprogrammen hergestellt werden. Dieser Umstand trägt speziellen anlass- oder verdachtsbezogenen Untersuchungen Rechnung, die einen Schadstofftransfer nachweisen.


 ER-Diagramm-2
Beschreibung relevanter Tabellen

"T_TITEL" enthält sämtliche Metadaten zum zentralen DB-Objekt, dem Messprogramm. Diese Tabelle beinhaltet die 3 Constraints: REG_NR_DS (Schlüsselwert, Angabe der datenliefernden Institution), REG_NR_FN (Sequenzieller Schlüssel des Messprogramms) und REG_NR_JAHR (Jahr der DB-Eingabe).

"T_TITEL_KOMPARTIMENT" stellt die Verbindung zwischen Messprogramm und Kompartiment her. Analog zur Auswahl in der Nutzerschnittstelle "Auswahl des Kompartiments" wird über diese Tabelle das Rechercheergebnis (Anzahl der Messprogramme) selektiert.

"T_STANDORT" enthält Standortinformationen des Messprogramms. Neben den Hoch- und Rechtswerten werden an dieser Stelle auch Bezeichnungen von Messtellen sowie wichtige Informationen zu Altlasten oder industriellen Anlagen hinterlegt.

"T_BFLR" enthält Gemeindeinformationen (Gemeindekennziffern, PLZ, Flächen- und Einwohnerinformationen). Die Angabe des differenzierten Regionstyps verbirgt sich hinter "RTYP" (Werte: 1-7).

"T_PROBENAHME" enthält, neben Informationen zu Bedingungen der Proben-Entnahme aus den verschiedenen Umweltkompartimenten, Probenahmeinformationen (z.B. Datum), Angaben zur Probenart und - menge sowie Transportinformationen.

"T_PROBE" enthält Informationen zur Probe wie Substanztyp, Fettgehalt und Farbe.

"T_ANALYSEN_ERGEBNIS" enthält die Messergebnisse mit Bestimmungsgrenzen und gemessenem Stoff (STOFF_SPEKTRUM_ID).


vereinfachtes Datenmodell "DXN"


 ER-Diagramm
Projekt Kongenerendatenbank

Moderne IT-Anwendungen zeigen meist nur Ausschnitte realer Verknüpfungen von Stoffbewertungen, Versuchs- und Gesamtsystemen. Dabei entsteht für Systembetreiber, mit der Entscheidung Informationen einem breiten Publikum verfügbar zu machen, die Möglichkeit höchst komplexe Systeme und Wechselwirkungen in ihrer Gesamtheit abzubilden. Die Dioxindatenbank des Bundes und der Länder nutzt vielfältige IT-Werkzeuge, deren Ausbau und Vernetzungskonzepte im Folgenden näher erläutert werden.

Zielstellung

Werden Informationen mit verwandten Quellen (z.B. Literatur) verknüpft, entsteht eine mehrschichtige Basis für intelligente computergestützte Inferenzen (Schlussfolgerungen). In Zukunft wird Software in der Lage sein, neue Aussagen aus einer riesigen Datenmenge zu einer konkreten Problemstellung abzuleiten. Aus diesem Grund verfolgt die Anwendungslandschaft der Dioxindatenbank des Bundes und der Länder bereits heute einen interdisziplinären Ansatz. Das aktuelle IT-Projekt zum Aufbau einer Kongenerendatenbank mit Webanbindung ist ein weiterer Schritt in Richtung intelligenter Systeme.

Durch die Erfassung verschiedener Analyte in Datensets organischer Schadstoffbelastungen, können computergestützte Mustervergleiche durchgeführt werden. Auf diese Weise können Kontaminationsquellen schnell und belastbar identifiziert werden, eine wichtige Maßnahme um z.B. Futter- und Lebensmittel sicherer zu machen.
Mit Hilfe von Expertenwerkzeugen werden Referenzprofile für zukünftige Abgleiche hinterlegt, anhand eines Bestandes an Referenz-Vergleichsprofilen können strukturähnliche Umweltkontaminationen rechnerisch ermittelt werden.


uba

Abb.1: Auswahl des kontaminierten Profils und der Einzelkongenere innerhalb der neuen Anwendungsumgebung

Mittels eines Moduls wird die Skriptsprache R innerhalb der Webanwendung interpretiert. Auf diese Weise werden Kongenerenprofile gemäß aktueller mathematisch-statistischer Ansätze transformiert.
Um Ähnlichkeiten zwischen belasteten Proben und möglichen Kontaminationsquellen aufzuzeigen (Fingerprintmethode), werden die Profile skaliert und schließlich eine Abstandsbestimmung durchgeführt.


uba

Abb.2: die Exportvariante "Prüfbericht" ermöglicht es, Messergebnisse einer Probe in vereinheitlichter Abfolge auszugeben


Die Skalierung stellt sicher, dass die Verhältnisse der Kongenere innerhalb eines Profils nicht geändert werden. Mit Hilfe der BigData-Komponente von R werden auf diese Weise tausende Profile derart skaliert, dass eine Rangliste von ca. 10 Profilen, die der belasteten Probe möglichst nahe kommen, ausgegeben wird. Dieser komplexe Vorgang dauert wenige Sekunden.

Aus diesem Grunde wurde der Datenbestand der Dioxindatenbank in 2013 wiederholt einer qualitätssichernden Prüfung unterzogen, um den Datenbestand an eine Datenqualität heranzuführen, die einer Open Data Governance-Strategie entspricht. Neben speziellen Fragenstellungen, wie beispielsweise der Untersuchung von sogenannten Hot Spots, wurden im Rahmen des Projektes Überlegungen zur Etablierung einer DQ-Strategie getätigt. Grundanliegen des Vorhabens war nicht nur die Feststellung von Zuständen sondern ergänzend auch deren fachlich-technische Bewertung.

Downloads zum Thema:

Anwenderhandbuch Rechercheanwendung POP-Dioxin

DQ-Bericht - Erarbeitung und Evaluierung von Methoden der Qualitätssicherung von Daten und Metadaten für die POP-Dioxin-Datenbank des Bundes und der Länder


Glossar                        Kontakt                        Haftung                        Impressum


© 2014 Umweltbundesamt Dessau-Roßlau. Alle Rechte vorbehalten
deutsch de | de english
search engine by freefind