Umweltdaten mit KI-Methoden für intelligente Datenanalysen erschließen
Berlin, 18. Dezember 2023 – Um die heterogenen Datenbestände der Umweltbehörden mit KI-/Machine-Learning Methoden besser für intelligente Datenanalysen zu erschließen, ist das BMBF-Forschungsprojekt Simplex4Learning gestartet. Das Forschungsteam entwickelt einen Ansatz, um bei der Analyse umweltbezogener Fragestellungen die Anwendung von KI-Algorithmen in der Breite in die praktische Anwendung zu bringen.
Methoden der Künstlichen Intelligenz (KI) wie Machine Learning (ML) können dazu beitragen, ökologische Phänomene und ihr komplexes Zusammenspiel, wie bei der Ursachen-Wirkung-Forschung bspw. in Waldökosystemen, möglichst gut zu verstehen und zu überwachen. Mit ihnen lassen sich Datenbestände aus verschiedenen Quellen intelligent auswerten, fehlende Daten mit Vervollständigungsmethoden generieren, Umweltphänomene prognostizieren oder räumliche Verteilungen besser verstehen. Ihre Anwendung erfordert jedoch vertiefte KI-Expertise, die in Umweltbehörden standardmäßig nicht verfügbar ist. Hier setzt das im Oktober 2023 gestartete Forschungsprojekt Simplex4Learning an.
Methoden des maschinellen Lernens im Zusammenspiel mit der Datenanalysesoftware disy Cadenza
Die Idee ist, dass Anwendende über die Benutzungsoberfläche der Datenanalysesoftware disy Cadenza Lern- und Analyseaufgaben mit Daten an eine zu entwickelnde ML-Erweiterung senden, die Zugriff auf zuvor trainierte ML-Modelle bzw. auf übertragbare ML-Modell-Architekturen hat, die in einem ML-Repository abgelegt sind. Die ML-Resultate und generierten Ergebnisse mit Erklärungen können von den Anwendenden durch eine innovative und bedienungsfreundliche Benutzeroberfläche (UI) in der Analyseumgebung visualisiert oder in weiterführende Analyseprozesse eingebunden werden. Durch diesen Ansatz können Anwendende zukünftig aus disy Cadenza heraus KI-Modelle verwenden, ohne dafür selbst vertiefte Kenntnisse zur Anwendung von ML-Algorithmen haben zu müssen. So kommen ML-Methoden in der Breite der praktischen Anwendung und können bei um-weltbezogenen Fragestellungen ihren Nutzen entfalten.
Entwicklung eines ML-Framework für die Umweltdatenanalyse
Um die erforderlichen ML-Modelle gezielt erstellen (trainieren) zu können, wird im Rahmen des Projekts von Forschenden der HTW Berlin ein leistungsstarkes und flexibles ML-Framework aufgebaut, welches die automatische Erstellung von ML-Modellen mit unterschiedlichen Algorithmen (AutoML) unterstützt. Es soll eine ML-Infrastruktur für das Training von ML-Modellen entstehen, das neben AutoML weitere KI-Komponenten zur effizienten und robusten Entwicklung und Anwendung der ML-Modelle (MLOps) oder zur Erklärbarkeit (Explainable-AI) integriert. Aufbauend auf der Identifikation und Analyse von innovativen praxisnahen ML-Anwendungsfällen mit assoziierten Projektpartnern aus der öffentlichen Verwaltung sollen übertragbare und generalisierbare ML-Architekturen erforscht und entwickelt werden. Diese werden in einem ML-Framework – zusammen mit AutoML- und Explainable AI-Komponenten (XAI, erklärbare künstliche Intelligenz) - integriert, welches als nahtlose Schnittstelle zwischen der Datenanalysesoftware disy Cadenza (UI) und der Simplex-Datenbereitstellung fungiert.
Neue Methode für Datenbereitstellung: der Simplex-Ansatz
Um Umweltdaten für das maschinelle Lernen effizient bereitstellen zu können, kommt der Datenhaltung eine Schüsselrolle zu. Der im Rahmen des Projekts weiterzuentwickelnde Simplex-Ansatz des Projektpartners Simplex4Data GmbH ermöglicht die Datenhaltung in einem einheitlich strukturierten Datenpool, der unabhängig von zweckgebundenen Anwendungsfällen ist. Die einheitlich strukturierten Umweltdaten ermöglichen eine effiziente Integration in vorhandene (Geodaten-)Infrastrukturen sowie auch in das zu entwickelnde ML-Framework.
Hintergrundinformationen zum BMBF-Forschungsprojekt Simplex4Learning
Das Forschungsprojekt „Intelligente Umweltdatenanalyse durch automatisiertes maschinelles Lernen für Fachanwender“ (Simplex4Learning) ist im Oktober 2023 gestartet und läuft bis März 2026. Es wird vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen der Maßnahme "KMU-Innovationsoffensive IKT" (Kennzeichen 01IS23041A/B/C) gefördert. Zum Projektkonsortium gehören Disy Informationssysteme GmbH, Simplex4Data GmbH und die Hochschule für Technik und Wirtschaft Berlin. Als assoziierte Partner sind das Landesamt für Natur-, Umwelt- und Verbraucherschutz Nordrhein-Westfalen, die Landesanstalt für Umwelt Baden-Württemberg und der Landesbetrieb Forst Brandenburg eingebunden. Sie unterstützen das Forschungsvorhaben mit Umweltdaten und Anwendungsfällen.