Remote Sensing für die moderne Agrarversicherung

Remote Sensing for Crop Insurance

Das Jahr 2018 hat gezeigt, dass wir uns in Mitteleuropa wohl an heiße, trockene Sommer gewöhnen müssen. Unter diesen Folgen des Klimawandels leiden auch die Ernteerträge. Viele Landwirte schließen deshalb Versicherungen für die Erträge ab, um ihre Existenz im Falle einer schlechten Ernte zu sichern.
Versicherungen stehen nun vor der Herausforderung, dass für viele Felder überprüft werden muss, ob tatsächlich ein Schaden vorliegt. Dazu muss jedes Feld von einem Fachmann vor Ort begutachtet werden. An dieser Stelle setzt das Projekt des Innovation Labs an. Mithilfe von Satellitendaten soll die Schadenerhebung vereinfacht werden.

Daten en masse

Zunächst benötigt man dafür die Satellitendaten. Verschiedene Anbieter stellen hochauflösende Bilder zur Verfügung. Man hat also Zugriff auf regelmäßige (in etwa alle 2 Wochen) Beobachtungen für jedes Feld — überall. Erste Analysen sind mithilfe der Google Earth Engine möglich. Für eine effiziente Weiterverarbeitung stellt jedoch die Katalogisierung und Verarbeitung dieser Daten eine Herausforderung dar: Ein einzelnes Datenpaket benötigt bereits ein knappes Gigabyte an Speicherplatz. Hier besteht noch Optimierungsbedarf! Weiterhin sollen auch zusätzliche Datenquellen, wie zum Beispiel Wetterdaten, erprobt werden.

Die Herausforderungen
Das Klassifizierungsproblem besteht nun darin, einer Zeitreihe von Satellitenbeobachtungen \(X\) ein Label \(y\in \{\,0,1\,\}\) zu geben. Dabei ist \(X \in \mathbb{R}^{B\times T\times X \times Y}\) ein 4-dimensionaler Tensor, mit den Achsen \(B\) (Wellenlänge), \(T\) (Zeit), \(X\) (geographische Länge) und \(Y\) (geographische Breite).
Ein erster Ansatz ist sich der Methoden der Videoklassifizierung zu bedienen, indem man 3-dimensionale konvolutionale Netze verwendet:

Anders als bei einem Video ist die Zeitachse hier aber inhomogen, somit ergeben Konvolutionen entlang der Zeitachse keine optimalen Ergebnisse.
Andere Ansätze beinhalten eine Aggregation entlang einer oder mehrerer Achsen, bevor ein Modell von den abgeleiteten Daten lernt. Beispielsweise können die räumlichen Achsen \(X\) und \(Y\) mithilfe von Histogrammen oder Quantilen aggregiert werden, sodass die Klassifizierung dann nur noch auf einer \(B \times T\)-Matrix erfolgt. Aber auch die Zeitachse kann mit Fourier-Transformationen oder ähnlichen Methoden aggregiert werden. Hier ist Kreativität und Experimentierfreude gefragt!
Konventionelle Ansätze führen also nicht zum Ziel – die geschickte Kombination von mathematischen Transformationen und modernen statistischen Techniken ist notwendig.

Auswertung
Nachdem man die Anzahl der Merkmale deutlich reduziert hat, kann man die verarbeiteten Daten mit einem statistischen Modell auswerten. Da es sich um Zeitreihen handelt, ist die Verwendung Rekurrenter Neuronaler Netze naheliegend. Aktuell arbeitet das Innovation Lab mit den Frameworks PyTorch und Apache MXNet.