KI Algorithmen für Zeitreihenanalysen

Entschlüsselung komplexer Muster und Strukturen in Daten

Das Gebiet der Künstlichen Intelligenz (KI) hat in den letzten Jahren immense Fortschritte gemacht und spielt eine entscheidende Rolle bei der Bewältigung komplexer Aufgaben mit zeitlichen Datenstrukturen. KI Algorithmen für Zeitreihenanalysen setzen sich zusammen aus speziellen Methoden und Modellen, die darauf abzielen, Muster, Trends und Strukturen in zeitlich geordneten Datensätzen zu erkennen, um Anomalien und definierte Zustände zu erfassen oder präzise Vorhersagen für zukünftige Werte zu treffen. Diese Algorithmen nutzen fortgeschrittene mathematische Modelle und maschinelles Lernen, um komplexe Beziehungen zwischen vergangenen, gegenwärtigen und zukünftigen Zeitpunkten in den Daten zu erfassen. Der Zweck besteht darin, Einblicke in die zeitliche Entwicklung von Daten zu gewinnen, Vorhersagen für zukünftige Werte zu generieren und Entscheidungsträger in verschiedenen Bereichen wie Gesundheitswesen und Produktion zu unterstützen. Die Anwendung von KI Algorithmen in der Zeitreihenanalyse ermöglicht somit eine präzisere und effektivere Nutzung von zeitlichen Datenverläufen für strategische Planung und Entscheidungsfindung.

Qualitätsbewertung und prädiktiver Austausch von Schmierölen
© Fraunhofer EMFT / Bernd Müller
ML-Methoden für die Qualitätsbewertung und dem prädiktiven Austausch von Schmierölen.

Die Gruppe Machine Learning Enhanced Sensor Systems (MLS) des Fraunhofer EMFT verfügt über umfangreiche Erfahrung im Data Mining und der Entwicklung von KI Algorithmen für Zeitreihendaten. Data Mining ist datengetriebene Wissensentdeckung, also das Auffinden von relevanten Mustern und Strukturen in den Daten, und umfasst sowohl klassische statistische Methoden als auch KI-Methoden.

Die Grundlage einer jeden Analyse sind die Daten. Deswegen ist es entscheidend die grundlegenden Eigenschaften von Zeitreihendaten zu verstehen. Gute Datenanalyse- und KI-Methoden sind auf die speziellen Anforderungen von Zeitreihendaten zugeschnitten. Ausgehend von den Kompetenzen und Ressourcen, die das MLS-Team in Bezug auf KI Algorithmen für Zeitreihenanalysen aufgebaut hat, bietet die Gruppe Leistungen von Machbarkeitsstudien und Beratung bis hin zur Entwicklung eines Gesamtsystems an.

Zeitreihendaten

Zeitreihendaten sind in der digitalisierten Welt allgegenwärtig. Egal ob die Daten von Umweltsensoren, Industrieanlagen, Vitalsensoren, dem Finanzmarkt oder aus anderen Quellen stammen, ihre Herkunft ändert nichts an ihrer inhärenten Eigenschaft: der festen Reihenfolge der Werte. Jeder Wert ist jeweils mit einem Zeitstempel versehen (siehe Abb. Beispielhafte Zeitreihe). Zeitreihendaten weisen einige datentypspezifische Herausforderungen auf. Im Gegensatz zu klassischen tabellarischen Daten sind Zeitreihendaten nicht unabhängig verteilt, oft liegt eine signifikante Autokorrelation vor.

In der Praxis werden schnell große multivariate Datenmengen aufgezeichnet, wodurch die Analyse komplex wird. Zum Beispiel können in Industrieanlagen Zeitreihendaten über Jahre hinweg von mehreren Sensoren mit hoher Abtastrate erfasst werden. Innerhalb kurzer Zeit werden Hunderte von Millionen von Datenpunkten gespeichert. Zeitlich gesehen können relevante Merkmale weit voneinander entfernt liegen oder sich in unmittelbarer Nachbarschaft befinden. Folglich sollte ein geeignetes Machine Learning Modell in der Lage sein, langfristige Trends und zeitlich weit entfernte Zusammenhänge zu erfassen, ohne lokale Muster zu vernachlässigen.

Beispielhafte Zeitreihe MLS Gruppe
© Fraunhofer EMFT
Beispielhafte Zeitreihe

Nicht nur die Struktur von Zeitreihendaten unterscheidet sich von anderen Datentypen, sondern auch die Muster in den Daten. Beispielsweise sind periodische Muster in natürlichen Audiosignalen häufiger anzutreffen als in natürlichen Bildern. Eine weitere Herausforderung bei der Analyse von Zeitreihendaten sind unregelmäßige Abtastraten oder seltene Ereignisse, die schwer zu analysieren oder vorherzusagen sind.

KI Methoden

Um Erkenntnisse aus Zeitreihendaten zu gewinnen, können klassische mathematische Analysemethoden verwendet werden. So ist beispielsweise die Fourier-Analyse eine weit verbreitete klassische Methode. Mit zunehmender Rechenleistung können immer größere Datenmengen gespeichert und verarbeitet werden. Als Alternative zum Schreiben expliziter Software, die mathematische Regeln zur Problemlösung definiert, kann Machine Learning zur datengetriebenen Mustererkennung eingesetzt werden. Für Aufgaben wie Regression (z.B. für physikalische Modellierung), Klassifikation (s.u. Abb. 1), Anomalieerkennung (s.u. Abb. 2) und Vorhersage (Forecasting) (s.u. Abb. 3) ist maschinelles Lernen die bevorzugte Methode. Insbesondere dann, wenn diese Aufgaben mit klassischen Methoden nicht trivial zu lösen sind oder aber wenn klassische Methoden rechenintensiv sind, ist Machine Learning der Stand der Technik. Je nach Schwierigkeit des Problems reicht die Modellkomplexität von einfachen linearen Modellen bis hin zu komplexen Deep Neural Network Architekturen.  

Für die Analyse von Zeitreihendaten ist die automatische Merkmalsextraktion (Feature Extraction) in Kombination mit klassischen Machine Learning Modellen ein guter Basisansatz. Eine weitere spezifische Eigenschaft von Zeitreihendaten ist, dass für univariate Zeitreihen relativ starke Distanzmetriken verfügbar sind. Dies bedeutet, dass die Ähnlichkeit zweier Zeitreihen relativ gut durch eine euklidische Distanz in Kombination mit dynamischer Zeitnormierung (Dynamic Time Warping) bewertet werden kann. Dieses Ähnlichkeitsmaß hat sich sowohl in der Klassifikation von Zeitreihendaten als auch in der univariaten Anomaliedetektion als wettbewerbsfähig erwiesen. Eine weitere Klasse von Machine Learning Modellen ist speziell für Zeitreihendaten entwickelt. Einige dieser Modelle begrenzen die Komplexität von Zeitreihendaten durch Quantisierung oder Downsampling. Mit dem gleichen Ziel wurden auch Deep Neural Network Architekturen angepasst, um den spezifischen Herausforderungen von Zeitreihendaten gerecht zu werden. Bekannte Beispiele für Deep Learning-Architekturen, die an Zeitreihendaten angepasst wurden, sind Convolutional Neural Networks (CNNs), Recurrent Neural Networks (RNNs) oder, in jüngerer Zeit, die Transformer-Architekturen.

Klassifizierung von Zeitreihendaten
© Fraunhofer EMFT
Klassifizierung von Zeitreihendaten (CBF dataset [1])
Anomalien in Zeitreihendaten
© Fraunhofer EMFT
Anomalien in Zeitreihendaten
Vorhersage von Zeitreihendaten
© Fraunhofer EMFT
Vorhersage von Zeitreihendaten

Industrielle Anwendung & AI on the Edge

KI Algorithmen für Zeitreihendaten sind in allen Geschäftsbereichen relevant, in denen Sensordaten über die Zeit erfasst werden. Beispielsweise werden Zeitreihendaten in folgenden Anwendungen erfasst: Industrie 4.0 mit IIoT, Logistik, Finanzen, Stromnetze, Internetverkehr, Umweltmonitoring oder Gesundheitsdaten. Die MLS Gruppe verfügt über umfangreiche Erfahrung im Bereich KI für Zeitreihendaten aus zahlreichen Forschungs- und Industrieprojekten. Besonders in diesen Anwendungsgebieten wurden Projekte erfolgreich durchgeführt: 

Zeitreihenanalyse für industrielle Anwendungen, umfasst die Anwendungsbereiche Condition Monitoring (Zustandsüberwachung) und Predictive Maintenance (vorausschauende Wartung). Die große Herausforderung besteht darin, dass in industriellen Anwendungen oft mehrere Sensoren und Steuergeräte an mehreren Maschinen oder Prozessschritten große Datenmengen erfassen. Im ersten Schritt werden relevante Muster in den Daten identifiziert, um den Zustand einer Maschine oder Industrieanlage zu bewerten - "Condition Monitoring". Anschließend kann auf der Grundlage der Servicehistorie und bisheriger Erfahrungen die Restnutzungsdauer (Remaining Useful Life) vorhergesagt werden, um Predictive Maintenance zu ermöglichen.

Der zweite bisherige Projektschwerpunkt ist AI on the Edge. In einem Kommunikationsnetzwerk beschreibt die Edge den Rand des Netzwerks, der der Sensorik am nächsten ist, während der Server oder die Cloud den Kern des Netzwerks darstellt. Edge Geräte sind häufig eingebettete Systeme (embedded devices), auf denen das Machine Learning ausgeführt wird. Die Herausforderung besteht darin, mit begrenzter Rechenleistung auszukommen. Für einen gegebenen Anwendungsfall müssen das eingebettete System und die Machine Learning Software aufeinander abgestimmt werden, was ein Hardware Software Co-Design erfordert. Da die Daten auf mehreren unabhängigen Edge Geräten aggregiert werden, kann der Datenschutz durch den Einsatz von föderalem Lernen (federated learning) verbessert werden. Beim föderalen Lernen werden nur Modellaktualisierungen zwischen den Edge-Geräten und dem Server ausgetauscht, während die Rohdaten lokal auf den Edge Geräten gespeichert werden.

Anwendungsgebiete MLS Gruppe
Andwendungsmöglichkeiten von ML-Methoden

[1] Saito, Naoki and Ronald R. Coifman. “Local feature extraction and its applications using a library of bases.” (1994).

Sie wollen mehr über die Anwendungsmöglichkeiten von KI Algorithmen für Zeitreihenanalysen in der Praxis erfahren?

Dann nehmen Sie mit uns Kontakt auf!

Das könnte Sie auch interessieren:

 

Kompetenz: Machine Learning enhanced Sensor Systems

 

Leistungsangebot: AI on the Edge

 

Leistungsangebot: Condition Monitoring und Predictive Maintenance

Projekt: KI basierte prädiktive Wartung für Anlagen in der Fertigung

Projekt: Machine Learning unterstützte vorausschauende Wartung von Getriebeölen