Stipulator
Der Stipulator ist ein Programm für Bearbeitung von Aufgaben zur Zeitreihen-Prognose und Klassifikation. Der Stipulator kann eingesetzt werden für
- die Zusammenstellung und Analyse von Sensorsignal- und Zeitreihendaten aus unterschiedlichsten Quellen,
- die Formulierung von Klassifikations- und Prognose-Anforderungen an die Signaldaten (sogenanntes "Labelling" der Daten) sowie
- das Pre-Processing und die Aufbereitung der Sensorsignal- und Zeitreihendaten zur Anwendung von Machine-Learning-Verfahren.
- Einsatzgebiet
- Funktionen
- Architektur
Bei der Ausführung von Data-Mining ist meist die Zusammenstellung und Bereinigung der Daten der aufwendigste und mühsamste Teil der Arbeit. Speziell wenn die Daten aus unterschiedlichen Tests und Versuchen stammen, simulationsbasierte Daten mit Versuchsdaten oder künstlichen Daten gemischt werden, Signale aus unterschiedlichen Test-Apparaturen zusammengeführt werden sollen, sehr viele Daten vorliegen (Stichwort BigData),... benötigt man einheitliche und reproduzierbare Prozeduren, um die Daten konform zusammen zu stellen und für eine übergreifende Analyse und Weiterverarbeitung aufzubereiten. Genau dafür ist der Stipulator gemacht!
Zudem beinhaltet der Stipulator Routinen für ein heuristisches "Labelling" der Daten, um so z.B. die funktionalen Anforderungen von Klassifikations- und Prognose-Algorithmen festzulegen und zu managen.
So legt man anhand von repräsentativen Beispielen aus Versuchen und/oder Simulationen bzw. künstlichen Daten fest,
- welche Aktion (=Klassifizierungs- bzw. Regressionsoutput) wie und wann
- für welche Last- und Auslegungsfälle
- mit welchen Sensorsignalen und Signalaufbereitungsverfahren
angesteuert werden soll.
Die so einheitlich zusammengestellten Daten können dann entweder für Systemtests oder als Grundlage zur Auslegung diverser Machine-Learning-Modelle verwendet werden.
- Festlegung und Suche von Referenzsignalen aus der Datenbasis
- Normalisierung der Signaldaten (z.B. um alle Signaldaten in eine einheitliche Einheit zu bringen)
- Daten-Plausibilisierung
- Kompensation und Korrektur von fehlerhaften Daten, teilweise automatisiert
- Definition und Anwendung von beliebigen Sensor-Modellen
- Definition und Anwendung von Störmodellen für Robustheitsuntersuchungen
- Berechnung von beliebigen Kennzahlen und Attributen aus den Signaldaten
- Definition und Anwendung von Heuristiken zur automatisierten oder manuellen Definition von Klassifikationsanforderungen ("Daten-Labelling")
- Durchführung von numerischer Konfliktanalyse zur Identifikation von inkonsistenten Anforderungen
- Daten-Analyse und Darstellung
- Auswertung beliebiger Distanz-Metriken zum Sensorsignal-Vergleich
- Konvertierung und Export in andere Datenformate
- Extraktion der Signaldaten und Historienwerte in passende Matrizen für die Anwendung verschiedener Machine-Learning-Verfahren (wie beispielsweise dem Brainer)
Technisch gesehen ist der Stipulator eine MATLAB-Toolbox.
Der Stipulator baut auf der Signal Structure Toolbox von ANDATA auf, welche offen mit dem Stipulator mit geliefert wird.
Optional kann der Expectator für die Signal-Plausibilisierung eingebunden werden.
Alle Funktionen des Stipulator können per Command Line Interface angesteuert werden. Dadurch lassen sich alle Arbeitsgänge in anwendungsspezifische Skripte oder Apps zusammenfassen und in kundenspezifischen Arbeitsumgebungen integrieren.
Weitere MATLAB-Toolboxen sind optional vorteilhaft für die Verwendung des Stipulator:
Optional können auch die
nahtlos im Stipulator integriert werden.
Weitere Details zur Architektur findet man hier.
MATLAB ist eingetragene Marke von The Mathworks, Inc.