Begriffe wie Internet of Things (IoT) und Big Data stehen eng in Verbindung mit Industrie 4.0. Die Produktion soll durch das Sammeln von Daten smart gestaltet werden. Welche aktuellen Methoden werden heute zur Datenerfassung verwendet und wie kann man effizient einen Mehrwert daraus generieren? Der Knowledge Discovery Process zeigt ein strukturiertes Vorgehen für Big Data auf, durch das man einen Überblick über seine Daten erhält. Mit Hilfe von Data Warehouses lässt sich diese Methodik effektiv in eine Produktion mit einbinden.

<div class="hzweiwrapper"><span class="circled-number">1</span><h2 class="c-blog_head" id="1. Veränderung durch das Internet of Things (IoT)">Veränderung durch das Internet of Things (IoT)</h2></div>
Internet of Things bezeichnet die Verbindungphysischer Objekte mit dem Internet. Dabei sind diese zumeist mit Sensoren ausgestattet, welche Informationen aus ihrer Umgebung aufnehmen. Bei einem Smartphone ist die Verbindung mit dem Internet eindeutig zu erkennen, aber auch andere Gegenstände werden vermehrt in das digitale Zeitalter eingeführt. Im Privathaushalt lassen sich Beleuchtung, Haushaltsgeräte, Thermostate und Überwachungsgeräte über das Internet ansteuern. Doch inwieweit kann die Industrie IoT für sich nutzen?
Durch den Übergang zu Industrie 4.0 treten Vernetzung, Transparenz und dezentrale Entscheidungen in den Vordergrund. In all diesen Bereichen hat das Internet of Things (im industriellen Umfeld auch oft als Industrial IoT bezeichnet) einen wichtigen Einfluss. Durch die Vernetzung von Geräten in der Produktion mit dem Internet werden Datenaufgezeichnet. Das ermöglicht Entscheidungen auf einer umfangreichen Datenbasis zu treffen. Der Weg zu einer smarten Produktion durch Erkenntnisse auf Basis von vernetzten Geräten, muss allerdings erst geschaffen werden. Dieser Prozess wird als Knowledge Discovery Process (KDP) bezeichnet.
<div class="hzweiwrapper"><span class="circled-number">2</span><h2 class="c-blog_head" id="2. Erkenntnisgewinn durch den Knowledge Discovery Process (KDP)">Erkenntnisgewinn durch den Knowledge Discovery Process (KDP)</h2></div>
Das Ziel des Knowledge Discovery Process ist die Gewinnung von Wissen. Grundlage dieses Vorgehens ist eine breite Datenbasis. Effizientes und umfangreiches Sammeln von Daten im Umfeld von Industrie 4.0 wird beispielsweise durch das Internet of Things ermöglicht. Lediglich durch die Einführung von IoT und das Erzeugen von Datenmengen ist jedoch noch kein Mehrwert geschaffen. Zur Generierung von Wissen gilt es wichtige Schritte zu durchlaufen:

- Beginnend mit der Zieldefinition wird festgelegt, welcher Mehrwert durch den Knowledge Discovery Process gewonnen werden soll.
- Daraufhin gilt es geeignete Daten auszuwählen, die Relevanz für die Zielerreichung aufweisen. Dieser Schritt wird häufig unterschätzt, denn ohne eine geeignete Informationsgrundlage ist es nicht möglich, Wissen zu extrahieren.
- Wurden passende Daten ausgewählt, müssen diese für die Weiterverarbeitung vorbereitet werden. Dieser Schritt kann je nach Anwendungsfall sehr unterschiedlich aussehen.
- Im nächsten Schritt werden die zugrundeliegenden Daten analysiert, ein Prozess der auch als Data Mining bezeichnet wird. Die Analyse selbst kann auch anhand von Machine Learning durchgeführt werden.
- Resultate daraus bilden die Grundlage für die Wissensgewinnung, welche jedoch von einer korrekten Interpretation der Resultate abhängig ist.
Der Knowledge Discovery Process erscheint auf den ersten Blick intuitiv und simpel. Bei genauerer Betrachtung jedoch ist jeder seiner Schritte komplex, da sehr große Mengen von Daten (Big Data) gesammelt und analysiert werden. Eine erfolgreiche Strategie für die Reduzierung der hiermit verbundenen Komplexität ist die Einführung eines Data Warehouse.
<div class="hzweiwrapper"><span class="circled-number">3</span><h2 class="c-blog_head" id="3. Das Data Warehouse als Erfolgsfaktor für Big Data">Das Data Warehouse als Erfolgsfaktor für Big Data</h2></div>
Mit der Sammlung von großen Datenmengen mittels Sensoren und vernetzter Systeme werden in der Produktion unterschiedliche Daten gesammelt. Diese liegen in verschiedener Form und Qualität vor. Beim Aufzeichnen der Daten werden zunächst alle Beobachtungen in einem ungeordneten Speicher gesammelt. Da Daten dort ungefiltert vorliegen wird dieser Speicher als Data Lake bezeichnet.
Prinzipiell ist es nun möglich, Data Mining basierend auf Informationen aus Data Lakes zu betreiben. Erfahrungsgemäß erschwert die unstrukturierte Natur der Daten das Vorhaben des Knowledge Discovery Process erheblich. Aus diesem Grund bieten Data Warehouses eine Möglichkeit, ungeordnete Daten in ein für die Weiterverarbeitung geeignetes Format zu überführen. Hierbei dient das DWH als zentrale Datenbank, die Daten aus mehreren heterogenen Quellen zusammenführt.
Da ein Data Warehouse zudem für Analysezwecke optimiert ist, wird es ebenfalls als Analysedatenspeicher bezeichnet. Durch die Strukturierung der Daten bildet diese Form der Speicherung ein optimales System zur Wissensgewinnung im Bereich Big Data und Internet of Things. Weil der Erfolg des Knowledge Discovery Process vom Zustand der genutzten Daten abhängt, ist es wichtig das Potential der Data Warehouses im Sinne von Industrie 4.0 auszuschöpfen.
