Anmeldung Newsletter

Wie Sie Wert aus Ihren Daten generieren

Posted by Philippe Take on 21.12.2016 13:24:10
Philippe Take

Der Artikel “Why You’re Not Getting Value from Your Data Science” von Kalyan Veeramachaneni, Principal Research Scientist am MIT, bringt es auf den Punkt:

“Unternehmen generieren stetig weiter Daten, aber das führt nicht immer zu umsetzbaren Handlungen”. Warum? Eine erste Befragung von Data Scientist hat ergeben, dass es an dem Durcheinander der Daten läge. Auf Nachfragen kam heraus, dass es häufig einfach zu viele unterschiedliche Daten sind, die anfänglich nicht in vernünftig aggregierten Variablen für die Verarbeitung mit Machine Learning Methoden vorliegen. Anstatt das Machine Learning Problem zu verstehen, zu formulieren und die Variablen dafür abzuleiten, konzentrieren sich Experten häufig lieber auf spätere Phasen des Prozesses, z.B. Testen verschiedener Modelle, Finetuning der Parameter für ein bereits etabliertes Modell, anstatt neue prädiktive Fragestellungen für neue Business-Ziele zu formulieren. Außerdem richten Machine Learning Experten Ihre Arbeit zu selten an dem finalen Ziel aus, Geschäftserfolge zu erzielen, wie z.B. Effizienz zu steigern, Gewinne zu steigern bzw. Kosten zu senken.

Die viel wichtigere Frage danach, welchen Wert ein Predictive Model generiert und wie man es messen kann, führt viel eher zu neuen Zielformulierungen für das Business, statt den Fokus auf spätere Phasen des Machine Learning Prozesses zu legen. Am Ende geht es darum, dass das Modell tatsächlich eingesetzt wird, um einen zusätzlichen Wert zu generieren. Mit anderen Worten, Machine Learning Experten möchten Modelle bauen, aber nicht unbedingt riesige Datenbestände verarbeiten oder Business-Probleme in Predictive Models übersetzen. Die Meinung des Verfassers, der wir uns anschließen, ist, dass dieser Fokus erfahrungsgemäß nicht den größten Wert erzielt. Wenn Unternehmen Werte aus ihren Daten generieren möchten, dann sollten sie stattdessen anfangen, schneller Verständnis für die Daten zu entwickeln, einen Prozess aufbauen, viel schneller, viel mehr Modelle erstellen zu können, um schneller Ergebnisse zu erhalten und Fragestellungen bewerten zu können. Damit Machine Learning wirklich erfolgreich eingesetzt werden kann, sollten vier Prinzipien verfolgt werden: 

 

  1. ✓  Verwendung einfacher Predictive Models
  2. ✓  Mehr Business Ziele anhand von Predictive Models schneller prüfen
  3. ✓  Anhand von Sample Daten lernen, nicht immer von allen Daten
  4. ✓  Auf Automatisierung der Prozesse konzentrieren


Auf allen vier dieser Prinzipien wurde Gpredictive in den letzten 6 Jahren entwickelt.

 

SOMETHING TO SAY?