Britenet - Deutschland - Wie Data Scientists Business und Technologie verbinden.
Britenet Logo
Thumbnail Image

Wie Data Scientists Business und Technologie verbinden.

Die heutige Banken-, Service-, und Finanzwelt ist sich zunehmend bewusst, dass sie das Wissen und die Erfahrungen von DataScience Experten brauchen. Organisationen und Unternehmen, die sie engagieren, wissen, dass sie eine Vielzahl von Kompetenzen unter einem Dach vereinen. Sie konzentrieren sich jedoch in der Regel vor allem auf technische Fähigkeiten, wie Programmierung, Anwendung von Algorithmen, Arbeit mit Daten oder Datenanalyse. Sie vergessen dabei die zweite wichtige Gruppe von Fähigkeiten, die Data-Science-Spezialisten haben sollten: Soft Skills, um Produkte und Dienstleistungen zu verbessern. Schauen wir uns diese genauer an und prüfen, was sie wirklich bedeuten und warum es sich lohnt, ihnen besondere Aufmerksamkeit zu geben:

Verständnis für Geschäftsprozesse

Ein Data Scientist erstellt nicht einfach ein Modell oder einen Algorithmus, nur um ihn zu erstellen. Er baut eine Lösung für Unternehmen - für jemanden, der die Ergebnisse seiner Arbeit nutzen wird. Deshalb ist es so wichtig zu verstehen, welche Geschäftsprozesse unsere Lösung berühren wird. Das ist wichtig, weil unser Experte dann in der Lage ist, die Variablen, Daten und den Algorithmus besser auszuwählen. Lösungen werden effektiver in den gesamten Prozess integriert. Wir vermeiden dann eine Situation, in der wir mit einem Augenzwinkern sagen könnten: "Die Operation war erfolgreich, aber der Patient ist gestorben."

Die Fähigkeit, Ergebnisse zu präsentieren

Jeder Data Scientist kennt den Moment, in dem er die Daten aufbereitet, analysiert, ein Modell erstellt, viele verschiedene Algorithmen und Variablen überprüft hat. Danach kann er sagen, dass er fertige Ergebnisse hat und nur noch darauf wartet, die Lösung in die Produktion zu geben. Erst dann kommt die Zeit der Präsentation der Ergebnisse im Unternehmen, bevor wir das Modell zur Umsetzung übergeben. Und hier tritt oft ein Problem auf: Es zeigt sich, dass Data-Science-Spezialisten so sehr auf technisch-algorithmische Fragestellungen fokussiert sind, dass sie nicht in der Lage sind, ihre Ergebnisse den Business-Anwendern klar und vor allem einfach zu vermitteln. Manchmal ist das Problem nicht der Inhalt selbst, sondern die Art und Weise, wie er präsentiert wird.  Sie bereiten PowerPoint-Präsentationen vor und vergessen dabei, alle Informationen in einer logischen Reihenfolge anzuordnen, die wichtigsten Punkte hervorzuheben und darauf zu achten, dass die Grafiken für das, was wir sagen, relevant sind. Oder sie bereiten ein Dokument vor, das ihre Vorgehensweise beschreibt, und es stellt sich einfach als unleserlich heraus. Es fehlen Absätze, Markierung der wichtigsten Informationen, Formatierung des Textes, Überschriften von Unterkapiteln usw. All dies macht es für den Empfänger schwieriger, die benötigten Informationen zu finden und schlechter, das präsentierte Material zu verstehen. 

Fähigkeit, die verwendeten Algorithmen zu erklären

Manchmal stelle ich bei einem Bewerbungsgespräch die Frage, einen gewählten Algorithmus zu erklären. Ich sehe zwar, dass der Kandidat Erfahrung mit diesem Algorithmus hat, weiß, was er bedeutet und wie man ihn anwendet, kann ihn aber oft nicht einfach erklären. Und während Geschäftskunden in der Regel nicht ins Detail gehen müssen um sich ein Bild von dem Algorithmus zu machen, ist es oft notwendig mit ihnen zu diskutieren und über die verwendete Lösung zu sprechen. Dann müssen wir noch erklären können, wie der Algorithmus bestimmte Abhängigkeiten erfasst oder nicht erfasst. Oder, wenn Sie in einer leitenden Position sind, müssen Sie einem Teammitglied erklären, worum es bei der Lösung geht. Denken Sie daran, dass nicht jeder über fortgeschrittene mathematische Kenntnisse verfügen wird und wir in der Lage sein müssen, die wichtigsten Informationen so zu vermitteln, dass sie für unser Publikum verständlich sind.

Diskutieren Sie die verwendeten Variablen und die Problemlösung.

Um eine geeignete Lösung zu erstellen, sollte ein Data Scientist oft mit Experten auf einem bestimmten Gebiet sprechen, d.h. das sogenannte Domänenwissen einholen. Er sollte herausfinden, welche Erfahrungen sie gemacht haben, darstellen, was die Daten sagen und darüber sprechen, welcher Ansatz am besten umgesetzt werden kann. Es kann sein, dass jemand auf der anderen Seite sehr darauf achtet, bestimmte Vermutungen oder Variablen zu berücksichtigen. Ein guter Data Scientist ist in der Lage, dies zu erfassen, diese Bedürfnisse zu analysieren und sie den Möglichkeiten gegenüberzustellen, die die Daten, die Geschäftsprozesse und die technische Umgebung bieten.

Ein kritischer Umgang mit Ergebnissen und Daten

Es ist eine weit verbreitete Aussage, dass der Prozess der Datenbereinigung und -aufbereitung 80 % der Zeit eines maschinellen Lernprojekts in Anspruch nimmt. Dies beweist, dass die Daten uns mehr als einmal täuschen können und wir Fehler übersehen, die unser Modell beeinflussen. Dies ist auch eine Warnung und wir müssen im Hinterkopf behalten, dass Daten nicht immer den Geschäftsprozess widerspiegeln, mit dem wir es zu tun haben.  Daher ist es notwendig, die Ergebnisse eines Modells oder einer Analyse kritisch zu betrachten. Es kann sich herausstellen, dass unser schlechtes Ergebnis nicht das Ergebnis gegebener Variablen ist, sondern eine Auswirkung von Veränderungen im Geschäft und der Realität. Umgekehrt kann unser sehr gutes Ergebnis der Effekt von falsch aufbereiteten Daten oder einer Leckage sein, die darin auftritt. Es gibt einen Grund, warum oft gescherzt wird, dass es nicht gut ist, wenn das erste Ergebnis über 90% liegt.

Kreativität

Feature Engineering, also das Erstellen neuer Variablen, ist eine Kunst. Es ist schwer, jemandem, der gerade erst in die Data Science einsteigt, zu erklären, wie man solche Variablen erstellt. Hier sind Kreativität und Fachwissen gefragt. Der Prozess der Datenauswahl ist nicht einfach und unterliegt keinen strengen Regeln. Dies ist der Zeitpunkt, an dem Sie überlegen müssen, was hilfreich sein könnte und was nicht. Helfen Informationen über die Anzahl der Tage seit der letzten Kampagne des Kunden bei der Erkennung einer potenziellen Abwanderung, oder würde eine Variable über den Account Manager des Kunden besser funktionieren? Oder ist vielleicht die Anzahl der Tage seit der letzten Kampagne nicht wichtig, sondern nur die Anzahl der Wochen oder die Anzahl der Tage, die wir arbeiten? Außerdem sind die Daten, die Data Scientists verwenden, meist nicht perfekt, was sich negativ auf das Modell auswirken kann. Dann müssen Sie dieses Problem entweder von der Datenseite oder von der Algorithmusseite her lösen. Kreativität ist auch nützlich, wenn Sie Nicht-Standard-Probleme umgehen müssen, wenn der übliche XGBoost nicht mehr ausreicht. Dann müssen Sie andere Methoden verwenden, manchmal mehrere zu einem Algorithmus kombinieren und in einer anderen Situation viele Lösungen testen, um die richtige zu finden. In der Data Science gibt es in der Regel keine ausgetretenen Wege, so dass man immer wieder neue Best-Fit-Lösungen finden muss.

Soft Skills entstehen an verschiedenen Punkten im Leben eines Data Scientists. Deren Entwicklung nimmt alle Zeit in Anspruch, ein Kurs auf einer der beliebten Plattformen wie Udemy oder Courser ist nicht genug. Fachliche und soziale Kompetenzen sind eng miteinander verbunden. Jeder von ihnen muss schrittweise nachgefüllt werden, damit die Entwicklung ausgeglichen ist. Sie kommen mit einem allgemeinen Erfahrungszuwachs und es ist wichtig, ihnen Aufmerksamkeit zu schenken, sie zu polieren und zu trainieren. Nicht weniger wichtig ist es, dass Unternehmen auf das Niveau der verschiedenen Kompetenzen ihrer Mitarbeiter achten und sie dabei unterstützen, dieses zu verbessern. Ein gutes Modell nützt uns nichts, wenn uns niemand erklären kann, wie es funktioniert, ob es den Anforderungen der Wirtschaft entspricht und was seine Ergebnisse wirklich bedeuten. Vor allem, wenn der Finanz- und Bankenmarkt vielen Regulierungen unterliegt. Es ist an der Zeit, dass Data Scientist eine Person ist, die man nicht nur mit den Namen von Algorithmen ansprechen kann.

DEEL DIT

RECENTE ARTIKELEN

Was lehrt uns die Tankstelle über Datenqualität?

2021-04-23
News

Wie verliert man Kunden und schreckt Menschen ab?

2021-03-30
News

Daten sind Gold

2021-03-19
News