Data Scientist – Das Hype Thema erklärt. Part 1
Wenn ich mich bei unseren Kunden als Data Scientist - ein Datenwissenschaftler - vorstelle, dann klingt das ähnlich viel- und nichtssagend wie "Informatiker", "Computer Scientist" oder "EDV-Experte". Dennoch bezeichnet der Harvard Business Review diesen Job als "Sexiest Job of the 21st Century". Und das auch ohne die Worte maschinelles Lernen oder künstliche Intelligenz vorab in den Mund genommen zu haben.
Was verbirgt sich hinter Data Science?
Data Science ist ein interdisziplinäres Feld und kombiniert tiefgehende Themen aus der Informatik, Mathematik, Statistik und Informationswissenschaft. Insbesondere relevant sind hierbei die Felder maschinelles Lernen, Datenklassifikation, Cluster Analysen, Data Mining, Datenbanken und Visualisierung.
Wer als Data Scientist arbeitet, braucht also eine spezielle Kombination von Knowhow aus Mathematik und Informatik. Dies ist unter anderem ein Grund, warum echte Data Scientists so selten – und gleichzeitig so gefragt sind.
Wo wird Data Science angewendet?
Data Science ist nicht auf ein einzelnes Anwendungsgebiet beschränkt, sondern wird in den verschiedenen Kontexten eingesetzt. Hier nur einige Beispiele:
Suchmaschinen
Ein Beispiel für angewandte Data Science, die uns jeden Tag begegnet, vereinfacht unser Leben jeden Tag auf fast schon magische Art und Weise und wirkt manchmal fast schon unheimlich. Es geht um Suchmaschinen und ihre Fähigkeit, Millionen von Webseiten in Sekundenbruchteilen abzusuchen und uns genau die Ergebnisse zu liefern, die wir gerade für unsere Arbeit brauchen:
Digitales Marketing
Für Unternehmen in der heutigen Zeit nicht mehr wegzudenken und allgegenwärtig ist auch die Nutzung digitaler Marketingkanäle und die damit verbundenen ausgefeilten Strategien. Die Auffindbarkeit bei Google beispielsweise entscheidet in vielen Branchen über Bestehen oder Scheitern des gesamten Unternehmens.
Sprach- und Bilderkennung
Was vor ein paar Jahren noch als Spielerei oder Zukunftsmusik abgetan wurde, ist heute Realität. Wir nutzen vermeintlich intelligente Sprachhilfen wie Siri, Alexa und Co. und vergessen dabei zu leicht, was für ein komplexer Prozess das Erkennen menschlicher Sprache mit all ihren Akzenten und Ausprägungen ist. Jedenfalls so lange, bis wir uns wiederfinden, wie wir auf einem belebten Platz “Neuer Termin” in unser Smartphone brüllen, dieses aber viel lieber den gesamten Vortrag des in der Nähe befindlichen Reiseführers mitdokumentiert.
Das Notizprogramm OneNote von Microsoft, das für viele fast schon als zweites Gedächtnis dient, verfügt standardmäßig bereits über die Funktion, Texte in Bildern zu erkennen, und diese herauszukopieren. Dies wird als OCR – optical character recognition- bezeichnet und besitzt bereits heute eine faszinierende Akkuratesse.
Wollen Sie mehr zu meinen wissenschaftlichen Beiträgen auf dem Gebiet der Bildverarbeitung erfahren, finden Sie Veröffentlichungen unter meinem Google Scholar Profil.
Anbieterunabhängige Beratung zur digitalen Personalakte
Sie möchten die digitale Personalakte in Ihr Unternehmen integrieren? Wir finden für Sie die richtige Software.
Logstistikplanung und Supply Chain Management
In Zeiten von next-day-delivery und Co. sind Unternehmen zunehmend gezwungen, auf intelligente Lösungen umzusteigen, um den anfallenden Datenbergen überhaupt nur ansatzweise Herr zu werden. Während dies am einen Ende des Spektrums absolut notwendig wird, um überhaupt effiziente Prozesse zu ermöglichen, liegen auf der anderen Seite auch enorme Potentiale für Optimierungen jeglicher Art in Bezug auf Zeit, Ressourcen und sogar der Auswahl von Drittanbietern.
Ein Extrembeispiel für derartige Datenmengen ist der Teilchenbeschleuniger CERN. Bei einem Testlauf fallen hier alleine für den Detektor CMS so viele Daten an, wie eine Digitalkamera mit 70 Megapixeln, die pro Sekunde 40 Millionen Bilder schießt, erzeugen würde!
Klingt utopisch? Doch stellen Sie sich kurz vor, wie viele Maschinen in einem einzigen Produktionswerk eines Automobilteilezulieferers im Einsatz sind und wie viele Daten jede einzelne Maschine erzeugt und verarbeitet. Und damit sind wir schnell bei einem weiteren Hype-Thema:
Predictive Maintenance
Ausfälle und Fehler erkennen und verhindern, bevor sie entstehen. Wartungen nicht so einplanen müssen, wie sie anfallen, sondern nach individuellen Kriterien für jede einzelne Maschine aufgrund von Echtzeit-Daten festlegen. Was für viele Unternehmen noch wie ein Traum klingt, der zu schön klingt, um wahr zu sein, entstehen derzeit immer mehr Pilotprojekte, wie z.B. das SAP IoT bei TrenItalia oder die neuen Lösungen von IBM, die genau das Wirklichkeit werden lassen wollen. Unsere Kollegen von Maintcare informieren Sie ausführlich zum Thema SAP Predictive Maintenance.
Fest steht, wer diese Innovationen verpasst, dem droht nicht nur ein dauerhafter Wettbewerbsnachteil. Vielmehr verlieren Unternehmen, die zu konservativ an ihren alten festgefahrenen Strukturen festhalten und sich gegen diese Innovationen dauerhaft wehren, jegliche Wettbewerbsfähigkeit in einer Zukunft, die zunehmend von disruptiven Entwicklungen am Markt beherrscht wird.