Aktuelles:

Wie gut spielen Sie Data-Science-Buzzword-Bingo?

15 Februar 2021

In der heutigen Geschäftswelt ist Data Science ein Schlagwort geworden, um das man einfach nicht mehr herumkommt. Im Zusammenhang damit sind wir ständig mit sogenannten Buzzwords konfrontiert: Künstliche Intelligenz, Machine Learning oder Data Mining... Doch obwohl die Begriffe ständig in Verwendung sind, wissen die wenigsten, was sie eigentlich bedeuten und was wirklich hinter ihnen steckt. Wir klären auf und fordern Sie heraus: Wie gut spielen Sie das Data-Science-Buzzword-Bingo?


Künstliche Intelligenz (KI): Wenn das Schlagwort künstliche Intelligenz fällt, stellen sich viele Maschinen vor, die denken, fühlen und entscheiden, wie wir Menschen es tun. Auch wenn die Realität noch anders aussieht, ist der Grundgedanke der richtige. Künstliche Intelligenz ist nämlich ein Forschungsfeld, das sich damit beschäftigt, menschliches Verhalten durch Maschinen nachzubilden. Ziel ist es, Computer und Maschinen zum „Denken“ zu befähigen, d.h. dass sie rationale Entscheidungen ohne das Eingreifen von Menschen treffen können.


Starke KI: Eine starke KI ist das, was wir in Hollywood-Filmen oft als künstliche Intelligenz verkauft bekommen. Sie kann jedes beliebige Problem lösen und ist mit dem menschlichen Denkvermögen vergleichbar. Davon sind wir derzeit aber noch weit entfernt und die Entwicklung einer starken KI ist durchaus umstritten: einerseits dahingehend, ob es grundsätzlich möglich ist. Andererseits, ob sie erstrebenswert ist, da sich eine solche Intelligenz selbst verbessert und damit die menschliche Intelligenz schnell in den Schatten stellt.


Schwache KI: Künstliche Intelligenz, so wie es sie heute gibt, ist mehr oder minder Computercode, der mathematische und statistische Modelle abbildet. Auf Basis dieses Codes und den dahinterliegenden Modellen sind Maschinen bzw. der Computer fähig, Probleme zu lösen. Eine schwache KI ist darauf trainiert, ein spezielles Problem zu lösen. Sie erkennt z.B. Bilder oder berechnet Umsatzprognosen. So kann eine schwache Bilderkennungs-KI zwar erkennen, was auf einem Foto abgebildet ist, spielt man derselben KI allerdings Musik vor und möchte, dass sie Liedtexte interpretiert, wird man lange auf ein Ergebnis warten. Von generalistischem, menschenähnlichem Denken sind wird hier weit entfernt.


Machine Learning: Machine Learning wird oft mit Lernen verglichen. Dabei geht es im Prinzip darum, dass ein Computer auf Basis von Datenpunkten, die er bereits gesehen hat, und gegebenen Lösungen versucht, Gleichungen aufzustellen. Mit ihrer Hilfe berechnet er Wahrscheinlichkeiten, um die richtige Lösung zu bestimmen. Ein plakatives Beispiel: „Es ist groß, es ist rund, es ist in der Nacht am Himmel, ich habe 1.000 Bilder von nächtlichen Himmelsaufnahmen gesehen und in 999 war es ein Vollmond. Deswegen sage ich, es muss auch in diesem Fall (mit größter Wahrscheinlichkeit) ein Vollmond sein.“


Deep Learning: Deep Learning wiederum ist eine bestimmte Methodik im Bereich Machine Learning, die besonders für Bild-, Text- und Spracherkennung eingesetzt wird. Versucht wird dabei, die Funktionsweise des menschlichen Gehirns…


Neural Networks: …mithilfe eines künstlichen neuronalen Netzes nachzuahmen. Der Input auf der einen Seite stimuliert künstliche Neuronen, die wiederum weitere Neuronen stimulieren, bis auf der anderen Seite der Output ausgegeben wird.


Machine-Learning-Bibliotheken: Vielleicht sind Ihnen im Zusammenhang mit Machine bzw. Deep Learning schon Begriffe wie TensorFlow, Keras oder scikit-learn untergekommen. Dabei handelt es sich um Software-Frameworks, mit denen Machine-Learning- bzw. Deep-Learning-Modelle implementiert werden können.


Big Data: Bei diesem Buzzword verrät der Name schon, worum es sich handelt: nämlich große Datenmengen. So unglaublich groß, dass sie für uns schwer vorstellbar sind, denn wir sprechen hier von Mengen, die weder auf einem oder zwei Computern Platz finden, sondern ganze Zusammenschlüsse von Computern benötigen, um gespeichert und verarbeitet zu werden. Und da Big Data nicht nur von herkömmlicher Hardware nicht verarbeitet werden kann, ist es wohl wenig überraschend, dass auch eine spezielle Software – wie Hadoop oder Spark – notwendig ist, um die riesigen Datenmengen verarbeiten zu können, die auf verschiedenen Systemen liegen.


Business Intelligence: Im Allgemeinen versteht man unter Business Intelligence das Sammeln, Aufbereiten und Darstellen geschäftsrelevanter Informationen, sodass Entscheidungstragende den Status quo und die zukünftigen Perspektiven ihres Unternehmens kennen. Oder aber salopp ausgedrückt: Informationen werden so aufbereitet, dass sie von allen schnell verstanden wird und unternehmerische Entscheidungen abgeleitet werden können.


Data Mining: Wie der Name schon vermuten lässt, versucht Data Mining etwas in den Daten Verborgenes zu Tage zu bringen – wie der Bergarbeiter in der Mine eben. So wird unter Einsatz von Mathematik, Statistik und Informatik versucht, Muster, Ähnlichkeiten und Querverbindungen in einer Datenmenge freizulegen. Data-Mining-Techniken identifizieren lediglich Muster, der weitere Schritt der Interpretation und Weiterverarbeitung der Information bleibt aus und muss entweder durch den Menschen oder z.B. durch einen Machine-Learning-Algorithmus passieren.


Datenmodell: Wie überall im Leben ist auch im Data Science Ordnung notwendig, um nicht den Überblick zu verlieren. Datenmodelle schaffen diese Ordnung. Ein Datenmodell legt fest, wie die zu verarbeitenden Daten, die in Tabellen gespeichert werden, organisiert sind und zueinander in Beziehung stehen. Datenmodelle sind die Grundlage für eine geordnete Speicherung und Verarbeitung.


Data Scientist: Und wenn Sie sich fragen: „Wer beschäftigt sich eigentlich gerne mit all diesen Themen?“, dann ist dieses Buzzword wohl die Antwort. Kurzum sind Data Scientists Leute, die den „sexiest job of the 21st century“ innehaben und unter Einsatz unterschiedlicher Methoden versuchen, aus großen strukturierten oder unstrukturierten Datenmengen Wissen zu generieren. Aus diesem können wiederum Entscheidungen abgeleitet werden.

 

 


Und? Wie haben Sie abgeschnitten? Wussten Sie bereits, was hinter jedem Begriff steht oder haben Sie doch noch etwas dazulernen können? Wir hoffen, dass Sie das nächste Mal mit Ihrem neu gewonnenen Wissen glänzen können.

 

Sie haben noch Fragen? Wir unterstützen Sie gerne bei der Erarbeitung und Implementierung Ihrer Datenstrategie. 

Christina Maria Jäger

Christina Maria Jäger
+43 316 3637-837
[email protected]
 

Stefan Holl

+43 316 3637-843
[email protected]