So verwenden Sie maschinelles Lernen in der Big-Data-Analyse
Veröffentlicht: 2022-09-30Maschinelles Lernen ermöglicht es Unternehmen, Big Data in gewinnsteigernde Erkenntnisse umzuwandeln. Erfahren Sie, wie Big Data und maschinelles Lernen zusammenhängen und wie Sie sie verwenden.
Vor Jahren mussten sich Geschäftsinhaber auf ihr Gedächtnis verlassen, um die Art und Weise anzupassen, wie sie ihre Kundschaft bedienten. Als Frau Jones hereinkam, musste sich eine Ladenbesitzerin daran erinnern, was sie das letzte Mal gekauft hatte, ob sie es schließlich zurückgebracht hatte oder nicht und ob sie sich bei ihrem letzten Besuch darüber beschwert hatte.
Dank Big Data stehen Ihnen jetzt Tonnen von Kunden- und Geschäftsdaten zur Verfügung. Sie wissen, wo Frau Jones lebt, was sie in den letzten 10 Jahren gekauft hat, wie viel sie ausgegeben hat, wie oft sie Artikel zurückgibt und Dutzende anderer Kennzahlen. Mithilfe von maschinellem Lernen können Sie diese und andere Daten in geschäftsfördernde Erkenntnisse umwandeln. Hier ist eine Aufschlüsselung von Big Data und maschinellem Lernen und wie Sie diese nutzen können, um Ihr Unternehmen voranzubringen.
Was sind Big Data und maschinelles Lernen?
Big Data und maschinelles Lernen sind unterschiedlich und doch eng miteinander verbunden.
Was ist Big Data?
Big Data bezieht sich auf riesige oder unglaublich komplexe Datensätze, die ohne spezialisierte Tools möglicherweise nicht genutzt werden können. Manche Unternehmen müssen sich nie mit Big Data auseinandersetzen. Wenn Sie beispielsweise ein Restaurant mit drei Standorten haben, das Verkaufs- und Bestandsdaten produziert, handelt es sich nicht um „Big Data“.
Wenn dasselbe Restaurant andererseits 10 weitere Standorte und eine mobile App hinzufügt, die es Kunden ermöglicht, online Bestellungen aufzugeben, Treueprämien zu nutzen und mit einem Kundendienstmitarbeiter per SMS zu chatten, haben Sie jetzt eine Big-Data-Situation. Allein die App kann Daten produzieren über:
- Die Mahlzeiten, die Kunden am häufigsten bestellen
- Die Tageszeiten, zu denen Kunden Bestellungen aufgeben
- Wo Kunden Lebensmittel bestellen, basierend auf Geolokalisierungsdaten
- Wohnort der Kunden und die mit jeder Stadt verbundenen Kaufstatistiken
- Verkaufsdaten von jedem Standort
- Wie Kunden ihre Prämienpunkte verwenden
- Einkaufsdaten während Spitzen- und Ferienzeiten
Diese Beispiele kratzen nur an der Oberfläche. Diese Art von App könnte Dutzende von Datensätzen generieren. Außerdem würden die Informationen nahezu konstant einströmen. Das ist Big Data.
Was ist maschinelles Lernen?
Maschinelles Lernen (ML) bezieht sich auf die Verwendung von Computern, um Muster in Daten zu erkennen. Maschinelles Lernen tut dies mithilfe von Algorithmen, bei denen es sich um Schritt-für-Schritt-Anweisungen handelt. Ein maschinelles Lernmodell verwendet die Schritte in einem Algorithmus, um Muster zu lernen. Dazu gehört auch, Musterbrüche zu erkennen und zu lernen, Muster miteinander zu vergleichen.
Nehmen wir als einfaches Beispiel an, Sie möchten einen Algorithmus für maschinelles Lernen erstellen, um Verkaufsdaten zu analysieren. Sie haben Verkaufszahlen aus fünf Jahren. Ihr Ziel ist es, die Sommergewinne zu maximieren, indem Sie herausfinden, welche Produkte Sie zwischen Juni und August zum Verkauf anbieten sollten.
Sie könnten Ihr maschinelles Lernsystem so programmieren, dass es:
- Aggregieren Sie die Verkaufsdaten für jedes Ihrer Produkte Monat für Monat.
- Identifizieren Sie die Produkte mit dem höchsten Verkaufsvolumen zwischen Juni und August.
- Prognostizieren Sie die Verkäufe, die mit dem Angebot jedes Produkts verbunden sind.
- Sagen Sie Ihnen, welche Produkte Sie anbieten sollen und ob Sie sie im Juni, Juli, August oder in allen drei Monaten anbieten sollten.
Natürlich könnten Sie ML noch einen Schritt weiter gehen und Ihre Warenkosten (COGS) für jedes Produkt einbeziehen, einschließlich Versand, Arbeit, Lagerung und anderer Daten. Dann könnte Ihr ML-Modell nicht nur die Produkte mit dem höchsten Sommerumsatz empfehlen, sondern Ihnen auch sagen, welche den größten Nettogewinn bringen.
Sie könnten dann dasselbe Modell verwenden, um Verkaufseinblicke zu liefern für:
- Einzelne Produkte im Laufe eines Jahres
- Neue Produkte für ähnliche Zielmärkte
- Jeden zweiten Monat im Jahr
Was ist maschinelles Lernen in Big Data?
Im Kontext von Big Data können Sie immer dann, wenn es Muster in Daten gibt, maschinelles Lernen verwenden, um sie zu entdecken und nützliche Erkenntnisse zu gewinnen. Außerdem können Sie ML verwenden, um Empfehlungen basierend auf den Mustern zu geben, die die Algorithmen analysieren.
Wie maschinelles Lernen mit Big Data funktioniert
Eine der beliebtesten Anwendungen des maschinellen Lernens sind selbstfahrende Fahrzeuge. Das Auto nutzt maschinelles Lernen, um zu entscheiden, was in Bezug auf Daten, die es aus seiner Umgebung und anderen Fahrzeugen sammelt, zu tun ist.
Wenn beispielsweise die Kameras in einem selbstfahrenden Fahrzeug ein Stoppschild „sehen“, können sie es als solches erkennen und automatisch bremsen. Der Prozess hinter dieser Entscheidung begann höchstwahrscheinlich damit, dass eine Gruppe von Datenwissenschaftlern mehrere Algorithmen für maschinelles Lernen testete. Auf hoher Ebene erfolgt dies in drei Schritten:
1. Ausbildung
Um Big Data zu analysieren, verwenden Data Scientists zunächst ein Trainingsset, um einem oder mehreren Algorithmen beizubringen, wonach sie suchen sollen.
Bei einem Stoppschild würde der Trainingssatz beispielsweise aus Tausenden von Bildern von Stoppschildern bestehen. Dateningenieure präsentierten Bilder von Stoppschildern aus verschiedenen Winkeln, bei unterschiedlicher Beleuchtung und sogar mit Bäumen oder anderen Objekten, die sie teilweise blockierten.
Am Ende der Trainingsphase soll der Algorithmus Muster in Form und Farbe von Stoppschildern erkannt haben. Mit anderen Worten, es weiß, wie ein Stoppschild „aussieht“ – und zwar in unterschiedlicher Beleuchtung und aus verschiedenen Blickwinkeln.
2. Validierung
Der Validierungssatz wird verwendet, um herauszufinden, wie genau das ML-Modell einen völlig anderen Satz von Big Data verwendet. Der Zweck der Validierungsphase besteht darin, Möglichkeiten zur Feinabstimmung des ML-Modells zu entdecken.
Nehmen wir zum Beispiel an, das ML-Modell zur Erkennung von Stoppschildern sei zu 95 % genau und alle falsch aufgenommenen Bilder seien sehr dunkel. Die Entwickler könnten dann eine andere Formel verwenden, die den Kontrast jedes Bildes erhöht und wichtige Merkmale für das ML-Modell leichter sichtbar macht.
3. Testen
In der Testphase wird das ML-Modell mit mehr Big Data gefüttert, die sich vollständig von dem unterscheiden, was es während der Trainings- und Validierungsphase gesehen hat.

Um beispielsweise das Stoppschildmodell zu testen, könnten die Programmierer dem ML-Modell 250.000 Bilder verschiedener Arten von Schildern zeigen, von denen einige Stoppschilder sind. Anschließend analysierten sie die Ergebnisse, um zu sehen, wie genau das Modell Stoppschilder unterscheiden konnte – und um zu vermeiden, dass andere Arten von Schildern falsch identifiziert wurden.
Herausforderungen mit maschinellem Lernen und Big Data
Zwei der größten Herausforderungen für Datenwissenschaftler, die ML zur Untersuchung von Big Data verwenden, sind Ungenauigkeit und ethische Dilemmata.
1. Ungenauigkeit
Selbst wenn fortgeschrittene Rechenprozesse involviert sind, werden Sie natürlich immer noch ein Trial-and-Error-Element durchlaufen, wenn Sie maschinelles Lernen in der Big-Data-Analyse verwenden. Dies liegt daran, dass Sie nie wissen, welche Faktoren Ihre Ergebnisse beim Trainieren, Validieren und Testen Ihres Modells verfälschen könnten.
Wenn Sie beispielsweise Bilder wie Stoppschilder oder menschliche Gesichter identifizieren, können mehrere Faktoren zu einer schlechten Leistung Ihres ML-Modells beitragen. Angenommen, Sie entwickeln ein Modell für maschinelles Lernen, um das Sicherheitssystem Ihres Unternehmens zu verbessern. Insbesondere möchten Sie ein Modell, das die Gesichter von Führungskräften und anderen hochrangigen Personen identifizieren kann, damit ihnen Zugang zu sensiblen Bereichen des Gebäudes gewährt werden kann. Während der Validierungsphase ist das System nur zu etwa 65 % genau. Dies kann jedoch auf mehrere Variablen zurückzuführen sein, z.
- Pixelige Bilder von Gesichtern
- Unscharfe Bilder
- Die Person, die während des Gesichtsscans wegschaut
- Die Person, die sich entscheidet, eine Sonnenbrille, eine Gesichtsmaske, einen Schal oder etwas anderes zu tragen, das die Identifizierungsergebnisse verfälschen könnte
2. Ethische Dilemmata
Es gibt auch ethische Herausforderungen. Angenommen, eine Personalabteilung verwendet maschinelles Lernen, um die qualifiziertesten Kandidaten zu identifizieren und sie aus einem digitalen Stapel von 1.500 Lebensläufen herauszuziehen.
Wenn das ML-Modell mit Unternehmen und Einstellungsabteilungen trainiert wurde, die nur von Männern geführt werden, können die Daten Voreingenommenheit enthalten. Einige Männer neigen eher dazu, andere Männer einzustellen – aus anderen Gründen als ihren Verdiensten oder Qualifikationen. Daher kann der „erfolgreiche“ Kandidat, nach dem die Ingenieure das ML-Modell trainiert haben, in den meisten Fällen männlich sein. Infolgedessen empfiehlt das Modell Männer statt Frauen, die möglicherweise besser qualifiziert waren.
Wie hängen Big Data und maschinelles Lernen im geschäftlichen Kontext zusammen?
In einem geschäftlichen Kontext nutzt maschinelles Lernen die Big Data, die Ihr Unternehmen produziert, um geschäftskritische Prozesse zu verbessern oder zu automatisieren und die Sicherheit zu erhöhen. Die potenziellen Anwendungen sind buchstäblich endlos – und so vielfältig wie die verschiedenen Arten von Daten, die Sie produzieren.
Beispielsweise könnte eine Fabrik oder Produktionsstätte maschinelles Lernen verwenden, um die Temperatur- und Feuchtigkeitswerte für ihre Fabrikhalle zu optimieren. Machine-Learning-Modelle können beispielsweise Folgendes herausfinden:
- Die Temperatur- und Feuchtigkeitswerte, die die Produktivität der Mitarbeiter maximieren und gleichzeitig die Anzahl der ungeplanten Pausen minimieren, die sie einlegen müssen
- Die idealen Temperatur- und Feuchtigkeitswerte für empfindliche Geräte, die sich unter falschen Bedingungen schneller verschlechtern könnten
- Die kosteneffizientesten Temperatur- und Feuchtigkeitsbedingungen angesichts der Kosten für den Betrieb von HLK-Systemen und Luftentfeuchtern
Das System könnte dann verwendet werden, um Ihr atmosphärisches System automatisch zu steuern, um optimale Ergebnisse zu erzielen.
Wie werden Machine Learning und Big Data Analytics im Marketing eingesetzt?
Marketing bietet einige der vielversprechendsten Anwendungen für maschinelles Lernen und Big-Data-Analysen. Betrachten Sie das folgende Beispiel aus dem wirklichen Leben.
Albert von Harley Davidson steigert Leads um 2.930 %
Harley Davidson baute einen Roboter namens Albert, der maschinelles Lernen nutzt, um Marketingentscheidungen zu treffen [1] . So half Albert den Führungskräften von Harley Davidson, in einen helleren Sonnenuntergang zu reiten.
Harley Davidson wollte die bestehenden Beziehungen zu früheren Kunden nutzen. Sie benutzten Albert, um Folgendes zu analysieren:
- Wie oft Menschen Einkäufe getätigt haben
- Wie viel diese Kunden ausgegeben haben
- Wie viel Zeit haben Kunden damit verbracht, auf der Website von Harley Davidson zu surfen
Albert nutzte diese Daten dann, um die Kunden in verschiedene Segmente zu unterteilen. Das Marketingteam erstellte dann Testkampagnen für jede Kundenkategorie. Nachdem der Erfolg der Kampagne getestet worden war, erweiterte das Team sie, um eine Vielzahl früherer Kunden einzubeziehen.
Infolgedessen steigerte Harley Davidson seinen Umsatz um 40 %. Sie generierten auch 2.930 % mehr Leads. Die Hälfte dieser Hinweise wurde direkt von Albert selbst identifiziert. Albert untersuchte die Profile von Leads, die mit hoher Wahrscheinlichkeit zu zahlenden Kunden werden, und untersuchte dann die Datenprofile anderer Benutzer und lokalisierte „Lookalikes“ oder Personen, die viel mit den hochkonvertierenden Kunden gemeinsam haben.
Ganz gleich, ob Sie herausfinden möchten, was Frau Jones als nächstes kaufen wird, oder ob Sie die Effizienz einer komplexen Produktionsanlage optimieren möchten, maschinelles Lernen kann scheinbar zufällige Big Data in transformative Erkenntnisse verwandeln. Mit ein wenig Brainstorming und kreativem Denken können Sie Wege finden, ML und Big Data zu nutzen, um die Konkurrenz zu überholen und Ihr Unternehmen auf die nächste Stufe zu bringen.
Möchten Sie mehr über Tools erfahren, die Ihnen bei Big Data helfen können?
Big-Data-Software kann dazu beitragen, dass Ihr Unternehmen das Beste aus Big Data und Analysen herausholt. Durchsuchen und vergleichen Sie einige der Top-Tools, lesen Sie Bewertungen und finden Sie die beste Lösung für Ihre spezifischen Geschäftsanforderungen.
Quellen
1. Harley Davidson NYC erreicht mit Albert, Albert.ai, ein Allzeithoch