Beaufsichtigtes vs. unbeaufsichtigtes Lernen: Welches Machine-Learning-Modell ist das Richtige für Sie?

Veröffentlicht: 2022-05-07

Maschinelles Lernen muss nicht rätselhaft sein. Wir werden die zwei häufigsten Typen und ihre Anwendungsfälle in diesem Artikel aufschlüsseln.

Eine Person und eine Maschine teilen Daten miteinander

Als Führungskraft wissen Sie, dass die Einführung neuer Technologien Schwachstellen lindern und Ihr Unternehmen wettbewerbsfähiger machen kann. Aus diesem Grund haben sich viele Unternehmen in einem Jahr des Umbruchs der digitalen Transformation zugewandt, um sie zu bewältigen.

Möglicherweise kennen Sie auch das Potenzial neuer Technologien wie maschinelles Lernen, die Ihr Unternehmen zukunftssicher machen können. Aber Käufer aufgepasst – wenn Sie die Anwendungen des maschinellen Lernens nicht verstehen, riskieren Sie, Geld für unbrauchbare Ergebnisse zu verschwenden. Nehmen Sie das Beispiel unten, um zu sehen, was wir meinen.

Um uns auf das Schreiben dieses Artikels vorzubereiten, haben wir ein Tool zur Erzeugung natürlicher Sprache (NLG) verwendet, das uns dabei hilft zu verstehen, wie überwachtes und unbeaufsichtigtes Lernen am besten aufgeschlüsselt werden können. Hier ein Auszug aus unserem NLG-Pendant:

„Jedes unüberwachte Lernmodell bietet Ahead-Tensorong-Matrizen basierend auf dem Korrelationskoeffizienten, falsch-positiven Antworten, ziemlich minimalen statistisch nützlichen Daten (oder stark davon abhängig) und wird zur Dimensionsreduktion unter Verwendung von Diagrammen und Bäumen verwendet, um ihre eigenen Grenzdatenpunkte zu generieren.“

Verwirrt sein? Wir auch. Aber trotz der verwirrenden Syntax der Sätze des NLG-Tools war dieses Experiment mit künstlicher Intelligenz (KI) nicht völlig nutzlos. Es hat uns klar gemacht, dass es wichtig ist, die richtige Anwendung zu finden, wenn es darum geht, die besten Ergebnisse mit KI zu erzielen – und genau deshalb haben wir diesen Leitfaden geschrieben, um Ihnen zu helfen.

Wir sprachen mit Thomas Wood, einem Data-Science-Berater für Fast Data Science, und er half dabei, das Thema in leicht verständliche Begriffe zu fassen. Mithilfe von Wood erklären wir den Unterschied zwischen zwei gängigen Methoden des maschinellen Lernens, dem überwachten und dem unüberwachten Lernen, und welche Anwendungsfälle für jede Methode am besten geeignet sind.

Neu beim maschinellen Lernen? Sehen Sie sich diese Schlüsselkonzepte an, bevor Sie sich mit dem Rest dieses Artikels befassen:

  • Maschinelles Lernen (ML) ist eine Teilmenge der künstlichen Intelligenz (KI), die Probleme mithilfe von Algorithmen und statistischen Modellen löst, um Wissen aus Daten zu extrahieren. Im Großen und Ganzen können alle Modelle des maschinellen Lernens in überwachtes oder nicht überwachtes Lernen eingeteilt werden.
  • Ein Algorithmus beim maschinellen Lernen ist ein Verfahren, das auf Daten ausgeführt wird, um ein maschinelles Lernmodell zu erstellen.
  • Ein Modell beim maschinellen Lernen ist die Ausgabe eines maschinellen Lernalgorithmus, der auf Daten ausgeführt wird. Das heißt, ein Modell stellt dar, was von einem maschinellen Lernalgorithmus gelernt wurde.

Was sind die Hauptunterschiede zwischen überwachtem und unüberwachtem Lernen?

Wenn wir es auf einen Satz reduzieren müssten, wäre es dieser: Der Hauptunterschied zwischen überwachtem Lernen und unüberwachtem Lernen besteht darin, dass überwachtes Lernen beschriftete Daten verwendet, um Ergebnisse vorherzusagen, während unüberwachtes Lernen dies nicht tut.

Es gibt jedoch weitere Nuancen zwischen den beiden Ansätzen, die wir weiter klären werden, damit Sie den besten Ansatz für Ihre Situation auswählen können.

Wie überwachtes maschinelles Lernen funktioniert

Wie oben erwähnt, verwendet überwachtes Lernen beschriftete Daten, um das Modell zu trainieren. Aber was bedeutet das in der Theorie? Lassen Sie uns zunächst einige Beispiele durchgehen.

Beim überwachten Lernen werden dem Modell sowohl Eingaben als auch entsprechende Ausgaben bereitgestellt. Angenommen, wir trainieren das Modell, um verschiedene Arten von Früchten zu identifizieren und zu klassifizieren. In diesem Beispiel stellen Sie mehrere Bilder von Früchten als Eingabe bereit, zusammen mit ihrer Form, Größe, Farbe und ihrem Geschmacksprofil. Als Nächstes stellen Sie dem Modell die Namen der einzelnen Früchte als Ausgabe bereit.

Schließlich erkennt der Algorithmus ein Muster zwischen den Eigenschaften der Früchte (den Eingaben) und ihren Namen (den Ausgaben). Sobald dies geschieht, kann das Modell mit einer neuen Eingabe versehen werden und es wird die Ausgabe für Sie vorhersagen. Diese Art des überwachten Lernens, Klassifikation genannt, ist am weitesten verbreitet .

Wie unüberwachtes maschinelles Lernen funktioniert

Im Gegensatz dazu funktioniert unüberwachtes Lernen, indem es dem Modell beibringt, Muster aus nicht gekennzeichneten Daten selbst (daher unüberwacht ) zu erkennen. Das bedeutet, dass eine Eingabe bereitgestellt wird, aber keine Ausgabe.

Um zu verstehen, wie das funktioniert, fahren wir mit dem oben angegebenen Fruchtbeispiel fort. Beim unüberwachten Lernen stellen Sie dem Modell den Eingabedatensatz (die Bilder der Früchte und ihre Eigenschaften) zur Verfügung, aber Sie liefern nicht die Ausgabe (die Namen der Früchte).

Das Modell wird einen geeigneten Algorithmus verwenden, um sich selbst zu trainieren, die Früchte nach den ähnlichsten Merkmalen in verschiedene Gruppen zu unterteilen. Diese Art des unüberwachten Lernens, Clustering genannt, ist am weitesten verbreitet.

Müssen Sie die beiden Modelle für maschinelles Lernen noch einmal durchlaufen? Sehen Sie sich dieses kurze Video an, um eine allgemeine Erklärung zu erhalten:

Wann sollte überwachtes Lernen vs. unüberwachtes Lernen eingesetzt werden?

Ob Sie überwachtes oder unüberwachtes Lernen verwenden sollten, hängt von Ihren Zielen und der Struktur und dem Umfang der Ihnen zur Verfügung stehenden Daten ab. Bevor Sie eine Entscheidung treffen, lassen Sie Ihren Data Scientist Folgendes bewerten:

  • Handelt es sich bei den Eingabedaten um unbeschriftete oder beschriftete Datensätze? Wenn es nicht gekennzeichnet ist, kann Ihr Team eine zusätzliche Kennzeichnung unterstützen?
  • Was ist das Ziel, das Sie erreichen möchten? Arbeiten Sie mit einem wiederkehrenden, klar definierten Problem oder muss der Algorithmus neue Probleme vorhersagen?
  • Gibt es Algorithmen, die Ihre Datenmenge und -struktur unterstützen? Haben sie die gleiche Dimensionalität, die Sie benötigen (Anzahl der Features oder Attribute)?

Wann sollte überwachtes maschinelles Lernen verwendet werden?

Laut Gartner ist überwachtes Lernen die beliebteste und am häufigsten verwendete Art des maschinellen Lernens in Geschäftsszenarien. Dies liegt wahrscheinlich daran, dass die Klassifizierung von Big Data zwar eine echte Herausforderung beim überwachten Lernen sein kann, die Ergebnisse jedoch sehr genau und vertrauenswürdig sind (vollständige Quelle für Kunden verfügbar).

Hier sind einige Beispiele für Anwendungsfälle für überwachtes Lernen. Einige sind branchenspezifisch, während andere für jede Organisation gelten können:

  • Risikofaktoren für Krankheiten erkennen und vorbeugende Maßnahmen planen
  • Klassifizieren, ob eine E-Mail Spam ist oder nicht
  • Hauspreise vorhersagen
  • Kundenabwanderung vorhersagen
  • Vorhersage von Niederschlag und Wetterbedingungen
  • Herausfinden, ob ein Kreditantragsteller risikoarm oder risikoreich ist
  • Vorhersage des Ausfalls mechanischer Teile in Automotoren
  • Vorhersage von Social Media Share Scores und Performance Scores

Wood teilte uns ein Beispiel mit, wie er mithilfe von überwachtem Lernen ein Triage-System für die eingehenden E-Mails eines Kunden erstellte. Mit Hilfe eines CRM-Systems wurden E-Mails in Gruppen kategorisiert, die häufige Anfragen repräsentierten (z. B. Adressänderung von Kunden, Reklamationen). Wood verwendete diese Kategorien dann, um ein Modell zu trainieren, sodass es beim Empfang einer neuen eingehenden E-Mail weiß, welcher Kategorie diese E-Mail zuzuordnen ist. Er sagt:

„Überwachtes Lernen war in diesem Fall möglich, weil das CRM-System vorhanden war, das eine Reihe von ‚Etiketten' zum Trainieren des Modells bereitstellte. Ohne diese wäre nur unüberwachtes Lernen möglich gewesen.“

Möchten Sie Ihren Posteingang aufräumen? Beginnen Sie mit CRM-Software.

Wann unüberwachtes maschinelles Lernen verwendet werden sollte

Im Gegensatz zum überwachten Lernen können beim unüberwachten Lernen große Datenmengen in Echtzeit verarbeitet werden. Und da das Modell automatisch Strukturen in Daten identifiziert (Klassifizierung), ist es in Fällen nützlich, in denen ein Mensch Schwierigkeiten hätte, Trends in den Daten selbst zu finden.

Wenn Sie beispielsweise versuchen, potenzielle Verbraucher zu Marketingzwecken in Gruppen zu unterteilen, wäre eine unüberwachte Clustering-Methode ein guter Ausgangspunkt.

Hier sind einige Beispiele für Anwendungsfälle für unüberwachtes Lernen:

  • Gruppierung von Kunden nach ihrem Kaufverhalten
  • Finden von Korrelationen in Kundendaten (z. B. können Personen, die eine Tasche in einem bestimmten Stil kaufen, auch an einem bestimmten Schuhstil interessiert sein)
  • Daten nach Kaufhistorie segmentieren
  • Personen nach unterschiedlichen Interessen klassifizieren
  • Gruppieren von Beständen nach Herstellungs- und Verkaufsmetriken

Wood erklärte uns, dass er einmal für ein Pharmaunternehmen mit Produktionsstätten auf der ganzen Welt gearbeitet habe. Die Software, mit der das Unternehmen Fehler aufzeichnete, die in seinen Einrichtungen aufgetreten waren, verfügte nicht über ein Dropdown-Menü mit häufigen Fehleroptionen zur Auswahl.

Aus diesem Grund dokumentierten Fabrikarbeiter Fehler im Klartext (entweder in Englisch oder ihrer Landessprache). Das Unternehmen wollte die Ursachen häufiger Herstellungsprobleme wissen, aber ohne eine Kategorisierung der Fehler war es unmöglich, die Daten statistisch zu analysieren.

Wood verwendete einen unüberwachten Lernalgorithmus, um Gemeinsamkeiten in den Fehlern zu entdecken. Er war in der Lage, die größten Themen zu identifizieren und Statistiken zu erstellen, wie z. B. Tortendiagramm-Aufschlüsselungen der häufigsten Herstellungsprobleme im Unternehmen. Holz sagt:

„Das verschaffte dem Unternehmen auf einen Blick einen Überblick über die Probleme in seinem Geschäft, was ansonsten einen erheblichen manuellen Aufwand erfordert hätte.“

Bereiten Sie sich auf eine intelligente Zukunft vor: Setzen Sie auf maschinelles Lernen

Maschinelles Lernen ist ein leistungsstarkes Tool, mit dem Sie Geschäftsprobleme lösen und datengesteuerte Entscheidungen treffen können. Hoffentlich gibt Ihnen dieser Artikel einige Ideen dazu, wie überwachtes oder nicht überwachtes maschinelles Lernen in Ihrer Organisation implementiert werden könnte.

Wenn Sie bereit sind, die Technologie des maschinellen Lernens einzusetzen, sollten Ihre nächsten Schritte darin bestehen, die Fähigkeiten Ihres aktuellen Software-Stacks zu evaluieren. Fragen Sie dann Ihren/Ihre Anbieter nach Anwendungsfällen von anderen Kunden in Ihrer Branche, die zu den Anwendungen passen, für die Sie maschinelles Lernen einsetzen möchten.

Hast du das Gefühl, es gibt noch mehr zu lernen? Schauen Sie sich diese zugehörigen Lesungen von Capterra an:

  • Was ist maschinelles Lernen? Ihr wesentliches Business Intelligence-Glossar
  • Der Savvy Small Business Guide zu maschinellem Lernen vs. künstlicher Intelligenz
  • Top-Anwendungen der künstlichen Intelligenz für kleine Unternehmen

Sehen Sie sich auch das Verzeichnis der maschinellen Lernsoftware von Capterra an, wo Sie Bewertungen von echten Benutzern lesen und Tools nach ihrem Preis oder ihren Funktionen filtern können.