Uczenie nadzorowane a uczenie nienadzorowane: który model uczenia maszynowego jest dla Ciebie odpowiedni?

Opublikowany: 2022-05-07

Uczenie maszynowe nie musi być tajemnicze. W tym artykule przedstawimy dwa najczęstsze typy i ich przypadki użycia.

Osoba i maszyna dzielące się danymi

Jako lider biznesowy wiesz, że zastosowanie nowej technologii może złagodzić problemy i zwiększyć konkurencyjność Twojej firmy. Dlatego w ciągu roku zakłóceń wiele firm zwróciło się ku cyfrowej transformacji, aby przetrwać.

Możesz również być świadomy potencjału nowych technologii, takich jak uczenie maszynowe, które mogą sprawić, że Twoja firma będzie odporna na przyszłość. Ale uwaga kupujących — jeśli nie rozumiesz zastosowań uczenia maszynowego, ryzykujesz marnowanie pieniędzy na bezużyteczne wyniki. Spójrz na poniższy przykład, aby zobaczyć, co mamy na myśli.

Aby przygotować się do napisania tego artykułu, wykorzystaliśmy narzędzie do generowania języka naturalnego (NLG), które pomoże nam zrozumieć, jak najlepiej rozbić naukę nadzorowaną i nienadzorowaną. Oto fragment naszego odpowiednika NLG:

„Każdy nienadzorowany model uczenia zapewnia macierze tensorongów wyprzedzających oparte na współczynniku korelacji, fałszywie pozytywnych odpowiedziach, dość minimalnych statystycznie użytecznych danych (lub w dużym stopniu od nich zależnych), są wykorzystywane do redukcji wymiarowości za pomocą wykresów i drzew do generowania własnych punktów danych granic”.

Czuć się zmieszanym? Nas też. Jednak pomimo oszałamiającej składni zdań narzędzia NLG, ten eksperyment ze sztuczną inteligencją (AI) nie był całkowicie bezużyteczny. Uświadomiło nam to, że jeśli chodzi o uzyskanie najlepszych wyników ze sztucznej inteligencji, znalezienie odpowiedniej aplikacji ma znaczenie — właśnie dlatego napisaliśmy ten przewodnik, aby Ci pomóc.

Rozmawialiśmy z Thomasem Woodem, konsultantem ds. nauki danych w firmie Fast Data Science, który pomógł wyjaśnić temat w łatwy do zrozumienia sposób. Z pomocą Wood wyjaśnimy różnicę między dwiema popularnymi metodami uczenia maszynowego, uczeniem nadzorowanym i nienadzorowanym, oraz wyjaśnimy, jakie przypadki użycia najlepiej pasują do każdej metody.

Nowy w uczeniu maszynowym? Przejrzyj te kluczowe koncepcje, zanim przejdziesz do dalszej części tego artykułu:

  • Uczenie maszynowe (ML) to podzbiór sztucznej inteligencji (AI), który rozwiązuje problemy przy użyciu algorytmów i modeli statystycznych do wydobywania wiedzy z danych. Ogólnie rzecz biorąc, wszystkie modele uczenia maszynowego można podzielić na uczenie nadzorowane lub nienadzorowane.
  • Algorytm w uczeniu maszynowym to procedura uruchamiana na danych w celu utworzenia modelu uczenia maszynowego.
  • Model uczenia maszynowego jest wynikiem działania algorytmu uczenia maszynowego na danych. Oznacza to, że model reprezentuje to, czego nauczył się algorytm uczenia maszynowego.

Jakie są główne różnice między uczeniem się nadzorowanym i nienadzorowanym?

Gdybyśmy musieli sprowadzić to do jednego zdania, byłoby to tak: Główna różnica między uczeniem nadzorowanym a uczeniem nienadzorowanym polega na tym, że uczenie nadzorowane wykorzystuje dane oznaczone etykietami, aby pomóc przewidzieć wyniki, podczas gdy uczenie się nienadzorowane nie.

Istnieją jednak dodatkowe niuanse między tymi dwoma podejściami, które będziemy nadal wyjaśniać, abyś mógł wybrać najlepsze podejście do swojej sytuacji.

Jak działa nadzorowane uczenie maszynowe

Jak wspomnieliśmy powyżej, nadzorowane uczenie wykorzystuje dane oznaczone etykietami do uczenia modelu. Ale co to oznacza w teorii? Na początek przejrzyjmy kilka przykładów.

W przypadku uczenia nadzorowanego model zawiera zarówno dane wejściowe, jak i odpowiadające im wyjścia. Załóżmy, że trenujemy model, aby identyfikować i klasyfikować różne rodzaje owoców. W tym przykładzie jako dane wejściowe dostarczysz kilka zdjęć owoców, wraz z ich kształtem, rozmiarem, kolorem i profilem smakowym. Następnie jako wynik podasz model z nazwami każdego owocu.

W końcu algorytm wybierze wzorzec między cechami owoców (wejścia) a ich nazwami (wyjścia). Gdy tak się stanie, model może otrzymać nowe dane wejściowe, które będą przewidywać dane wyjściowe za Ciebie. Ten rodzaj nadzorowanego uczenia się, zwany klasyfikacją , jest najczęstszy .

Jak działa nienadzorowane uczenie maszynowe

W przeciwieństwie do tego, uczenie nienadzorowane działa poprzez uczenie modelu samodzielnego identyfikowania wzorców (stąd nienadzorowane ) z danych nieoznaczonych. Oznacza to, że dostarczane jest wejście, ale nie wyjście.

Aby zrozumieć, jak to działa, przejdźmy do przykładu owocu podanego powyżej. W przypadku uczenia nienadzorowanego dostarczysz modelowi wejściowego zestawu danych (zdjęcia owoców i ich charakterystyk), ale nie dostarczysz danych wyjściowych (nazw owoców).

Model użyje odpowiedniego algorytmu, aby nauczyć się dzielić owoce na różne grupy zgodnie z najbardziej podobnymi cechami między nimi. Ten rodzaj uczenia się nienadzorowanego, zwany grupowaniem , jest najczęstszy.

Chcesz jeszcze raz przejrzeć te dwa modele uczenia maszynowego? Obejrzyj ten krótki film, aby uzyskać ogólne wyjaśnienie:

Kiedy należy stosować uczenie nadzorowane w porównaniu z uczeniem nienadzorowanym?

To, czy powinieneś korzystać z uczenia nadzorowanego, czy nienadzorowanego, zależy od Twoich celów oraz struktury i ilości danych, którymi dysponujesz. Przed podjęciem decyzji poproś swojego analityka danych o ocenę następujących kwestii:

  • Czy dane wejściowe są zbiorem danych bez etykiety lub z etykietą? Jeśli jest nieoznaczony, czy Twój zespół może obsługiwać dodatkowe oznaczanie?
  • Jaki jest cel, który chcesz osiągnąć? Czy pracujesz z powtarzającym się, dobrze zdefiniowanym problemem, czy algorytm będzie musiał przewidywać nowe problemy?
  • Czy istnieją algorytmy, które wspierają ilość i strukturę danych? Czy mają taką samą wymiarowość, jakiej potrzebujesz (liczbę cech lub atrybutów)?

Kiedy używać nadzorowanego uczenia maszynowego

Według Gartnera uczenie nadzorowane jest najpopularniejszym i najczęściej używanym rodzajem uczenia maszynowego w scenariuszach biznesowych. Jest tak prawdopodobnie dlatego, że chociaż klasyfikowanie dużych zbiorów danych może być prawdziwym wyzwaniem w nadzorowanym uczeniu się, wyniki są bardzo dokładne i godne zaufania (pełne źródło dostępne dla klientów).

Oto kilka przykładów przypadków użycia uczenia nadzorowanego. Niektóre są specyficzne dla branży, podczas gdy inne mogą dotyczyć dowolnej organizacji:

  • Identyfikacja czynników ryzyka chorób i planowanie działań zapobiegawczych
  • Klasyfikowanie, czy wiadomość e-mail jest spamem
  • Przewidywanie cen domów
  • Przewidywanie rezygnacji klientów
  • Przewidywanie opadów i warunków pogodowych
  • Dowiedzenie się, czy wnioskodawca jest osobą niskiego czy wysokiego ryzyka
  • Przewidywanie awarii części mechanicznych w silnikach samochodowych
  • Przewidywanie wyników udostępniania w mediach społecznościowych i wyników wydajności

Wood podzielił się z nami przykładem wykorzystania nadzorowanej nauki do zbudowania systemu segregacji dla przychodzących e-maili klienta. Za pomocą systemu CRM e-maile zostały podzielone na grupy, które reprezentują typowe zapytania (np. zmiana adresu klienta, reklamacje). Wood następnie wykorzystał te kategorie do wytrenowania modelu, aby po otrzymaniu nowego przychodzącego e-maila wiedział, do której kategorii przypisać ten e-mail. On mówi:

„Nadzorowane uczenie było w tym przypadku możliwe dzięki obecności systemu CRM, który zapewniał zestaw „etykiet” do uczenia modelu. Bez nich tylko nauka bez nadzoru byłaby możliwa”.

Chcesz wyczyścić swoją skrzynkę odbiorczą? Zacznij korzystać z oprogramowania CRM.

Kiedy używać nienadzorowanego uczenia maszynowego

W przeciwieństwie do uczenia nadzorowanego, uczenie nienadzorowane może obsługiwać duże ilości danych w czasie rzeczywistym. A ponieważ model automatycznie zidentyfikuje strukturę danych (klasyfikacja), jest to przydatne w przypadkach, gdy człowiek miałby trudności z samodzielnym znalezieniem trendów w danych.

Na przykład, jeśli próbujesz podzielić potencjalnych konsumentów na grupy w celach marketingowych, nienadzorowana metoda grupowania byłaby świetnym punktem wyjścia.

Oto kilka przykładów przypadków użycia uczenia nienadzorowanego:

  • Grupowanie klientów według ich zachowań zakupowych
  • Znajdowanie korelacji w danych klientów (na przykład osoby, które kupują torebkę w określonym stylu, mogą być również zainteresowane określonym stylem butów)
  • Segmentacja danych według historii zakupów
  • Klasyfikowanie osób na podstawie różnych zainteresowań
  • Grupowanie zapasów według mierników produkcji i sprzedaży

Wood wyjaśnił nam, że kiedyś pracował dla firmy farmaceutycznej posiadającej zakłady produkcyjne na całym świecie. Oprogramowanie używane przez firmę do rejestrowania błędów, które wystąpiły w jej zakładach, nie miało rozwijanego menu z typowymi opcjami błędów do wyboru.

Z tego powodu pracownicy fabryki dokumentowali błędy w postaci zwykłego tekstu (w języku angielskim lub lokalnym). Firma chciała poznać przyczyny typowych problemów produkcyjnych, ale bez kategoryzacji błędów nie można było przeprowadzić analizy statystycznej danych.

Wood użył nienadzorowanego algorytmu uczenia się, aby odkryć podobieństwa w błędach. Był w stanie zidentyfikować największe tematy i stworzyć statystyki, takie jak zestawienie wykresów kołowych typowych problemów produkcyjnych w firmie. Drewno mówi:

„Dało to firmie szybki przegląd problemów w jej działalności, które w innym przypadku wymagałyby znacznej pracy ręcznej”.

Przygotuj się na mądrą przyszłość: skorzystaj z uczenia maszynowego

Uczenie maszynowe to potężne narzędzie, które może pomóc w rozwiązywaniu problemów biznesowych i podejmowaniu decyzji opartych na danych. Mamy nadzieję, że ten artykuł zawiera kilka pomysłów na to, jak nadzorowane lub nienadzorowane uczenie maszynowe można wdrożyć w Twojej organizacji.

Jeśli jesteś gotowy na przyjęcie technologii uczenia maszynowego, następnym krokiem powinna być ocena możliwości Twojego aktualnego stosu oprogramowania. Następnie poproś swojego dostawcę (dostawców) o przypadki użycia od innych klientów z Twojej branży, które są zgodne z aplikacjami, dla których chcesz korzystać z uczenia maszynowego.

Czujesz, że jest jeszcze więcej do nauczenia się? Sprawdź te powiązane odczyty z Capterra:

  • Co to jest uczenie maszynowe? Twój podstawowy glosariusz analizy biznesowej
  • Poradnik dla małych firm dotyczący uczenia maszynowego a sztuczna inteligencja
  • Najlepsze zastosowania sztucznej inteligencji dla małych firm

Sprawdź także katalog oprogramowania do uczenia maszynowego firmy Capterra, w którym możesz przeczytać recenzje od prawdziwych użytkowników i filtrować narzędzia według ich ceny lub funkcji.