Învățare supravegheată versus învățare nesupravegheată: care model de învățare automată este potrivit pentru dvs.?
Publicat: 2022-05-07Învățarea automată nu trebuie să fie încrezătoare. Vom detalia cele mai comune două tipuri și cazurile lor de utilizare în acest articol.
În calitate de lider de afaceri, știți că adoptarea de noi tehnologii poate atenua punctele dureroase și vă poate face afacerea mai competitivă. De aceea, în timpul unui an de întreruperi, multe companii au apelat la transformarea digitală pentru a trece.
Este posibil să fiți, de asemenea, conștienți de potențialul tehnologiilor emergente, cum ar fi învățarea automată, care vă pot face afacerea pregătită pentru viitor. Dar, cumpărător, atenție – dacă nu înțelegeți aplicațiile învățării automate, riscați să pierdeți bani pentru rezultate inutilizabile. Luați exemplul de mai jos pentru a vedea la ce ne referim.
Pentru a ne pregăti să scriem acest articol, am folosit un instrument de generare a limbajului natural (NLG) pentru a ne ajuta să înțelegem cum să descompunăm cel mai bine învățarea supravegheată de cea nesupravegheată. Iată un extras de la omologul nostru NLG:
„Fiecare model de învățare nesupravegheat oferă matrice tensorong în avans bazate pe coeficientul de corelație, răspuns fals pozitiv, date destul de minime utile din punct de vedere statistic (sau dependente în mare măsură de acestea), sunt utilizate pentru reducerea dimensionalității folosind grafice și arbori pentru a genera propriile puncte de date limită.”
Simțindu-se confuz? Noi de asemenea. Dar, în ciuda sintaxei uluitoare a propozițiilor instrumentului NLG, acest experiment cu inteligența artificială (AI) nu a fost complet inutil. Ne-a făcut să realizăm că atunci când vine vorba de a obține cele mai bune rezultate din AI, găsirea aplicației potrivite contează - tocmai de aceea am scris acest ghid pentru a vă ajuta.
Am vorbit cu Thomas Wood, un consultant în știința datelor pentru Fast Data Science, care a ajutat la dezbaterea subiectului în termeni ușor de înțeles. Cu ajutorul lui Wood, vom explica diferența dintre două metode comune de învățare automată, învățarea supravegheată și nesupravegheată și ce cazuri de utilizare sunt cele mai potrivite pentru fiecare metodă.
Nou în învățarea automată? Revizuiți aceste concepte cheie înainte de a vă arunca în continuarea acestui articol:
- Învățarea automată (ML) este un subset de inteligență artificială (AI) care rezolvă probleme folosind algoritmi și modele statistice pentru a extrage cunoștințe din date. În linii mari, toate modelele de învățare automată pot fi clasificate în învățare supravegheată sau nesupravegheată.
- Un algoritm în învățarea automată este o procedură care se rulează pe date pentru a crea un model de învățare automată.
- Un model în învățarea automată este rezultatul unui algoritm de învățare automată rulat pe date. Adică, un model reprezintă ceea ce a fost învățat de un algoritm de învățare automată.
Care sunt principalele diferențe dintre învățarea supravegheată și nesupravegheată?
Dacă ar fi să ne rezumam la o singură propoziție, ar fi următoarea: diferența principală dintre învățarea supravegheată și învățarea nesupravegheată este că învățarea supravegheată folosește date etichetate pentru a ajuta la prezicerea rezultatelor, în timp ce învățarea nesupravegheată nu o face.
Cu toate acestea, există nuanțe suplimentare între cele două abordări, pe care le vom clarifica în continuare, astfel încât să puteți alege cea mai bună abordare pentru situația dvs.
Cum funcționează învățarea automată supravegheată
După cum am menționat mai sus, învățarea supravegheată utilizează date etichetate pentru a antrena modelul. Dar ce înseamnă asta în teorie? Să trecem prin câteva exemple pentru a începe.
Cu învățarea supravegheată, modelul este furnizat atât de intrări, cât și de ieșiri corespunzătoare. Să presupunem că antrenăm modelul pentru a identifica și clasifica diferite tipuri de fructe. În acest exemplu, veți furniza mai multe imagini cu fructe ca intrare, împreună cu forma, dimensiunea, culoarea și profilul lor de aromă. În continuare, veți furniza modelului numele fiecărui fruct ca rezultat.
În cele din urmă, algoritmul va stabili un model între caracteristicile fructelor (intrarile) și numele acestora (ieșirile). Odată ce se întâmplă acest lucru, modelul poate fi furnizat cu o nouă intrare și va prezice rezultatul pentru dvs. Acest tip de învățare supravegheată, numită clasificare , este cea mai comună .
Cum funcționează învățarea automată nesupravegheată
Dimpotrivă, învățarea nesupravegheată funcționează prin predarea modelului să identifice tipare pe cont propriu (deci nesupravegheat ) din date neetichetate. Aceasta înseamnă că este furnizată o intrare, dar nu o ieșire.
Pentru a înțelege cum funcționează, să continuăm cu exemplul de fructe prezentat mai sus. În cazul învățării nesupravegheate, veți furniza modelului setul de date de intrare (imaginile fructelor și caracteristicile acestora), dar nu veți furniza rezultatul (numele fructelor).
Modelul va folosi un algoritm adecvat pentru a se antrena să împartă fructele în diferite grupuri în funcție de caracteristicile cele mai asemănătoare dintre ele. Acest tip de învățare nesupravegheată, numită grupare , este cea mai comună.
Mai trebuie să parcurgeți cele două modele de învățare automată încă o dată? Urmăriți acest scurt videoclip pentru o explicație la nivel înalt:
Când ar trebui utilizată învățarea supravegheată versus învățarea nesupravegheată?
Dacă ar trebui să utilizați învățarea supravegheată sau nesupravegheată depinde de obiectivele dvs. și de structura și volumul datelor pe care le aveți la dispoziție. Înainte de a lua o decizie, solicitați cercetătorului dvs. de date să evalueze următoarele:
- Datele de intrare sunt un set de date neetichetat sau etichetat? Dacă nu este etichetat, poate echipa dvs. să accepte etichetare suplimentară?
- Care este scopul pe care vrei să-l atingi? Lucrezi cu o problemă recurentă, bine definită sau algoritmul va trebui să prezică probleme noi?
- Există algoritmi care vă sprijină volumul și structura datelor? Au aceeași dimensionalitate de care aveți nevoie (număr de caracteristici sau atribute)?
Când să utilizați învățarea automată supravegheată
Potrivit Gartner, învățarea supravegheată este cel mai popular și cel mai frecvent utilizat tip de învățare automată în scenariile de afaceri. Acest lucru este probabil pentru că, deși clasificarea datelor mari poate fi o adevărată provocare în învățarea supravegheată, rezultatele sunt extrem de precise și de încredere (sursa completă disponibilă clienților).
Iată câteva exemple de cazuri de utilizare pentru învățarea supravegheată. Unele sunt specifice industriei, în timp ce altele se pot aplica oricărei organizații:
- Identificarea factorilor de risc pentru boli și planificarea măsurilor preventive
- Clasificarea dacă un e-mail este sau nu spam
- Previziunea prețurilor caselor
- Predicția ratei clienților
- Previziunea precipitațiilor și a condițiilor meteo
- Aflați dacă un solicitant de împrumut este cu risc scăzut sau cu risc ridicat
- Prezicerea defecțiunii pieselor mecanice la motoarele de automobile
- Prezicerea scorurilor de distribuire a rețelelor sociale și a scorurilor de performanță
Wood ne-a împărtășit un exemplu despre modul în care a folosit învățarea supravegheată pentru a construi un sistem de triaj pentru e-mailurile primite de un client. Cu ajutorul unui sistem CRM, e-mailurile au fost clasificate în grupuri care reprezentau interogări comune (ex. schimbarea adresei clientului, reclamații). Wood a folosit apoi aceste categorii pentru a antrena un model, astfel încât atunci când primește un nou e-mail primit, să știe căreia îi va atribui acel e-mail. El spune:
„Învățarea supravegheată a fost posibilă în acest caz datorită prezenței sistemului CRM care a furnizat un set de „etichete” pentru antrenarea modelului. Fără acestea, numai învățarea nesupravegheată ar fi fost posibilă.”
Când să utilizați învățarea automată nesupravegheată
Spre deosebire de învățarea supravegheată, învățarea nesupravegheată poate gestiona volume mari de date în timp real. Și pentru că modelul va identifica automat structura în date (clasificare), este util în cazurile în care un om ar fi greu să găsească singur tendințele în cadrul datelor.
De exemplu, dacă încercați să segmentați potențialii consumatori în grupuri în scopuri de marketing, o metodă de grupare nesupravegheată ar fi un punct de plecare excelent.
Iată câteva exemple de cazuri de utilizare pentru învățarea nesupravegheată:
- Gruparea clienților după comportamentul lor de cumpărare
- Găsirea corelațiilor în datele clienților (de exemplu, persoanele care cumpără o anumită geantă de stil pot fi interesate și de un anumit stil de pantofi)
- Segmentarea datelor în funcție de istoricul achizițiilor
- Clasificarea oamenilor în funcție de diferite interese
- Gruparea stocurilor în funcție de valorile de producție și vânzări
Wood ne-a explicat că a lucrat cândva pentru o companie farmaceutică cu unități de producție în întreaga lume. Software-ul pe care compania l-a folosit pentru a înregistra erorile care au avut loc în unitățile lor nu avea un meniu derulant cu opțiuni comune de eroare din care să aleagă.
Din această cauză, lucrătorii fabricii au documentat erorile în text simplu (fie în engleză, fie în limba lor locală). Compania dorea să cunoască cauzele problemelor comune de fabricație, dar fără o clasificare a erorilor a fost imposibil să se efectueze o analiză statistică a datelor.
Wood a folosit un algoritm de învățare nesupravegheat pentru a descoperi elementele comune ale erorilor. El a reușit să identifice cele mai mari teme și să producă statistici, cum ar fi defalcări grafice ale problemelor comune de producție din companie. Wood spune:
„Acest lucru a oferit companiei o privire de ansamblu asupra problemelor din afacerea lor, care altfel ar fi necesitat o muncă manuală considerabilă.”
Pregătiți-vă pentru un viitor inteligent: adoptați învățarea automată
Învățarea automată este un instrument puternic care vă poate ajuta să rezolvați problemele de afaceri și să luați decizii bazate pe date. Sperăm că acest articol vă oferă câteva idei despre cum ar putea fi implementată învățarea automată supravegheată sau nesupravegheată în organizația dvs.
Dacă sunteți gata să îmbrățișați tehnologia de învățare automată, următorii pași ar trebui să fie să evaluați capacitățile stivei dvs. actuale de software. Apoi, cereți furnizorului(ilor) cazuri de utilizare de la alți clienți din industria dvs. care se aliniază cu aplicațiile pentru care doriți să utilizați învățarea automată.
Simți că mai sunt de învățat? Consultați aceste lecturi legate de la Capterra:
- Ce este Machine Learning? Glosarul dumneavoastră esențial de Business Intelligence
- Ghidul Savvy Small Business pentru învățare automată vs. inteligență artificială
- Top aplicații ale inteligenței artificiale pentru întreprinderile mici
De asemenea, consultați directorul de software de învățare automată Capterra, unde puteți citi recenzii de la utilizatori reali și instrumente de filtrare în funcție de prețul sau funcțiile lor.