Ce este Machine Learning? Glosarul dumneavoastră esențial de Business Intelligence

Publicat: 2022-05-07

Întotdeauna am văzut curățenia de primăvară ca fiind prea puțin, prea târziu. Pentru mine, ianuarie este momentul în care comanzi, prioritizezi și începi să răspunzi la întrebările din anul următor. De aceea, am ales ianuarie pentru a răspunde la o întrebare pe care poate ați avut-o de ceva vreme: ce este învățarea automată?

Voi răspunde la asta și, de asemenea, voi defini alți termeni pe care va trebui să-i cunoașteți pentru a rămâne la curent cu 2017. Dacă sunteți interesat de ce poate face software-ul de business intelligence pentru dvs., va trebui mai întâi să cunoașteți acești termeni de bază. .

Am pus pe primul loc învățarea automată, deoarece este una dintre primele zece tendințe strategice ale tehnologiei Gartner pentru 2017 , dar restul intrărilor sunt aranjate alfabetic.

Învățare automată

Înainte de învățarea automată, computerelor trebuia să li se spună (programate) cum să gândească. Cu învățarea automată, computerele pot gândi (cumva) de la sine.

Am vorbit recent cu Michael Finley, șeful Machine Learning la compania de software BI AnswerRocket , care a ajutat la elaborarea. Înainte de învățarea automată, majoritatea software-ului „funcționează așa cum a fost programat: oamenii transformau instrucțiunile în cod de computer, iar computerul făcea ceea ce codul îi spunea să facă”. Un exemplu foarte simplu ar fi un calculator: i-ați alimentat cu numerele calculatorului, i-ați spus ce să facă (adunați, scădeți), iar calculatorul v-a dat rezultate. Cu învățarea automată, totuși, software-ul se poate adapta. Finley continuă: „Software-ul cu învățare automată nu face același lucru în ziua în care îl instalați ca în a zecea sau a suta zi în care îl rulați.” Dacă valorile introduse în computer se modifică, software-ul se va adapta la acele valori. Un computer cu învățare automată învață cum să le încorporeze.

Prin amabilitatea minunatelor Andre Pinto și Anthill Comics

Finley caracterizează învățarea automată ca un software care știe să se ocupe de conceptul de „cum ar fi”, cum ar fi „Vreau să aud un cântec ca ultimul pe care tocmai l-am auzit”. Conceptul este ușor pentru oameni, dar este greu pentru computere. Finley a explicat că computerele sunt bune la înțelegerea numerelor mai mari sau mai mici și la potrivirea numerelor și a numelor, dar se luptă cu ideea de similitudine. Învățarea automată ajută computerele să înțeleagă de ce un lucru este „ca” altul. Înțelegerea similitudinii de către învățarea automată este deosebit de utilă în prezicerea dorințelor clienților.

Învățarea automată se află în spatele următoarei melodii pe care o auziți pe Pandora sau filmul sugerat de Netflix. Algoritmii de învățare automată ai Pandora și Netflix sunt „alimentați” cu alegerile tale (și cu „aprecierile” reale, în cazul Pandorei) și îi folosesc pentru a prezice ce melodii sau emisiuni similare ți-ar putea plăcea.

Alimentați acelor algoritmi de învățare automată date diferite și vor reacționa diferit. Dacă dieta ta obișnuită de filme de groază include brusc și inexplicabil o comedie romantică, algoritmii ML de la Netflix vor reacționa la aceste date și vor începe să sugereze alte comedii romantice sau romantism de groază.

Lăsând la o parte gustul în scădere pentru filme, de ce contează învățarea automată pentru IMM-uri? Îi poate ajuta să concureze cu concurenți mai mari. Software-ul BI cu învățare automată primește numere noi de fiecare dată când actualizați. Nu vă bazați strategia pe cifrele unui raport anual, ci o bazați pe informații aproape în timp real și pe algoritmi care știu să se adapteze la aceste date în schimbare. Finley explică faptul că modul tradițional și omogen în care o afacere scalează orice ar face poate fi revoluționat cu ML:

„S-ar putea să fi prezentat cele mai bune practici și să vreau să repet procesele. Dar dacă ai putea prezenta cele mai bune practici în fiecare zi, dacă ai avea informații pentru a le schimba și a-ți reformula strategia în fiecare zi? Aveți date datorită ML care pot rescrie strategia în fiecare zi și așa sunt IMM-urile care mănâncă cu adevărat prânzul băieților mai mari.”

Pentru IMM-urile interesate de strategia de afaceri agilă, învățarea automată poate fi mai mult decât o modalitate de a rămâne în viață. Ar putea fi o modalitate de a începe să luați părți din cotele de piață ale jucătorilor consacrați.

  • Analize ad-hoc
  • Interogare ad-hoc
  • Analiză avansată
  • Inteligenţă artificială
  • Date mare
  • Date contextuale
  • Punct de date
  • Calitatea datelor
  • Vizualizarea datelor
  • Depozitul de date
  • Bază de date
  • Tablouri de bord
  • Detaliere
  • ETL
  • Metadate
  • Metrici
  • BI modern
  • BI tradițional
  • Software SaaS/Cloud
  • A taia si marunti
  • SQL
  • Termeni pe care vrei să-i cunoști...

Analize ad-hoc

Analiza ad-hoc este o analiză atunci când aveți nevoie, la un nivel pe care cel care nu este IT, nespecialist îl poate înțelege.

Dacă inteligența de afaceri accesibilă pare un lucru evident de dorit, nu a fost întotdeauna realizabil. Multă vreme, profesioniștii BI au trebuit să fie capabili să „vorbească computerul” (adică să scrie într-un limbaj de codificare) pentru a interoga programele de business intelligence. Nu ați știut să codificați în SQL, R sau Python? Întrebați pe cineva din IT care o face. Atunci așteaptă. Și apoi așteptați ca programele de business intelligence să funcționeze, apoi mai așteptați analiza.

Din fericire, BI sa maturizat în sfârșit la analize ad-hoc. : Cu acest sistem, nu trebuie să așteptați pe IT sau ritmul mai lent de producere a rapoartelor tradiționale, pentru a obține datele necesare. Îți face munca ta, și a lor, mai ușoară și mai puțin stresantă.

Dacă nu aveți personal IT, analizele ad-hoc rezolvă această problemă. Analiza ad-hoc creează, de asemenea, o perspectivă mai rapidă (acesta este un alt cuvânt de interes pe care îl puteți vedea; înseamnă că este nevoie de mai puțin timp pentru a obține informațiile de care aveți nevoie).

Interogare ad-hoc

„Interogările” sunt întrebări la care ați putea adresa software-ul dvs. de business intelligence să răspundă. De exemplu, ați putea cere software-ului dvs. BI o listă alfabetică a tuturor clienților cu ochi căprui născuți din 1970. Ați putea la fel de ușor să numiți o întrebare o întrebare, dar cât de des ajungeți să spuneți „interogare” în conversație?

O interogare ad-hoc este una pe care o puteți solicita atunci când aveți nevoie. Ca și în cazul analizelor de afaceri mai vechi, interogările mai vechi aveau nevoie de cineva din IT care să le întrebe. Interogările tindeau să aibă loc, de asemenea, ca parte a rapoartelor regulate pe care le primiți lunar sau anual. Cu software-ul BI mai vechi, ar trebui să adresați acea interogare într-un limbaj de programare. SQL a fost un standard de lungă durată în business intelligence; în zilele noastre, R și Python sunt populare.

Puteți privi programele de calculator, inclusiv BI, ca ramuri ale unei birocrații, de la DOJ la HHS. Din punct de vedere tehnic, ei sunt acolo pentru a realiza lucruri, dar fiecare are propriul său limbaj și funcționează în felul său. Un programator este ca un birocrat care vorbește limba și știe să navigheze în fiecare program/departament.

Analiză avansată

Acest termen merge de fapt dincolo de business intelligence. „Business intelligence” s-a ocupat în mod tradițional de analizarea a ceea ce sa întâmplat. Analiza avansată merge mai departe, fie că este vorba despre prognoza a ceea ce se va întâmpla în viitor, fie că analizează detalii și factori care de obicei nu sunt asociați cu business intelligence. Câteva exemple de analiză avansată sunt extragerea datelor și a textului , analiza predictivă , prognoza , analiza locației , analiza sentimentelor și învățarea automată.

Inteligenţă artificială

Învățarea automată este o parte a AI, dar AI este un concept mult mai mare. Inteligența artificială include orice ai putea numi „ inteligență expusă de mașini ”. „Inteligenta”, în sensul inteligenței artificiale, înseamnă capacitatea de a face ceva. Deci, înțelegerea comună a „inteligenței” ca doar cunoașterea multor nu este genul de inteligență găsit în AI.

„Ceva” pe care AI le poate realiza sunt deja variate. De exemplu, Daisy Intelligence folosește inteligența artificială pentru a examina datele retailerilor, apoi face recomandări despre care ei susțin că pot „crește vânzările cu 5% sau mai mult”. Dacă, ca și mine, îți place să programezi la fel de mult ca să aștepți la DMV, un asistent virtual precum Amy , care poate programa întâlniri în funcție de preferințele participanților, ar putea fi cel mai bun nou prieten imaginar al tău.

Date mare

Big Data sunt seturi de date extrem de mari. Deși în mod normal sunt de acord cu Stephen King că „ drumul spre iad este pavat cu adverbe ”, „extrem de” este justificat. O cantitate mică de date ar fi, să zicem, o carte scurtă. Un PDF al primei cărți Harry Potter este de aproximativ un megaoctet (MB).

Big Data ar fi ceva ca un petabyte de date. Pentru a continua exemplul cărții, tot ceea ce este scris, de la începutul istoriei înregistrate, este de 50 de petaocteți . Mega-corporațiile, precum Google, sunt genul care se ocupă de petabytes. Sistemul Mesa de la Google , care monitorizează traficul publicitar Google, urmărește petabytes de date.

Date contextuale

Datele contextuale sunt date suplimentare despre o persoană, loc sau eveniment (care sunt numite „entități” în limbajul de date). Datele contextuale ajută la completarea a ceea ce o companie știe despre un potențial client și chiar la prezicerea ce ar putea dori.

Deși nu este o afacere, Universitatea din Manchester din Anglia folosește date contextuale în procesul său de admitere pentru a „ construi o viziune completă și rotunjită asupra realizărilor și potențialului tău ”. Împreună cu formularul de admitere al studentului, UM ia în considerare factori precum codul poștal al candidatului, calitatea școlii în care ați susținut examenele și „ dacă ați fost îngrijit sau îngrijit de mai mult de trei luni”.

Pentru o afacere, datele contextuale ar putea ajuta vânzările. Pentru un exemplu foarte larg, datele contextuale despre un client din trecut, bazate pe vremea locației acestuia, ar putea genera venituri. Un client din Tuscon, Arizona, are mai multe șanse să cumpere popsicles în octombrie decât unul din International Falls, Minnesota .

Punct de date

Un punct de date este un singur fragment de date. Un punct de date este orice unitate autonomă, sau datum, dintre datele pe care le urmăriți. Un singur punct de date poate fi orice, de la „ mărimea unei investiții ” la un singur clic pe un anunț pe care l-ați cumpărat de pe Google. În cazul Uber, locația este un punct de date important - unul atât de important încât de fapt îl urmărește după ce călătoria ta este terminată .

Dacă sunteți familiarizat cu indicatorii cheie de performanță , sunteți familiarizat cu punctele de date. KPI-urile măsoară anumite tipuri de puncte de date, cum ar fi veniturile sau timpul necesar pentru a finaliza un proiect.

Calitatea datelor

Calitatea datelor este măsura utilității datelor dvs. Datele de înaltă calitate sunt curate, organizate și disponibile. Dacă datele unei biblioteci sunt cărțile sale, o bibliotecă cu date de înaltă calitate ar avea cărțile pe care populația le dorește și are nevoie, în stare bună, depozitate în locurile potrivite.

Există șase dimensiuni ale calității datelor:

  • Completitudine
  • Unicitatea
  • Valabilitate
  • Promptitudine
  • Consecvență
  • Precizie

Vizualizarea datelor

O vizualizare de date este orice imagine, vizual sau grafic care afișează datele dvs. Diagramele circulare și graficele cu bare ar fi cele mai comune tipuri. Există totuși o gamă mult mai largă de vizualizări. Criteriile de evaluare Gartner pentru platformele de Business Intelligence și Analytics pentru 2016 (protejat cu paywall; merită) evaluează tipurile de diagrame mai avansate ca elemente „preferate” de căutat în soluția dvs. de BI. Unele dintre acele tipuri de diagrame preferate de calitate superioară de căutat sunt:

  • Diagramele Marimekko
  • Diagrame X/Y
  • Diagrame de rețea
  • Diagrame Pareto
  • Nori de cuvinte

Depozitul de date

Un depozit de date este sistemul informatic în care sunt păstrate și organizate datele din diferite baze de date și sisteme tranzacționale. Veți vedea adesea termenul cu o „întreprindere” pe față, deoarece veți avea nevoie de o cantitate mare de date de dimensiunea unei întreprinderi pentru a avea nevoie de un depozit de date.

Bază de date

O bază de date este date, organizate astfel încât să puteți obține cu ușurință ceea ce aveți nevoie. Ai fost vreodată la IMDB ? Desigur că ai. Aceasta este o bază de date: filme, actori, regizori, producători, toate organizate pentru o căutare ușoară, ca atunci când trebuie să trișați într-un joc de șase grade de Kevin Bacon .

Tablouri de bord

Poza este înaintea acestei explicații, deoarece este mai ușor să arăți cum arată un tablou de bord.

Pentru o definiție formală: un tablou de bord este o reprezentare vizuală a datelor pe care le urmăriți. Programul dvs. de BI trebuie neapărat să aibă un tablou de bord. Nu ți-ai cumpăra o mașină fără bord. Același lucru este valabil și pentru software-ul BI.

Când cumpărați software de BI, asigurați-vă că tablourile de bord ale programului dvs. au aceste două criterii de bază recomandate de Gartner (protejat cu peretele de plata; merită):

  • „Abilitatea de a proiecta tablouri de bord cu, cel puțin, tipuri de diagrame de bază, inclusiv tabele, diagrame cu bare, diagrame cu linii, diagrame cu zone și diagrame circulare, fără a necesita opțiuni terță parte, codare sau scripturi.”
  • „Ceea ce vedeți este ceea ce obțineți (WYSIWYG) design”, abilitatea de a proiecta un tablou de bord și de a analiza datele fără a ști cum să codificați.

Detalii

Detalierea se referă la abilitatea de a lua o informație generală, cum ar fi cifrele anuale de vânzări, și de a analiza pe lună, săptămână sau chiar zi. „Detaliați” înseamnă că puteți restrânge de la general la detalii care fac adesea diferența între informații și perspectivă. Detalierea este un fel ca versiunea de business intelligence a acelui film vechi „puterile lui zece”.

ETL

ETL – sau extragerea, transformarea, încărcarea – are loc între colectarea datelor și plasarea acelor date în depozitul de date.

Necesitatea de a „extrage” vine din faptul că datele sunt colectate în baze de date sau software ERP înainte de a ajunge în depozitul de date. Necesitatea de transformare vine din faptul că acele surse multiple de date sunt adesea în formate diferite și trebuie transformate în formatul adecvat pentru a fi stocate și căutate în depozitul de date. Nevoia de încărcare se explică de la sine; trebuie să-l puneți în depozitul de date înainte de a putea căuta și compara o sursă de date cu alta.

Metadate

Metadatele sunt date despre date. Dacă asta sună, meta, este... sunt metadate !

Dar, serios.

Metadatele sunt informații despre datele dvs. Există trei categorii:

  • Tehnic: detaliile tehnice despre datele dvs., cum ar fi modelele, formatul și măsurile acestora.
  • Afaceri: descrieri ale datelor în termeni ușor de utilizat (de exemplu, engleză simplă)
  • Proces: date care vă spun ce sa făcut cu ce date și când.

Metrici

„Metric” este doar un cuvânt elegant pentru orice lucru pe care le măsurați.

Vă urmăriți profitul net? Aceasta este o metrică. Urmăriți câți oameni folosesc software-ul BI la compania dvs.? Și asta este o metrică. Păstrează un ochi pe rata de conversație? Aceasta este, de asemenea, o metrică. Trucul cu valorile este să le alegeți pe cele care sunt cele mai bune pentru compania dvs. Fiecare companie are nevoi diferite și este o idee bună să luați în considerare nevoile și prioritățile dvs. atunci când alegeți valori .

BI modern

Termenul de business intelligence modern provine de la Gartner , care îl definește astfel :

O platformă BI modernă acceptă dezvoltarea de conținut analitic activată de IT. Este definit printr-o arhitectură autonomă care permite utilizatorilor netehnici să execute în mod autonom fluxuri de lucru analitice cu spectru complet, de la accesul la date, absorbția și pregătirea până la analiza interactivă și partajarea în colaborare a informațiilor.

Mai simplu spus, BI modern pune pe primul loc utilizatorul de afaceri. Nu va trebui să depindeți de cineva din IT sau va trebui să depindeți mult mai puțin de el, pentru a utiliza un program modern de BI. În cazul în care programele tradiționale, mai vechi, de BI au fost create pentru a permite doar oamenilor din IT să creeze conținut, de exemplu, programele moderne de BI le facilitează utilizatorilor de afaceri să creeze conținut pe cont propriu.

BI tradițional

Programele tradiționale de business intelligence se bazează foarte mult pe personalul IT. De obicei, necesită ca utilizatorii să cunoască SQL (un limbaj de programare, vezi mai jos) și este nevoie de mult mai mult pentru a obține răspunsuri, deoarece trebuie să introduceți manual mai multe interogări în limba respectivă. Ca atare, sunt mult mai puțin agile, iar experții precum cei de la Gartner sugerează cumpărătorilor să caute, în schimb, tipul de caracteristici găsite în programele moderne de BI .

Software SaaS/Cloud

Software-ul ca serviciu este un model în care cumpărătorii achiziționează licențe pentru a utiliza software-ul, mai degrabă decât să îl cumpere și să îl instaleze. Majoritatea software-ului SaaS se realizează prin internet (adică, în cloud), ceea ce reduce costurile inițiale de cumpărare și instalare. De asemenea, elimină nevoia de a monitoriza serverele pe care software-ul este păstrat; compania SaaS ține evidența eventualelor întreruperi.

A taia si marunti

Tăierea și tăierea în bucăți a seturi de date mari, fie pentru a privi datele din perspective diferite, fie pentru a privi anumite părți mai detaliat. Capacitățile de feliere și zaruri vă permit, de exemplu, să verificați datele pe săptămână, apoi pe lună, apoi pe zi individuală. În loc să așteptați un raport, slice and zar vă permite să luați inițiativa și să verificați datele specifice atunci când aveți nevoie.

SQL

Pronunțat „sequel”, SQL este un limbaj de programare comun folosit pentru a obține informații din baze de date. Dacă vorbiți engleză, baza de date vorbește SQL și va ști doar să răspundă la întrebările astfel formulate. Cu excepția cazului în care, desigur, software-ul dvs. de business intelligence are interogare în limbaj natural (NLQ), care vă permite să puneți întrebări în același mod în care ați face un motor de căutare.

Termeni pe care vrei să-i cunoști...

Sau că credeți că ar fi de folos cititorii acestei liste? Spune-mi-le în comentarii de mai jos. În mod ideal, secțiunea de comentarii ar putea deveni un alt loc în care oamenii să solicite definiții, iar eu să le ofer.

Dacă doriți să aflați cum acești termeni vă pot ajuta mai bine, consultați una dintre opțiunile din directorul de software de business intelligence al Capterra și contactați un furnizor.