4 pași simpli pentru a deveni Citizen Data Scientist
Publicat: 2022-05-07Ce este un cetățean de știință de date?
O persoană care poate face (unele) lucrări la nivel de cercetător de date, fără pregătirea unui cercetător de date.
Un lucrător care poate folosi software de business intelligence pentru a face clustering, segmentare și amestecare avansată a datelor, chiar dacă nu are un doctorat în statistică.
Cu alte cuvinte? Un cetățean de știință de date este unicornul prietenos de cartier al fiecărei afaceri.
Dacă doriți o definiție formală, Gartner definește cercetătorul de date cetățean (CDS) ca „o persoană care creează sau generează modele care utilizează analize avansate de diagnostic sau capabilități predictive și prescriptive, dar a cărei funcție principală este în afara domeniului statisticii și analiticii. ”
În multe cazuri, acel „în afara domeniului statisticii și analiticii” înseamnă că CDS este un analist de afaceri — un analist de afaceri care a învățat să facă acele modele de nivel înalt dintr-un amestec de inițiative (dacă pot afla variabila x, eu ne poate crește veniturile) și nevoia (ocupatorii noștri de date sunt la fel de suprasolicitați ca un profesor fără o perioadă de planificare).
Pe măsură ce oamenii de știință de date sunt din ce în ce mai taxați cu cereri de a face o afacere mai bazată pe date, oamenii de știință de date ale cetățenilor își pot ajuta afacerile în două moduri cheie:
- pot ușura sarcina oamenilor de știință a datelor utilizând software-ul potrivit de business intelligence pentru a îndeplini sarcinile mai simple de știință a datelor.
- Ele pot aduce o perspectivă externă, din partea afacerii, în știința datelor.
Din fericire, pentru a deveni un cetățean de știință a datelor nu necesită o diplomă sau chiar un an întreg de pregătire. Necesită muncă, dar beneficiile fac ca munca să merite. Dacă sunteți interesat să deveniți un cetățean de știință de date, iată patru pași care vă pot porni pe acel drum.
1. Solicitați acces la mai multe și noi surse de date.
Dacă te-ai săturat să ai de-a face cu aceleași date vechi din aceleași rapoarte vechi, ai o mâncărime pe cetățenii de știință de date și ar putea fi timpul să-i ceri supervizorului tău acces la date care nu sunt incluse în rapoartele tale normale. și informații.
Când deschideți accesul la date pentru oamenii de știință care nu sunt în domeniul datelor, puteți vedea puterea și beneficiile care derivă din știința datelor cetățenilor. Prin extinderea datelor la un grup unic de oameni de știință ai datelor cetățenilor, IBM a transformat turneul de la Wimbledon din 2016 într-o bibliotecă de informații. Gigantul informatic a împuternicit profesioniștii din tenis să folosească programul lor de analiză a datelor, Watson Analytics. Rezultatul a fost o perspectivă fără precedent asupra performanțelor jucătorilor. Watson Analytics a reușit să folosească puncte de date la fel de mici ca locul unde a aterizat mingea pentru a determina dacă stilul unui jucător s-a schimbat.
Extinderea accesului la oameni fără diplome de știință a datelor a fost, de asemenea, surprinzător de ușoară – mai ușor, de fapt, să antrenezi sportivi profesioniști să folosească software-ul pentru știința datelor decât a fost să-i antrenezi pe oamenii de știință ai datelor pentru a înțelege complexitățile tenisului la nivel profesional. Mai bine, însemna că un grup de oameni cu cunoștințe la nivel de experți au putut contribui la domeniul altfel inaccesibil al științei datelor.
2. Aflați cum să utilizați software-ul de business intelligence cu funcții avansate de analiză și descoperire inteligentă a datelor.
Odată ce obțineți noile surse de date pentru noi perspective, va trebui să știți cum să utilizați instrumentele care fac din știința datelor de nivel înalt o posibilitate pentru cineva fără un doctorat în știința datelor sau statistică.
Ce fel de caracteristici ar trebui să căutați în software-ul care vă poate permite ca un cetățean de știință a datelor?
- Pregătire avansată a datelor cu autoservire
- Analiza comportamentală
- Analiza grafică
- Analiza locației
- Analiza web
- Descoperirea inteligentă a datelor
Pregătirea avansată a datelor în sistem self-service a ajutat deja Sears să-și transforme analiștii de business intelligence în oameni de știință de date pentru cetățeni. Sears a investit în soluția software de descoperire a datelor mari de la Platfora, oferind acces la 400 dintre analiștii lor. Ca rezultat, analiștii au putut folosi segmentarea clienților - de obicei o acțiune avansată de știință a datelor - pentru a îmbunătăți recomandările de produse pentru clienți pe site-ul web Sears.
Furnizorul de business intelligence Alteryx oferă un instrument vizual ușor de utilizat pentru a realiza combinarea complexă a datelor. În loc să trebuiască să creați un nou set de date pentru a încorpora diferite tipuri de date (de exemplu, un fișier Excel și un fișier Oracle), puteți utiliza funcția de glisare și plasare a Alteryx pentru a reduce această sarcină îndelungată de știință a datelor în câteva clicuri mouse.
La fel ca Platfora și Alteryx, software-ul Paxata face ca analiza avansată a datelor să devină realitate. Am vorbit cu Farnaz Erfan de la Paxata, care a descris cum unul dintre clienții lor, o companie de bunuri de larg consum, a adus activități la nivel de doctorat analiștilor.
Paxata a creat „o paradigmă completă de autoservire pentru analiști”, care nu a necesitat ajutorul cercetătorilor de date. Compania a folosit soluția de autoservire pentru a îmbunătăți stocul, aprovizionarea și marketingul. De exemplu, utilizarea Paxata „a redus timpul necesar analiștilor de afaceri pentru a pregăti datele privind timpul de tranzit de la cinci ore pe lună la mai puțin de o oră”. O altă sursă de economii a fost capacitatea de a „detecta frauda cu cupoane prin identificarea și potrivirea adreselor de e-mail ofensive”.
În timp ce învățarea să utilizeze analiza avansată oferă o mulțime de beneficii, va exista și o curbă de învățare. Acestea fiind spuse, nu este prea copleșitor: conform estimărilor Gartner, ar trebui să dureze doar una sau două săptămâni pentru a ajunge la viteza. Majoritatea vânzătorilor oferă instruire, tutoriale și forumuri comunitare cu răspunsuri la întrebări frecvente.
3. Asigurați-vă că guvernarea este configurată
Mo' acces, mo' (guvernarea datelor) probleme. Sau acesta ar putea fi cazul, cu excepția cazului în care faceți din guvernare o prioritate. Odată cu mai mulți oameni de știință de date care accesează mai multe seturi de date, există mai multe oportunități ca datele să cadă în mâinile greșite.
„Guvernarea datelor este absolut esențială”, explică Werner Krebs, CEO al companiei de consultanță în știința datelor Acculation. „Trebuie să vă instruiți angajații să înțeleagă că datele sunt valoroase și să le oferiți instrumente și cadre care să îi ajute să le colecteze”, continuă el. Din fericire, există mai multe cadre pentru organizarea acestor date, de la Managementul calității totale la ISO 9001 la „diferitele cadre six sigma”.
Gartner pune un accent similar pe guvernanța datelor: „Guvernarea adecvată este crucială, la fel ca îndrumarea privind modul de înțelegere a datelor, relațiile acestora și utilizările adecvate.”
Este foarte important să permiteți mai multor persoane să acceseze mai multe date, dar acești oameni trebuie să înțeleagă cum să le acceseze și cum să le păstreze în siguranță (nu citiți documente sensibile într-o zonă cu Wi-Fi public nesecurizat, de exemplu ).
4. Asigurați-vă că organizația dvs. are „tutori” care supraveghează modul în care vă folosiți datele
Un nou rol, cum ar fi cel de știință de date pentru cetățeni, necesită reguli și roluri noi pentru a-l gestiona. Beneficiile pe care le puteți obține din pregătirea avansată a datelor merită cu siguranță o regândire și o reorganizare la nivel de business. Acestea fiind spuse, nu doriți să scăpați de vechile roluri de gestionare a datelor.
O regulă generală pentru gestionarea datelor în epoca oamenilor de știință a datelor cetățenilor este rezumată de vechiul cântec al Girl Scout: fă-ți prieteni noi, dar păstrează vechiul. Cu alte cuvinte, păstrați roluri precum administratorul de date și administratorul bazei de date, dar adăugați și roluri noi, cum ar fi ideea Gartner despre tutore, pentru a vă asigura că oamenii de știință din datele cetățenilor pot folosi ceea ce au nevoie în mod responsabil.
Gartner definește rolul de „gardian” ca fiind oameni care „asigură că datele pot fi industrializate, sigure și scalabile”. Cu alte cuvinte, sunt oameni care supraveghează securitatea datelor și, de asemenea, au grijă ca exemplele de succes ale științei datelor cetățenești să poată fi adoptate de întreaga afacere. De asemenea, ele creează o punte între rolurile tradiționale de gestionare a datelor (Gartner le numește „operatori”) și oamenii de știință care utilizează datele cetățenilor în moduri noi („inovatori”).
Cum ați folosit știința datelor cetățenești?
Jucați rolul unui cetățean de știință de date? Ați folosit analiza avansată a datelor pentru a vă ajuta afacerea să economisească bani sau să câștige bani? Dacă da, spune-mi în comentariile de mai jos!