4 Semplici Passi per Diventare un Cittadino Data Scientist

Pubblicato: 2022-05-07

Cos'è un citizen data scientist?

Una persona che può svolgere (alcuni) lavori a livello di data scientist, senza la formazione di un data scientist.

Un lavoratore che può utilizzare il software di business intelligence per eseguire il clustering, la segmentazione e la fusione avanzata dei dati, anche se non ha un dottorato di ricerca in statistica.

In altre parole? Un citizen data scientist è l'unicorno di quartiere amichevole di ogni azienda.

Se si vuole una definizione formale, Gartner definisce il citizen data scientist (CDS) come “una persona che crea o genera modelli che utilizzano analisi diagnostiche avanzate o capacità predittive e prescrittive, ma la cui funzione lavorativa primaria è al di fuori del campo della statistica e dell'analisi. "

In molti casi, "al di fuori del campo della statistica e dell'analisi" significa che il CDS è un analista aziendale, un analista aziendale che ha imparato a creare quei modelli di alto livello da un misto di iniziativa (se riesco a scoprire la variabile x, può aumentare le nostre entrate) e necessità (i nostri data scientist sono sovraccaricati come un insegnante senza un periodo di pianificazione).

Poiché i data scientist sono sempre più gravati dalle richieste di rendere un'azienda più basata sui dati, i citizen data scientist possono aiutare le loro attività in due modi chiave:

  • possono alleggerire il carico dei data scientist utilizzando il giusto software di business intelligence per svolgere le attività di data science più semplici.
  • Possono portare alla scienza dei dati la prospettiva lato business di un estraneo.

Fortunatamente, diventare un citizen data scientist non richiede una laurea, e nemmeno un anno intero di formazione. Richiede lavoro, ma i vantaggi rendono il lavoro utile. Se sei interessato a diventare un citizen data scientist, ecco quattro passaggi che possono avviarti su quella strada.

1. Richiedere l'accesso a più e nuove fonti di dati.

Se sei stanco di avere a che fare con gli stessi vecchi dati degli stessi vecchi rapporti, hai il prurito del citizen data scientist e potrebbe essere il momento di chiedere al tuo supervisore l'accesso a dati che non sono inclusi nei tuoi normali rapporti e informazioni.

Quando apri l'accesso ai dati ai non data scientist, puoi vedere la forza e i vantaggi che derivano dalla scienza dei dati dei cittadini. Espandendo i dati a un gruppo davvero unico di citizen data scientist, IBM ha trasformato il torneo di Wimbledon 2016 in una libreria di informazioni. Il gigante dei computer ha consentito ai professionisti del tennis di utilizzare il loro programma di analisi dei dati, Watson Analytics. Il risultato è stato una visione senza precedenti delle prestazioni dei giocatori. Watson Analytics è stato in grado di utilizzare punti dati piccoli come il punto in cui è atterrata la palla per determinare se lo stile di un giocatore era cambiato.

Anche ampliare l'accesso alle persone senza una laurea in scienze dei dati è stato sorprendentemente facile: più facile, in realtà, addestrare atleti professionisti a utilizzare il software di scienza dei dati che addestrare i data scientist a comprendere le complessità del tennis di livello professionale. Meglio ancora, significava che un gruppo di persone con conoscenze di livello esperto poteva contribuire al campo altrimenti inaccessibile della scienza dei dati.

2. Scopri come utilizzare il software di business intelligence con funzionalità di analisi avanzate e rilevamento intelligente dei dati.

Una volta che hai le nuove fonti di dati per nuove informazioni, dovrai sapere come utilizzare gli strumenti che rendono la scienza dei dati di alto livello una possibilità per chi non ha un dottorato in scienza dei dati o statistica.

Che tipo di funzionalità dovresti cercare in un software che possa abilitarti come citizen data scientist?

  • Preparazione avanzata dei dati self-service
  • Analisi comportamentale
  • Analisi dei grafici
  • Analisi della posizione
  • Analisi web
  • Scoperta intelligente dei dati

La preparazione avanzata dei dati self-service ha già aiutato Sears a trasformare i propri analisti di business intelligence in citizen data scientist. Sears ha investito nella soluzione software per il rilevamento dei big data di Plafora, garantendo l'accesso a 400 dei suoi analisti. Di conseguenza, gli analisti sono stati in grado di utilizzare la segmentazione dei clienti, normalmente un'azione avanzata di data science, per migliorare i consigli sui prodotti per i clienti sul sito Web di Sears.

Il fornitore di business intelligence Alteryx offre uno strumento visivo di facile utilizzo per combinare dati complessi. Invece di dover creare un nuovo set di dati per incorporare diversi tipi di dati (ad esempio, un file Excel e un file Oracle), puoi utilizzare la funzione di trascinamento della selezione di Alteryx per ridurre quella lunga attività di scienza dei dati in pochi clic di un topo.

Come Platfora e Alteryx, il software di Paxata rende l'analisi dei dati avanzata una realtà. Ho parlato con Farnaz Erfan di Paxata, che ha descritto come uno dei suoi clienti, un'azienda di beni di consumo confezionati, ha portato attività di dottorato agli analisti.

Paxata ha creato "un paradigma self-service completo per gli analisti", che non richiedeva l'aiuto dei data scientist. L'azienda ha utilizzato la soluzione self-service per migliorare l'inventario, la fornitura e il marketing. Ad esempio, l'utilizzo di Paxata "ha ridotto il tempo necessario agli analisti aziendali per preparare i dati sui tempi di transito da cinque ore al mese a meno di un'ora". Un'altra fonte di risparmio è stata la capacità di "rilevare le frodi sui coupon identificando e abbinando indirizzi e-mail offensivi".

Mentre imparare a utilizzare l'analisi avanzata offre molti vantaggi, ci sarà anche una curva di apprendimento. Detto questo, non è troppo opprimente: secondo la stima di Gartner, dovrebbero volerci solo una o due settimane per mettersi al passo. La maggior parte dei fornitori offre formazione, tutorial e forum della community con risposte a domande comuni.

3. Assicurati che la governance sia impostata

Mo' access, mo' (data governance) problemi. O potrebbe essere il caso, a meno che tu non dia la priorità alla governance. Con più citizen data scientist che accedono a più set di dati, ci sono più opportunità che i dati cadano nelle mani sbagliate.

"La governance dei dati è assolutamente fondamentale", spiega Werner Krebs, CEO della società di consulenza per la scienza dei dati Acculation. "Devi addestrare i tuoi dipendenti a capire che i dati sono preziosi e aiutarli a fornire loro strumenti e framework per aiutarli a raccoglierli", continua. Fortunatamente, ci sono più framework per organizzare quei dati, da Total Quality Management a ISO 9001 ai "vari framework six sigma".

Gartner pone un'enfasi simile sulla governance dei dati: "Una corretta governance è fondamentale, così come le indicazioni su come comprendere i dati, le loro relazioni e gli usi appropriati".

È molto utile consentire a più persone di accedere a più dati, ma queste persone devono capire come accedervi e come mantenerli al sicuro (non andare a leggere documenti sensibili in un'area con Wi-Fi pubblico non protetto, ad esempio ).

4. Assicurati che la tua organizzazione disponga di "tutori" che supervisionano il modo in cui utilizzi i tuoi dati

Un nuovo ruolo come il citizen data scientist richiede nuove regole e ruoli per gestirlo. I vantaggi che puoi ottenere dalla preparazione avanzata dei dati meritano sicuramente un ripensamento e una riorganizzazione a livello aziendale. Detto questo, non vuoi sbarazzarti dei vecchi ruoli di gestione dei dati.

Una regola pratica per la gestione dei dati nell'era dei citizen data scientist è riassunta dalla vecchia canzone delle Girl Scout: fai nuove amicizie, ma mantieni le vecchie. In altre parole, mantenere ruoli come data steward e amministratore di database, ma anche aggiungere nuovi ruoli, come l'idea di Gartner del tutore, per assicurarsi che i citizen data scientist possano utilizzare ciò di cui hanno bisogno in modo responsabile.

Gartner definisce il ruolo di "custode" come le persone che "assicurano che i dati possano essere industrializzati, sicuri e scalabili". In altre parole, sono persone che sovrintendono alla sicurezza dei dati e fanno anche in modo che le istanze di successo della scienza dei dati dei cittadini possano essere adottate dall'intera azienda. Inoltre colmano il divario tra i ruoli tradizionali di gestione dei dati (Gartner li chiama "operatori") e i citizen data scientist che utilizzano i dati in modi nuovi ("innovatori").

Come hai utilizzato la scienza dei dati dei cittadini?

Interpreti il ​​ruolo di un citizen data scientist? Hai utilizzato l'analisi dei dati avanzata per aiutare la tua azienda a risparmiare o fare soldi? Se è così, fammi sapere nei commenti qui sotto!