7 certificazioni Big Data per portare la tua carriera al livello successivo

Pubblicato: 2022-05-07

I big data sono grandi in più di un modo.

Primo, ce n'è una quantità empia.

In secondo luogo, capire come ottenere informazioni da tutti quei dati è un campo professionale redditizio. C'è un motivo per cui si prevede che il mercato del software di business intelligence crescerà a un tasso complessivo del 7,9% da ora fino al 2020.

Glassdoor ha valutato il data scientist come il lavoro numero uno per il 2017. Lo stipendio base medio a sei cifre è abbastanza impressionante, ma il potenziale di crescita per le persone che possono utilizzare quei big data è ancora più impressionante. Non sorprende che così tante persone siano interessate alle certificazioni dei big data.

Se vuoi ottenere la certificazione per lavorare con i big data, ci sono numerose opzioni disponibili. Queste sette certificazioni Big Data possono aiutarti a orientarti tra le enormi quantità di dati attualmente esistenti.

1. Certificazione di specialità Big Data di Amazon Web Services

Quali sono? Le certificazioni Amazon Web Services dimostrano la tua conoscenza dell'ecosistema AWS. Le cinque certificazioni disponibili sono divise in due categorie: ruolo e specialità. La certificazione Big Data di AWS è elencata nella categoria delle specialità.

AWS Certified Big Data verifica se puoi o meno ottenere valore da un set di big data e se puoi automatizzare tale processo. In altre parole: il test determina se sei un vero professionista dei big data.

Costo : quota di iscrizione $ 300.

Prerequisiti : avrai bisogno di AWS Certified Cloud Practitioner o di una certificazione di livello associato come AWS Certified Solution Architect, AWS Certified Developer o un AWS Certified SysOps Administrator. Avrai anche bisogno di almeno cinque anni di esperienza in dati e analisi, esperienza nella progettazione di architetture di elaborazione dati e una comprensione di come le tecnologie AWS si inseriscono nel ciclo di vita dei dati.

Test richiesti : C'è un esame di tre ore a scelta multipla per la certificazione Big Data. Per quanto riguarda il contenuto, il progetto dell'esame dice che ci sono domande a scelta multipla con una risposta giusta e una o due risposte giuste, quindi preparati a provare la stessa ansia paralizzante provocata dai SAT del passato.

L'esame stesso è suddiviso in sei domini: raccolta, elaborazione, archiviazione, analisi, visualizzazione e sicurezza dei dati. Mentre il progetto dell'esame afferma che le domande sono suddivise equamente tra le prime cinque categorie (il 17% delle domande per categoria, ad eccezione della sicurezza dei dati, che rivendica il 20% delle domande), avverte anche che queste informazioni non sono "un elenco completo di tutte del contenuto di questo esame”. Quindi, preparati per l'ignoto.

Dove offerto : per trovare centri di test, avrai bisogno di un account di certificazione AWS.

2. Certificazioni Cloudera

Quali sono? Sono le certificazioni di Cloudera che consentono di utilizzare la loro piattaforma per trasformare i dati grezzi in informazioni utili. Cloudera ne offre quattro:

  • Data Engineer Cloudera Certified Professional (CCP): certifica che puoi "sviluppare pipeline di dati affidabili, autonome e scalabili che si traducono in set di dati ottimizzati per una varietà di carichi di lavoro". In altre parole: CCP Data Engineer dimostra che è possibile gestire i dati in una forma pulita e utile che può essere utilizzata da persone diverse, per scopi diversi.
  • Sviluppatore Spark e Hadoop Cloudera Certified Associate (CCA): la certificazione Spark e Hadoop Developer mostra che puoi "ingerire, trasformare ed elaborare dati utilizzando Apache Spark e gli strumenti principali di Cloudera Enterprise". Ciò significa che puoi fare qualsiasi cosa, dall'importazione e dall'esportazione di dati tra MySQL e HDFS, alla modifica del formato di un set di dati, all'interrogazione dei tuoi dati per generare report.
  • CCA Data Analyst: la certificazione Data Analyst mostra che puoi preparare, strutturare e analizzare i dati nell'ambiente CDH di Cloudera. Potrai eseguire operazioni come importare dati da MySQL in Hadoop, creare e modificare tabelle e creare report con query select e join.
  • Amministratore CCA: certifica che puoi installare e configurare Cloudera Manager e CDH, "eseguire la configurazione di base e avanzata necessaria per amministrare efficacemente un cluster Hadoop" e gestire il cluster Hadoop di un'azienda su base giornaliera.

Costo: Data Engineer CCP: $ 400 per test

CCA Spark e Hadoop: $ 295 per test

Analista di dati CCA: $ 295 per test

Amministratore CCA: $ 295 per test

Prerequisiti: Ufficialmente, non ci sono prerequisiti per nessuna delle certificazioni Cloudera. Tuttavia, Cloudera suggerisce di avere una certa conoscenza prima di provare ciascuno dei certificati.

Per CCP Data Engineer, consigliano "un'esperienza approfondita nello sviluppo di soluzioni di ingegneria dei dati e una padronanza di alto livello" dell'acquisizione dei dati, della trasformazione dei dati, dell'archiviazione e dell'analisi dei dati.

Per CCA Spark e Hadoop Developer, Cloudera suggerisce il proprio corso di formazione come solida preparazione.

Test richiesti: Per ogni certificazione è richiesto un solo test. Tutti i test sono gestiti da un supervisore remoto, che ti tiene d'occhio tramite webcam. Ogni test include da cinque a 12 domande che presentano diverse domande dei clienti o scenari aziendali da affrontare. Il test CCP Data Engineer richiede quattro ore per essere completato; tutti gli altri test richiedono due ore.

Dove offerto (basato sulla posizione o online): tutti i test sono offerti online; è necessaria una webcam.

3. Esperto di soluzioni certificate Microsoft: gestione dei dati e analisi

Che cos'è? Il percorso di gestione e analisi dei dati è solo una delle numerose offerte Microsoft come parte del suo programma Microsoft Certified Solutions Expert ed è quella su cui concentrarsi se ti occupi di big data.

Costo: $ 165 per test, ma ci sono nove test da sostenere

Prerequisiti: per ottenere l'MCSE in Data Management and Analytics, devi prima avere un MCSA in SQL Server 2012/2014 o un MCSA in SQL 2016 Database Administration, BI Development, Machine Learning o Database Development.

Test richiesti: dovrai scegliere e superare un test da un elenco di 12 esami disponibili, che vanno da "Progettazione di soluzioni di database per Microsoft SQL Server" a "Implementazione di un Data Warehouse utilizzando SQL".

Dove offerto (basato sulla posizione o online): gli esami sono offerti tramite Pearson VUE, una società di test che offre esami online e in luoghi fisici.

4. Esame di certificazione Microsoft Azure 70-475

Se stai specificamente cercando di lavorare con i big data su Microsoft Azure, ti consigliamo di sostenere l'esame 70-475, "Progettazione e implementazione di soluzioni di analisi dei big data".

Che cos'è? 70-475 copre tre aree di base: progettazione di soluzioni interattive e di elaborazione batch di big data, progettazione di soluzioni di elaborazione in tempo reale di big data e rendere operative soluzioni di analisi cloud end-to-end.

L'esame 70-475 conta ai fini dell'MCSE (elencato sopra), MCSA e MCP.

Costo: $ 165 per test.

Prerequisiti: Microsoft suggerisce di avere "esperienza di lavoro pertinente"   prima di prendere il 70-475. Se sei interessato a maggiori informazioni, guarda il video di panoramica.

Dove offerto (basato sulla posizione o online): gli esami sono offerti tramite Pearson VUE, una società di test che offre esami online e in luoghi fisici.

5. Certificazioni MongoDB

Che cos'è? Due le certificazioni, in realtà: Mongo Database Administrator Associate e MondoDB Developer Associate. MongoDB è una delle tecnologie NoSQL più popolari ed entrambe le certificazioni ti preparano a lavorare con i database NoSQL.

Il Mongo Database Administrator (DBA) certifica che è possibile utilizzare la popolare tecnologia di gestione dei database open source di Mongo per ottenere valore da dati poco strutturati. La certificazione DB Developer mostra che puoi creare applicazioni con Mongo.

Ciò che differenzia Mongo è che è un database basato su documenti, piuttosto che un database relazionale. Nei database relazionali, i tuoi dati sono organizzati in righe e tabelle. Nei database basati su documenti, i tuoi dati sono archiviati in documenti. Questa differenza è una delle tante cose che rende Mongo buono per l'intelligence sulla posizione, i dati dei social media e (ovviamente) il testo e l'HTML.

Costo: $ 150 per esame

Prerequisiti: nessuno richiesto, ma la gente di Mongo suggerisce di completare il corso di formazione. La buona notizia è che l'iscrizione all'esame viene fornita con una guida allo studio gratuita, quindi se non hai tempo per un percorso formativo strutturato puoi comunque studiare da solo.

Test richiesti: un test a scelta multipla di 90 minuti per ciascuno dei quattro certificati.

Dove offerto (in base alla posizione o online): sia di persona che online.

6. Certificazione Oracle Business Intelligence Foundation Suite 11g Essentials

Che cos'è? La certificazione del gigante del software Oracle attesta che sei esperto con il loro software BI più recente.

Costo: $ 245 per esame

Prerequisiti: nessuno richiesto, ma Oracle suggerisce di completare il corso Bootcamp 11g.

Test richiesti: solo uno, il numero di esame 1Z0-591 dal nome melodico. Hai due ore per rispondere a 75 domande a scelta multipla e dovrai ottenere il 63% per passare.

Ove offerto (in base alla posizione o online): di persona, presso i centri di test Pearson VUE.

7. Certificazione SAS Big Data

Che cos'è? La certificazione di software megavendor SAS che ti consente di lavorare con il loro popolare software di business intelligence. I corsi di preparazione sono disponibili sia in aula che in formato blended learning (alcuni lavori in classe, altri online).

Costo: $ 180 per esame. Il corso SAS Big Data ti costerà $ 9.000 per la versione in aula/di persona (esame incluso) e $ 4.275 per la formazione a distanza ed entrambi gli esami.

Prerequisiti: SAS richiede "almeno sei mesi di esperienza di programmazione in SAS o in un altro linguaggio di programmazione".

Test richiesti: per ottenere la certificazione dovrai superare entrambi i seguenti requisiti:

  1. Esplorazione, statistica ed esplorazione visiva dei big data
  2. Programmazione e caricamento di Big Data

Dove offerto (in base alla posizione o online): sia di persona che online.

Hai bisogno di una certificazione Big Data?

Preparati a sentirti come Harry Truman che chiede un economista con una mano sola, perché sto per complicare le cose.

Non tutti i professionisti dei dati sono d'accordo sui vantaggi delle certificazioni dei big data. "Un certificato di data science è un buon inizio, ma non sufficiente", afferma Gregory Piatetsky-Shapiro, editore del sito Web di data science KDNuggets. Oltre alla certificazione, Piatetsky-Shapario afferma, "è necessario mostrare abilità e comprensione", sia vincendo concorsi di scienza dei dati in un sito come Kaggle, sia semplicemente facendo "qualche analisi interessante da solo".

Piatetsky-Shapiro non è il solo a preferire il know-how pratico alla certificazione ufficiale. Parlando di certificazioni SAS per big data, Patricia Flickner, la veterana sviluppatrice SAS, afferma di essere più interessata a sapere se "puoi programmare e pensare in piedi". Anche se hai "una pila di certificati alta un miglio", dice, non verrai preso in considerazione senza sapere come codificare ed estrarre i dati giusti dai posti giusti.

Bo Peng di Datascope, una società di consulenza per la scienza dei dati, afferma che le certificazioni per i big data non sono una garanzia che verrai assunto. "Ho letto nel nostro ultimo giro di assunzioni probabilmente 200 curriculum in tutto, con tutti i tipi di background e diplomi diversi, e non ho trovato alcuna reale correlazione tra la qualità del candidato e il tipo di certificazione che aveva".

Ciò che contava di più, afferma Peng, era il modo in cui i candidati si sono comportati nelle sfide di scienza dei dati che sono state poste durante il colloquio.

Randy Zwitch, principale data scientist di Comcast, conferma l'opinione di Peng. "La parte più importante della scienza dei dati per cui assumiamo è la comprovata capacità di risolvere i problemi relativi ai dati... stiamo cercando persone che capiscano la matematica, siano a proprio agio nella lettura di libri di testo/documenti tecnici e capiscano come lavorare con diverse fonti di dati". La certificazione, d'altra parte, aiuterebbe solo un candidato "che già lavora come analista di dati", afferma.

Se c'è qualche correlazione tra la certificazione e le possibilità di un candidato, osserva Peng, è più probabile che sia negativa. "Molte delle certificazioni provengono da software proprietario, dove una volta che sei certificato, sei bloccato in un pezzo di mega software che costa un sacco di soldi a consulenti e clienti".

Le licenze per software di business intelligence e software per big data sono costose e tale spesa può sembrare superflua quando ci sono più opzioni open source gratuite, come i linguaggi di programmazione Python e R. Ciò ha ancora più peso se si considera la popolarità di R e Python superando e sostituendo giocatori di data science più grandi come SAS. La scienza dei dati è un campo in continua evoluzione e i linguaggi open source sono attualmente al top.

D'altro canto, alcune persone sostengono che le certificazioni dei big data siano una buona idea. Indicano l'assenza di data scientist, come la prevista carenza di 1,7 milioni di dipendenti con le competenze relative ai dati richieste. Le certificazioni dei big data, sostengono, sono un modo utile per segnalare che puoi aiutare a colmare le lacune nella scienza dei dati che molte organizzazioni potrebbero avere.

Sebbene una certificazione possa segnalare una certa conoscenza della scienza dei dati, la maggior parte dei data scientist concorderebbe sul fatto che una certificazione è molto meno utile della formazione accademica o dell'esperienza pratica. Erwan Rouzel di Credit Agricole Consumer Finance afferma che "essere [un] vero scienziato dei dati non può essere possibile solo attraverso una certificazione, poiché richiede almeno uno o due anni di studio di matematica e statistica avanzate".

Una certificazione non fornirà la stessa conoscenza approfondita di un programma di livello universitario.

Qual è la tua opinione sulle certificazioni dei big data?

Hai una certificazione Big Data? Se sì, ritieni che sia stato un aiuto o un ostacolo? Mi piacerebbe sapere se la tua carriera nel settore dei dati è stata aiutata dalla certificazione.

Se sei ulteriormente interessato ai big data, dai un'occhiata a uno di questi altri post di Capterra:

11 conferenze sui big data da non perdere per analisti di dati

10 sorprendenti statistiche sui big data

Che cosa sono i big data e come possono potenziare la tua piccola impresa?