7 certifications Big Data pour faire passer votre carrière au niveau supérieur

Publié: 2022-05-07

Le Big Data est important à plus d'un titre.

Premièrement, il y en a une quantité impie.

Deuxièmement, comprendre comment obtenir des informations sur toutes ces données est un domaine de carrière lucratif. Il y a une raison pour laquelle le marché des logiciels de business intelligence devrait croître à un taux global de 7,9 % d'ici 2020.

Glassdoor a classé le data scientist comme l'emploi numéro un pour 2017. Le salaire de base médian à six chiffres est assez impressionnant, mais le potentiel de croissance pour les personnes qui peuvent utiliser ces mégadonnées est encore plus impressionnant. Il n'est pas étonnant que tant de personnes soient intéressées par les certifications Big Data.

Si vous souhaitez obtenir une certification pour travailler avec le Big Data, il existe de nombreuses options. Ces sept certifications Big Data peuvent vous aider à vous repérer parmi les énormes quantités de données qui existent actuellement.

1. Certification de spécialité Big Data d'Amazon Web Services

Que sont-ils? Les certifications Amazon Web Services démontrent votre connaissance de l'écosystème AWS. Les cinq certifications disponibles sont divisées en deux catégories : fonction et spécialité. La certification Big Data d'AWS est répertoriée dans la catégorie spécialisée.

AWS Certified Big Data teste si vous pouvez ou non tirer parti d'un ensemble de Big Data et si vous pouvez automatiser ce processus. En d'autres termes : le test détermine si vous êtes un véritable professionnel du Big Data.

Coût : 300 $ de frais d'inscription.

Prérequis : Vous aurez besoin du AWS Certified Cloud Practitioner ou d'une certification de niveau associé en tant qu'AWS Certified Solution Architect, AWS Certified Developer ou AWS Certified SysOps Administrator. Vous aurez également besoin d'au moins cinq ans d'expérience dans les données et l'analyse, d'une expérience dans la conception d'architecture de traitement de données et d'une compréhension de la manière dont les technologies AWS s'intègrent dans le cycle de vie des données.

Tests requis : Il y a un examen à choix multiples de trois heures pour la certification Big Data. Quant à ce qu'il contient, le plan d'examen indique qu'il y a des questions à choix multiples avec une bonne réponse et une ou deux bonnes réponses, alors préparez-vous à ressentir la même anxiété paralysante provoquée par les SAT d'antan.

L'examen lui-même est divisé en six domaines : collecte, traitement, stockage, analyse, visualisation et sécurité des données. Bien que le plan d'examen indique que les questions sont réparties également entre les cinq premières catégories (17 % des questions par catégorie, à l'exception de la sécurité des données, qui revendique 20 % des questions), il avertit également que ces informations ne sont pas "une liste complète de tous du contenu de cet examen. Alors, préparez-vous à l'inconnu.

Là où ils sont proposés : pour trouver des centres de test, vous aurez besoin d'un compte de certification AWS.

2. Certifications Cloudera

Que sont-ils? Ce sont les certifications de Cloudera que vous pouvez utiliser leur plate-forme pour transformer des données brutes en informations utiles. Cloudera en propose quatre :

  • Cloudera Certified Professional (CCP) Data Engineer : certifie que vous pouvez « développer des pipelines de données fiables, autonomes et évolutifs qui se traduisent par des ensembles de données optimisés pour une variété de charges de travail ». En d'autres termes : CCP Data Engineer démontre que vous pouvez regrouper les données dans une forme propre et utile qui peut être utilisée par différentes personnes, à des fins différentes.
  • Cloudera Certified Associate (CCA) Spark and Hadoop Developer : La certification Spark and Hadoop Developer montre que vous pouvez « ingérer, transformer et traiter des données à l'aide d'Apache Spark et des principaux outils Cloudera Enterprise ». Cela signifie que vous pouvez tout faire, de l'importation et de l'exportation de données entre MySQL et HDFS, à la modification du format d'un ensemble de données, en passant par l'interrogation de vos données pour générer des rapports.
  • Analyste de données CCA : la certification d'analyste de données montre que vous pouvez préparer, structurer et analyser des données dans l'environnement CDH de Cloudera. Vous pourrez par exemple importer des données de MySQL dans Hadoop, créer et modifier des tables et créer des rapports avec des requêtes de sélection et de jointure.
  • Administrateur CCA : certifie que vous pouvez installer et configurer Cloudera Manager et CDH, « effectuer la configuration de base et avancée nécessaire pour administrer efficacement un cluster Hadoop », et gérer le cluster Hadoop d'une entreprise au quotidien.

Coût : Ingénieur de données CCP : 400 $ par test

CCA Spark et Hadoop : 295 $ par test

Analyste de données CCA : 295 $ par test

Administrateur CCA : 295 $ par test

Prérequis : Officiellement, il n'y a aucun prérequis pour aucune des certifications Cloudera. Cependant, Cloudera suggère que vous ayez certaines connaissances avant d'essayer chacun des certificats.

Pour CCP Data Engineer, ils recommandent "une expérience approfondie dans le développement de solutions d'ingénierie de données et une maîtrise de haut niveau" de l'ingestion de données, de la transformation de données, du stockage de données et de l'analyse de données.

Pour CCA Spark et Hadoop Developer, Cloudera propose sa propre formation comme solide préparation.

Tests requis : Un seul test est requis pour chaque certification. Tous les tests sont administrés par un surveillant à distance, qui vous surveille par webcam. Chaque test comprend cinq à 12 questions qui présentent différentes questions de clients ou scénarios commerciaux à aborder. Le test CCP Data Engineer dure quatre heures ; tous les autres tests prennent deux heures.

Là où ils sont proposés (basés sur la localisation ou en ligne) : tous les tests sont proposés en ligne ; une webcam est nécessaire.

3. Expert en solutions certifié Microsoft : gestion et analyse des données

Qu'est-ce que c'est? La piste Data Management and Analytics n'est qu'une des nombreuses offres Microsoft dans le cadre de son programme Microsoft Certified Solutions Expert, et c'est celle sur laquelle vous devez vous concentrer si vous êtes dans le domaine du Big Data.

Coût : 165 $ par test, mais il y a neuf tests à passer

Prérequis : pour obtenir le MCSE en gestion et analyse de données, vous aurez d'abord besoin d'un MCSA dans SQL Server 2012/2014 ou d'un MCSA dans SQL 2016 Database Administration, BI Development, Machine Learning ou Database Development.

Tests requis : vous devrez choisir et réussir un test parmi une liste de 12 examens disponibles, allant de "Conception de solutions de base de données pour Microsoft SQL Server" à "Mise en œuvre d'un entrepôt de données à l'aide de SQL".

Là où ils sont proposés (localisés ou en ligne) : les examens sont proposés via Pearson VUE, une société de test qui propose des examens en ligne et dans des lieux physiques.

4. Examen de certification Microsoft Azure 70-475

Si vous cherchez spécifiquement à travailler avec le Big Data sur Microsoft Azure, vous voudrez passer l'examen 70-475, "Conception et mise en œuvre de solutions d'analyse de Big Data".

Qu'est-ce que c'est? 70-475 couvre trois domaines fondamentaux : la conception de solutions interactives et de traitement par lots de données volumineuses, la conception de solutions de traitement en temps réel de données volumineuses et l'opérationnalisation de solutions d'analyse cloud de bout en bout.

L'examen 70-475 compte pour le MCSE (énuméré ci-dessus), le MCSA et le MCP.

Coût : 165 $ par test.

Prérequis : Microsoft vous suggère d'avoir une "expérience de travail pertinente"   avant de prendre le 70-475. Si vous souhaitez plus d'informations, consultez la vidéo de présentation.

Là où ils sont proposés (localisés ou en ligne) : les examens sont proposés via Pearson VUE, une société de test qui propose des examens en ligne et dans des lieux physiques.

5. Certifications MongoDB

Qu'est-ce que c'est? Deux certifications, en fait : Mongo Database Administrator Associate et MondoDB Developer Associate. MongoDB est l'une des technologies NoSQL les plus populaires, et les deux certifications vous préparent à travailler avec des bases de données NoSQL.

L'administrateur de base de données Mongo (DBA) certifie que vous pouvez utiliser la technologie de gestion de base de données open source populaire de Mongo pour tirer parti des données peu structurées. La certification DB Developer montre que vous pouvez créer des applications avec Mongo.

Ce qui différencie Mongo, c'est qu'il s'agit d'une base de données basée sur des documents, plutôt que d'une base de données relationnelle. Dans les bases de données relationnelles, vos données sont organisées en lignes et en tables. Dans les bases de données basées sur des documents, vos données sont stockées dans des documents. Cette différence est l'une des nombreuses choses qui rendent Mongo bon pour l'intelligence de localisation, les données des médias sociaux et (bien sûr) le texte et le HTML.

Coût : 150 $ par examen

Prérequis : Aucun requis, mais les gens de Mongo suggèrent de suivre leur cours de formation. La bonne nouvelle est que l'inscription à l'examen est accompagnée d'un guide d'étude gratuit, donc si vous n'avez pas le temps de suivre un cours de formation structuré, vous pouvez toujours étudier par vous-même.

Tests requis : Un test à choix multiples de 90 minutes pour chacun des quatre certificats.

Où offert (basé sur la localisation ou en ligne) : En personne et en ligne.

6. Certification Oracle Business Intelligence Foundation Suite 11g Essentials

Qu'est-ce que c'est? Certification du géant du logiciel Oracle selon laquelle vous maîtrisez son dernier logiciel de BI.

Coût : 245 $ par examen

Prérequis : Aucun requis, mais Oracle suggère de suivre leur cours Bootcamp 11g.

Tests requis : un seul, le numéro d'examen mélodiquement nommé 1Z0-591. Vous avez deux heures pour répondre à 75 questions à choix multiples, et vous devrez obtenir 63 % pour réussir.

Où offert (basé sur la localisation ou en ligne) : En personne, dans les centres de test Pearson VUE.

7. Certification SAS Big Data

Qu'est-ce que c'est? Certification du mégafournisseur de logiciels SAS selon laquelle vous pouvez travailler avec leur logiciel de veille économique populaire. Les cours préparatoires sont disponibles en format salle de classe et en apprentissage mixte (certains travaux en classe, certains en ligne).

Coût : 180 $ par examen. Le cours SAS Big Data vous coûtera 9 000 $ pour la version en classe / en personne (examen inclus) et 4 275 $ pour la formation à distance et les deux examens.

Prérequis : SAS exige que vous ayez "au moins six mois d'expérience en programmation dans SAS ou dans un autre langage de programmation".

Tests requis : vous devrez réussir les deux éléments suivants pour obtenir la certification :

  1. Exploration de données volumineuses, statistiques et exploration visuelle
  2. Programmation et chargement de données volumineuses

Où offert (basé sur la localisation ou en ligne) : En personne et en ligne.

Avez-vous besoin d'une certification Big Data ?

Préparez-vous à vous sentir comme Harry Truman demandant un économiste à une main, car je suis sur le point de compliquer les choses.

Tous les professionnels des données ne s'accordent pas sur les avantages des certifications Big Data. "Un certificat en science des données est un bon début, mais pas suffisant", déclare Gregory Piatetsky-Shapiro, rédacteur en chef du site Web de science des données KDNuggets. Au-delà de la certification, dit Piatetsky-Shapario, "vous devez faire preuve de compétences et de compréhension", que ce soit en remportant des concours de science des données sur un site comme Kaggle, ou en faisant simplement "une analyse intéressante par vous-même".

Piatetsky-Shapiro n'est pas le seul à préférer le savoir-faire pratique à la certification officielle. Parlant des certifications SAS Big Data, Patricia Flickner, développeur chevronné de SAS, dit qu'elle est plus intéressée par la question de savoir si "vous pouvez coder et penser sur vos pieds". Même si vous avez « une pile de certificats d'un mile de haut », dit-elle, vous ne serez pas pris en considération sans savoir comment coder et extraire les bonnes données aux bons endroits.

Bo Peng de Datascope, un cabinet de conseil en science des données, affirme que les certifications Big Data ne garantissent pas que vous serez embauché. "J'ai lu lors de notre dernière campagne de recrutement probablement 200 CV en tout, avec toutes sortes d'horizons et de diplômes différents, et je n'ai trouvé aucune corrélation réelle entre la qualité du candidat et le type de certification qu'il possédait."

Selon Peng, ce qui importait le plus, c'était la performance des candidats aux défis de la science des données qui leur avaient été confiés lors de l'entretien.

Randy Zwitch, scientifique principal des données chez Comcast, corrobore l'avis de Peng. "La partie la plus importante de la science des données pour laquelle nous embauchons est une capacité éprouvée à résoudre des problèmes de données... nous recherchons des personnes qui comprennent les mathématiques, sont à l'aise avec la lecture de manuels/documents techniques et comprennent comment travailler avec des sources de données variées." La certification, en revanche, n'aiderait qu'un candidat « travaillant déjà comme analyste de données », dit-il.

S'il existe une corrélation entre la certification et les chances d'un candidat, note Peng, il est plus probable qu'elle soit négative. "Beaucoup de certifications proviennent de logiciels propriétaires, où une fois que vous êtes certifié, vous êtes enfermé dans un méga logiciel qui coûte très cher au consultant et au client."

Les licences pour les logiciels de business intelligence et les logiciels de big data sont chères, et cette dépense peut sembler inutile lorsqu'il existe plusieurs options open source gratuites, comme les langages de programmation Python et R. Cela a encore plus de poids si l'on considère la popularité de R et Python. devancer et remplacer les grands acteurs de la science des données comme SAS. La science des données est un domaine en constante évolution, et les langages open source sont actuellement en tête.

D'un autre côté, certaines personnes soutiennent que les certifications Big Data sont une bonne idée. Ils soulignent l'absence de scientifiques des données, comme la pénurie prévue de 1,7 million d'employés possédant les compétences requises en matière de données. Selon eux, les certifications Big Data sont un moyen utile de signaler que vous pouvez aider à combler les lacunes de la science des données que de nombreuses organisations peuvent avoir.

Bien qu'une certification puisse signaler certaines connaissances en science des données, la plupart des scientifiques des données conviendraient qu'une certification est beaucoup moins utile qu'une formation académique ou une expérience pratique. Erwan Rouzel de Crédit Agricole Consumer Finance déclare qu'"être [un] vrai data scientist ne peut pas être possible grâce à une simple certification, car cela nécessite au moins un ou deux ans d'études avancées en mathématiques et statistiques".

Une certification ne fournira pas les mêmes connaissances approfondies qu'un programme de niveau collégial.

Que pensez-vous des certifications Big Data ?

Avez-vous une certification Big Data ? Si oui, pensez-vous que cela a été une aide ou un obstacle ? J'aimerais savoir si votre carrière dans les données a été aidée par la certification.

Si vous êtes davantage intéressé par le Big Data, consultez l'un de ces autres articles de Capterra :

11 conférences incontournables sur le Big Data pour les analystes de données

10 statistiques surprenantes sur le Big Data

Qu'est-ce que le Big Data et comment peut-il dynamiser votre petite entreprise ?