7 сертификатов по работе с большими данными, которые поднимут вашу карьеру на новый уровень

Опубликовано: 2022-05-07

Большие данные велики во многих отношениях.

Во-первых, его неимоверное количество.

Во-вторых, выяснение того, как получить представление обо всех этих данных, является прибыльной областью карьеры. Есть причина, по которой ожидается, что рынок программного обеспечения для бизнес-аналитики будет расти с общей скоростью 7,9% до 2020 года.

В 2017 году компания Glassdoor назвала исследователя данных работой номер один. Шестизначная средняя базовая зарплата достаточно впечатляет, но потенциал роста для людей, которые могут использовать эти большие данные, впечатляет еще больше. Неудивительно, что так много людей заинтересованы в сертификации больших данных.

Если вы хотите пройти сертификацию для работы с большими данными, существует множество вариантов. Эти семь сертификатов по работе с большими данными помогут вам сориентироваться в огромных объемах данных, существующих в настоящее время.

1. Сертификация Amazon Web Services по специальности «Большие данные»

Кто они такие? Сертификаты Amazon Web Services демонстрируют ваши знания об экосистеме AWS. Пять доступных сертификатов разделены на две категории: ролевые и специализированные. Сертификация AWS для работы с большими данными указана в специальной категории.

AWS Certified Big Data проверяет, можете ли вы извлечь пользу из набора больших данных и можете ли вы автоматизировать этот процесс. Другими словами: тест определяет, являетесь ли вы настоящим профессионалом в области больших данных.

Стоимость : 300 долларов за регистрацию.

Предварительные требования : вам потребуется сертификат AWS Certified Cloud Practitioner или сертификат ассоциированного уровня в качестве сертифицированного AWS архитектора решений, сертифицированного AWS разработчика или сертифицированного AWS SysOps-администратора. Вам также потребуется как минимум пятилетний опыт работы с данными и аналитикой, опыт проектирования архитектуры обработки данных и понимание того, как технологии AWS вписываются в жизненный цикл данных.

Требуемые тесты . Для получения сертификата по работе с большими данными предусмотрен трехчасовой экзамен с несколькими вариантами ответов. Что касается того, что на нем написано, в плане экзамена говорится, что есть вопросы с несколькими вариантами ответов с одним правильным ответом и одним или двумя правильными ответами, так что будьте готовы почувствовать ту же калечащую тревогу, которую вызвали SAT прошлых лет.

Сам экзамен разбит на шесть доменов: сбор, обработка, хранение, анализ, визуализация и безопасность данных. Хотя в плане экзамена говорится, что вопросы распределены поровну между первыми пятью категориями (17% вопросов в каждой категории, за исключением безопасности данных, на которую приходится 20% вопросов), он также предупреждает, что эта информация не является «полным списком всех вопросов». содержания этого экзамена». Так что будьте готовы к неизвестности.

Где предлагается : чтобы найти центры тестирования, вам потребуется сертификационный аккаунт AWS.

2. Сертификаты Cloudera

Кто они такие? Это сертификаты Cloudera, подтверждающие, что вы можете использовать их платформу для преобразования необработанных данных в полезную информацию. Cloudera предлагает четыре:

  • Cloudera Certified Professional (CCP) Data Engineer: подтверждает, что вы можете «разрабатывать надежные, автономные, масштабируемые конвейеры данных, которые приводят к оптимизированным наборам данных для различных рабочих нагрузок». Другими словами: CCP Data Engineer демонстрирует, что вы можете преобразовывать данные в чистую, полезную форму, которую могут использовать разные люди для разных целей.
  • Cloudera Certified Associate (CCA) Spark and Hadoop Developer: Сертификация Spark и Hadoop Developer показывает, что вы можете «принимать, преобразовывать и обрабатывать данные с помощью Apache Spark и основных инструментов Cloudera Enterprise». Это означает, что вы можете делать все, от импорта и экспорта данных между MySQL и HDFS до изменения формата набора данных и запроса ваших данных для создания отчетов.
  • CCA Data Analyst: Сертификация Data Analyst показывает, что вы можете подготавливать, структурировать и анализировать данные в среде Cloudera CDH. Вы сможете выполнять такие действия, как импорт данных из MySQL в Hadoop, создавать и изменять таблицы, а также создавать отчеты с запросами на выборку и соединение.
  • Администратор CCA: подтверждает, что вы можете устанавливать и настраивать Cloudera Manager и CDH, «выполнять базовую и расширенную настройку, необходимую для эффективного администрирования кластера Hadoop», и ежедневно управлять кластером Hadoop компании.

Стоимость: CCP Data Engineer: 400 долларов США за тест.

CCA Spark и Hadoop: 295 долларов за тест

Аналитик данных CCA: $295 за тест

Администратор CCA: $295 за тест

Предварительные требования: Официально никаких предварительных условий для получения каких-либо сертификатов Cloudera не существует. Тем не менее, Cloudera предполагает, что у вас есть определенные знания, прежде чем пытаться использовать каждый из сертификатов.

Для CCP Data Engineer они рекомендуют «глубокий опыт разработки решений для обработки данных и высокий уровень мастерства» в приеме данных, преобразовании данных, хранении данных и анализе данных.

Для CCA Spark и Hadoop Developer Cloudera предлагает собственный учебный курс в качестве надежной подготовки.

Требуемые тесты: для каждой сертификации требуется только один тест. Все тесты проводит удаленный проктор, который наблюдает за вами через веб-камеру. Каждый тест включает от 5 до 12 вопросов, которые представляют различные вопросы клиентов или бизнес-сценарии для решения. Тест CCP Data Engineer занимает четыре часа; все остальные тесты занимают два часа.

Где предлагается (на основе местоположения или онлайн): все тесты предлагаются онлайн; требуется веб-камера.

3. Сертифицированный эксперт Microsoft по решениям: управление данными и аналитика

Что это? Направление «Управление данными и аналитика» — это лишь одно из нескольких предложений Microsoft в рамках ее программы Microsoft Certified Solutions Expert, и на нем следует сосредоточиться, если вы работаете с большими данными.

Стоимость: 165 долларов за тест, но нужно пройти девять тестов.

Предварительные требования: чтобы получить MCSE в области управления данными и аналитики, вам сначала потребуется MCSA в SQL Server 2012/2014 или MCSA в администрировании баз данных SQL 2016, разработке бизнес-аналитики, машинном обучении или разработке баз данных.

Требуемые тесты: вам нужно будет выбрать и сдать один тест из списка 12 доступных экзаменов, начиная от «Проектирование решений для баз данных для Microsoft SQL Server» до «Внедрение хранилища данных с использованием SQL».

Где предлагается (в зависимости от местоположения или онлайн): Экзамены предлагаются через Pearson VUE, компанию по тестированию, которая предлагает экзамены онлайн и в физических местах.

4. Сертификационный экзамен Microsoft Azure 70-475

Если вы специально хотите работать с большими данными в Microsoft Azure, вам нужно сдать экзамен 70-475 «Проектирование и внедрение решений для анализа больших данных».

Что это? 70-475 охватывает три основные области: проектирование пакетной обработки больших данных и интерактивных решений, проектирование решений для обработки больших данных в режиме реального времени и внедрение комплексных решений облачной аналитики.

Экзамен 70-475 засчитывается в счет MCSE (перечислены выше), MCSA и MCP.

Стоимость: 165 долларов за тест.

Предварительные требования: Microsoft предполагает, что у вас есть «соответствующий опыт работы».   прежде чем брать 70-475. Если вас интересует дополнительная информация, посмотрите обзорное видео.

Где предлагается (в зависимости от местоположения или онлайн): Экзамены предлагаются через Pearson VUE, компанию по тестированию, которая предлагает экзамены онлайн и в физических местах.

5. Сертификаты MongoDB

Что это? На самом деле два сертификата: Mongo Database Administrator Associate и MondoDB Developer Associate. MongoDB — одна из самых популярных технологий NoSQL, и обе сертификации готовят вас к работе с базами данных NoSQL.

Администратор баз данных Mongo (DBA) подтверждает, что вы можете использовать популярную технологию управления базами данных Mongo с открытым исходным кодом, чтобы извлечь выгоду из слабо структурированных данных. Сертификация разработчика БД показывает, что вы можете создавать приложения с помощью Mongo.

Что отличает Mongo, так это то, что это база данных на основе документов, а не реляционная база данных. В реляционных базах данных ваши данные организованы в строки и таблицы. В базах данных на основе документов ваши данные хранятся в документах. Это отличие — одна из многих вещей, которые делают Mongo хорошим инструментом для анализа местоположения, данных социальных сетей и (конечно) текста и HTML.

Стоимость: 150 долларов за экзамен.

Предпосылки: Ничего не требуется, но ребята из Mongo предлагают пройти курс обучения. Хорошая новость заключается в том, что к регистрации на экзамен прилагается бесплатное учебное пособие, поэтому, если у вас нет времени на структурированный учебный курс, вы все равно можете учиться самостоятельно.

Требуемые тесты: один 90-минутный тест с несколькими вариантами ответов для каждого из четырех сертификатов.

Где предлагается (на основе местоположения или онлайн): как лично, так и онлайн.

6. Сертификация Oracle Business Intelligence Foundation Suite 11g Essentials

Что это? Сертификация софтверного гиганта Oracle о том, что вы хорошо разбираетесь в их новейшем программном обеспечении для бизнес-аналитики.

Стоимость: 245 долларов за экзамен

Предварительные требования: не требуются, но Oracle предлагает пройти курс 11g Bootcamp.

Требуемые тесты: Всего один, с мелодичным названием Экзамен номер 1Z0-591. У вас есть два часа, чтобы ответить на 75 вопросов с несколькими вариантами ответов, и вам нужно набрать 63% ответов.

Где предлагается (в зависимости от местоположения или онлайн): лично, в центрах тестирования Pearson VUE.

7. Сертификация больших данных SAS

Что это? Сертификация мегапоставщика программного обеспечения SAS о том, что вы можете работать с их популярным программным обеспечением для бизнес-аналитики. Подготовительные курсы доступны как в классе, так и в смешанном формате (некоторые занятия в классе, некоторые онлайн).

Стоимость: 180 долларов за экзамен. Курс SAS Big Data обойдется вам в 9 000 долларов США за аудиторную / очную версию (экзамен включен) и 4 275 долларов США за дистанционное обучение и оба экзамена.

Предварительные требования: SAS требует, чтобы у вас был «не менее шести месяцев опыта программирования в SAS или другом языке программирования».

Требуемые тесты: для получения сертификата вам необходимо пройти оба следующих теста:

  1. Исследование больших данных, статистика и визуальное исследование
  2. Программирование и загрузка больших данных

Где предлагается (на основе местоположения или онлайн): как лично, так и онлайн.

Вам нужна сертификация для работы с большими данными?

Приготовьтесь почувствовать себя Гарри Трумэном, который просит однорукого экономиста, потому что я собираюсь все усложнить.

Не все специалисты по данным согласны с преимуществами сертификации больших данных. «Сертификат по науке о данных — это хорошее начало, но недостаточно», — говорит Грегори Пятецки-Шапиро, редактор веб-сайта по науке о данных KDNuggets. Помимо сертификации, по словам Пятецки-Шапарио, «вам нужно продемонстрировать навыки и понимание», будь то победа в соревнованиях по науке о данных на таком сайте, как Kaggle, или просто проведя «некоторый интересный анализ самостоятельно».

Пятецкий-Шапиро не одинок в том, что предпочитает практическое ноу-хау официальной сертификации. Говоря о сертификации больших данных SAS, опытный разработчик SAS Патрисия Фликнер говорит, что ее больше интересует, «можете ли вы программировать и думать на ходу». Даже если у вас «стопка сертификатов высотой в милю», говорит она, вас не будут рассматривать, если вы не знаете, как программировать и извлекать нужные данные из нужных мест.

Бо Пэн из Datascope, консалтинговой компании по науке о данных, говорит, что сертификаты по работе с большими данными не являются гарантией того, что вас возьмут на работу. «Я прочитал в нашем последнем раунде приема на работу около 200 резюме со всевозможным опытом и степенями, и я не нашел реальной связи между качеством кандидата и типом сертификации, которую они имели».

По словам Пэна, важнее было то, как кандидаты справились с задачами по науке о данных, поставленными перед ними во время собеседования.

Рэнди Цвитч, главный специалист по данным в Comcast, подтверждает точку зрения Пэна. «Самая важная часть науки о данных, которую мы нанимаем, — это доказанная способность решать проблемы с данными… мы ищем людей, которые разбираются в математике, умеют читать учебники/технические документы и понимают, как работать с различными источниками данных». Сертификация, с другой стороны, поможет только кандидату, «уже работающему аналитиком данных», — говорит он.

Пэн отмечает, что если и существует какая-либо корреляция между сертификацией и шансами кандидата, то она, скорее всего, будет отрицательной. «Многие сертификаты исходят от проприетарного программного обеспечения, где, как только вы получили сертификат, вы привязаны к части мегапрограммного обеспечения, которое стоит консультанту и клиенту больших денег».

Лицензии на ПО для бизнес-аналитики и ПО для работы с большими данными стоят дорого, и эти расходы могут показаться ненужными, когда есть несколько бесплатных вариантов с открытым исходным кодом, таких как языки программирования Python и R. Это имеет еще большее значение, если учесть, насколько R и популярность Python опережая и заменяя таких крупных игроков в науке о данных, как SAS. Наука о данных — это постоянно меняющаяся область, и языки с открытым исходным кодом в настоящее время лидируют.

С другой стороны, некоторые люди утверждают, что сертификация больших данных — это хорошая идея. Они указывают на отсутствие специалистов по данным, например, на прогнозируемую нехватку 1,7 миллиона сотрудников с необходимыми навыками работы с данными. Они утверждают, что сертификаты по работе с большими данными — это полезный способ показать, что вы можете помочь закрыть дыры в науке о данных, которые могут быть у многих организаций.

Хотя сертификация может свидетельствовать о некоторых знаниях в области науки о данных, большинство специалистов по данным согласятся с тем, что сертификация гораздо менее полезна, чем академическая подготовка или практический опыт. Эрван Рузель из Credit Agricole Consumer Finance заявляет, что «быть [] настоящим специалистом по данным невозможно только с помощью сертификата, поскольку для этого требуется как минимум один или два года изучения высшей математики и статистики».

Сертификация не даст таких же глубоких знаний, как программа на уровне колледжа.

Что вы думаете о сертификации больших данных?

Есть ли у вас сертификация по работе с большими данными? Если да, считаете ли вы, что это помогло или помешало? Я хотел бы знать, помогла ли сертификация вашей карьере в области данных.

Если вас больше интересуют большие данные, ознакомьтесь с одним из следующих постов Capterra:

11 конференций по большим данным, которые обязательно нужно посетить аналитикам данных

10 удивительных статистических данных о больших данных

Что такое большие данные и как они могут расширить возможности вашего малого бизнеса?