4 etapas fáceis para se tornar um cientista de dados cidadão

Publicados: 2022-05-07

O que é um cientista de dados cidadão?

Uma pessoa que pode fazer (algum) trabalho em nível de cientista de dados, sem o treinamento de um cientista de dados.

Um trabalhador que pode usar software de inteligência de negócios para fazer clustering, segmentação e combinação avançada de dados, mesmo que não tenha um doutorado em estatística.

Em outras palavras? Um cidadão cientista de dados é o unicórnio amigável de todos os negócios.

Se você deseja uma definição formal, o Gartner define o cientista de dados do cidadão (CDS) como “uma pessoa que cria ou gera modelos que usam análises avançadas de diagnóstico ou recursos preditivos e prescritivos, mas cuja função principal está fora do campo de estatísticas e análises. ”

Em muitos casos, isso “fora do campo de estatísticas e análises” significa que o CDS é um analista de negócios – um analista de negócios que aprendeu a fazer esses modelos de alto nível a partir de uma mistura de iniciativa (se eu puder descobrir a variável x, pode aumentar nossa receita) e necessidade (nossos cientistas de dados são tão sobrecarregados quanto um professor sem um período de planejamento).

À medida que os cientistas de dados são cada vez mais sobrecarregados com solicitações para tornar uma empresa mais orientada por dados, os cientistas de dados cidadãos podem ajudar seus negócios de duas maneiras principais:

  • eles podem aliviar a carga de cientistas de dados usando o software de inteligência de negócios certo para realizar as tarefas mais simples de ciência de dados.
  • Eles podem trazer uma perspectiva externa do lado comercial para a ciência de dados.

Felizmente, tornar-se um cidadão cientista de dados não requer um diploma, nem mesmo um ano inteiro de treinamento. Requer trabalho, mas os benefícios fazem o trabalho valer a pena. Se você estiver interessado em se tornar um cientista de dados cidadão, aqui estão quatro etapas que podem ajudá-lo nesse caminho.

1. Peça acesso a mais e novas fontes de dados.

Se você está cansado de lidar com os mesmos dados antigos dos mesmos relatórios antigos, você tem a coceira do cientista de dados do cidadão e talvez seja hora de pedir ao seu supervisor acesso a dados que não estão incluídos em seus relatórios normais e informação.

Ao abrir o acesso aos dados para não cientistas de dados, você pode ver a força e os benefícios que derivam da ciência de dados do cidadão. Ao expandir os dados para um grupo único de cientistas de dados cidadãos, a IBM transformou o torneio de Wimbledon de 2016 em uma biblioteca de informações. A gigante da computação capacitou os profissionais de tênis a usar seu programa de análise de dados, o Watson Analytics. O resultado foi uma visão sem precedentes sobre o desempenho dos jogadores. O Watson Analytics foi capaz de usar pontos de dados tão pequenos quanto onde a bola caiu para determinar se o estilo de um jogador mudou.

Expandir o acesso a pessoas sem diplomas de ciência de dados também foi surpreendentemente fácil – mais fácil, na verdade, treinar atletas profissionais para usar software de ciência de dados do que treinar cientistas de dados para entender as complexidades do tênis de nível profissional. Melhor ainda, significou que um grupo de pessoas com conhecimento de nível especializado foi capaz de contribuir para o campo inacessível da ciência de dados.

2. Aprenda a usar o software de inteligência de negócios com recursos avançados de análise e descoberta inteligente de dados.

Depois de obter as novas fontes de dados para novos insights, você precisará saber como usar as ferramentas que tornam a ciência de dados de alto nível uma possibilidade para alguém sem doutorado em ciência de dados ou estatística.

Que tipo de recursos você deve procurar em um software que possa capacitá-lo como um cientista de dados cidadão?

  • Preparação avançada de dados de autoatendimento
  • Análise comportamental
  • Análise de gráficos
  • Análise de localização
  • Análise da web
  • Descoberta de dados inteligente

A preparação avançada de dados de autoatendimento já ajudou a Sears a transformar seus analistas de inteligência de negócios em cientistas de dados cidadãos. A Sears investiu na solução de software de descoberta de big data da Platfora, concedendo acesso a 400 de seus analistas. Como resultado, os analistas puderam usar a segmentação de clientes – normalmente uma ação avançada de ciência de dados – para melhorar as recomendações de produtos para clientes no site da Sears.

O fornecedor de inteligência de negócios Alteryx oferece uma ferramenta visual fácil de usar para combinar dados complexos. Em vez de ter que criar um novo conjunto de dados para incorporar diferentes tipos de dados (digamos, um arquivo Excel e um arquivo Oracle), você pode usar a função de arrastar e soltar do Alteryx para reduzir essa longa tarefa de ciência de dados em alguns cliques de um rato.

Assim como o Platfora e o Alteryx, o software da Paxata torna a análise avançada de dados uma realidade. Falei com Farnaz Erfan, da Paxata, que descreveu como um de seus clientes, uma empresa de bens de consumo embalados, trouxe atividades de doutorado para analistas.

A Paxata criou “um paradigma de autoatendimento completo para os analistas”, que não exigia a ajuda de cientistas de dados. A empresa utilizou a solução de autoatendimento para melhorar o estoque, o fornecimento e a comercialização. Por exemplo, o uso do Paxata “reduziu o tempo que os analistas de negócios levam para preparar os dados de tempo de trânsito de cinco horas por mês para menos de uma hora”. Outra fonte de economia tem sido a capacidade de “detectar fraudes de cupons identificando e combinando endereços de e-mail ofensivos”.

Embora aprender a usar análises avançadas ofereça muitos benefícios, também haverá uma curva de aprendizado. Dito isto, não é muito esmagador: de acordo com a estimativa do Gartner, deve levar apenas uma a duas semanas para acelerar. A maioria dos fornecedores oferece treinamento, tutoriais e fóruns da comunidade com respostas para perguntas comuns.

3. Certifique-se de que a governança esteja configurada

Problemas de acesso Mo', mo' (governança de dados). Ou esse pode ser o caso, a menos que você faça da governança uma prioridade. Com mais cidadãos cientistas de dados acessando mais conjuntos de dados, há mais oportunidades para que os dados caiam nas mãos erradas.

“A governança de dados é absolutamente fundamental”, explica Werner Krebs, CEO da empresa de consultoria em ciência de dados Acculation. “Você precisa treinar seus funcionários para entender que os dados são valiosos e ajudar a fornecer ferramentas e estruturas para ajudá-los a coletá-los”, continua ele. Felizmente, existem várias estruturas para organizar esses dados, desde o Gerenciamento da Qualidade Total até a ISO 9001 e “as várias estruturas seis sigma”.

O Gartner dá ênfase semelhante à governança de dados: “A governança adequada é crucial, assim como a orientação sobre como entender os dados, seus relacionamentos e usos apropriados”.

Há muito valor em permitir que mais pessoas acessem mais dados, mas essas pessoas precisam entender como acessá-los e como mantê-los seguros (não leia documentos confidenciais em uma área com Wi-Fi público não seguro, por exemplo ).

4. Certifique-se de que sua organização tenha “guardiões” supervisionando como você usa seus dados

Uma nova função como cientista de dados cidadão requer novas regras e funções para gerenciá-la. Os benefícios que você pode obter com a preparação avançada de dados definitivamente valem a pena ser repensados ​​e reorganizados em toda a empresa. Dito isso, você não quer se livrar das antigas funções de gerenciamento de dados.

Uma regra prática para o gerenciamento de dados na era do cientista de dados cidadão é resumida pela velha canção das escoteiras: faça novos amigos, mas mantenha os antigos. Em outras palavras, mantenha funções como administrador de dados e administrador de banco de dados, mas também adicione novas funções, como a ideia de guardião do Gartner, para garantir que os cientistas de dados cidadãos possam usar o que precisam com responsabilidade.

O Gartner define o papel de “guardião” como pessoas que “garantem que os dados possam ser industrializados, seguros e escaláveis”. Em outras palavras, são pessoas que supervisionam a segurança dos dados e também garantem que instâncias bem-sucedidas de ciência de dados cidadã possam ser adotadas por toda a empresa. Eles também preenchem a lacuna entre as funções tradicionais de gerenciamento de dados (o Gartner os chama de “operadores”) e os cientistas de dados cidadãos que usam dados de novas maneiras (“inovadores”).

Como você usou a ciência de dados do cidadão?

Você desempenha o papel de um cientista de dados cidadão? Você já usou a análise avançada de dados para ajudar sua empresa a economizar dinheiro ou ganhar dinheiro? Se sim, deixe-me saber nos comentários abaixo!