O que é aprendizado de máquina? Seu Glossário Essencial de Business Intelligence

Publicados: 2022-05-07

Eu sempre vi a limpeza de primavera como muito pouco, muito tarde. Para mim, janeiro é quando você ordena, prioriza e começa a responder às perguntas do próximo ano. É por isso que escolhi janeiro para responder a uma pergunta que você pode ter há algum tempo: o que é aprendizado de máquina?

Vou responder isso e também definir alguns outros termos que você precisa saber para ficar por dentro de 2017. Se você estiver interessado no que o software de inteligência de negócios pode fazer por você, precisará conhecer esses termos básicos primeiro .

Coloquei o aprendizado de máquina em primeiro lugar, pois é uma das dez principais tendências de tecnologia estratégica do Gartner para 2017 , mas o restante das entradas está organizada em ordem alfabética.

Aprendizado de máquina

Antes do aprendizado de máquina, os computadores precisavam ser informados (programados) como pensar. Com o aprendizado de máquina, os computadores podem pensar (mais ou menos) por si mesmos.

Recentemente, conversei com Michael Finley, chefe de aprendizado de máquina da empresa de software de BI AnswerRocket , que ajudou a elaborar. Antes do aprendizado de máquina, a maioria dos softwares “funcionava da maneira como foi programado: as pessoas transformavam instruções em código de computador, e o computador fazia o que esse código dizia para fazer”. Um exemplo muito simples seria uma calculadora: você alimenta os números da calculadora, diz a ela o que fazer (somar, subtrair) e a calculadora fornece os resultados. Com o aprendizado de máquina, no entanto, o software pode se adaptar. Finley continua: “Software com aprendizado de máquina não faz a mesma coisa no dia em que você o instala e no décimo ou centésimo dia em que você o executa”. Se os valores que estão sendo alimentados no computador forem alterados, o software se adaptará a esses valores. Um computador com aprendizado de máquina aprende a incorporá-los.

Cortesia do incrível Andre Pinto e Anthill Comics

Finley caracteriza o aprendizado de máquina como um software que sabe lidar com o conceito de “curtir”, como em “quero ouvir uma música como a última que acabei de ouvir”. O conceito é fácil para as pessoas, mas é difícil para os computadores. Finley explicou que os computadores são bons em entender quais números são maiores ou menores, e em combinar números e nomes, mas eles lutam com a ideia de similaridade. O aprendizado de máquina ajuda os computadores a entender por que uma coisa é “como” outra. A compreensão de semelhança do aprendizado de máquina é especialmente útil para prever os desejos do cliente.

O aprendizado de máquina está por trás da próxima música que você ouve no Pandora ou do filme sugerido pela Netflix. Os algoritmos de aprendizado de máquina da Pandora e da Netflix são “alimentados” com suas escolhas (e “curtidas” reais, no caso de Pandora) e usam isso para prever quais músicas ou programas semelhantes você pode gostar.

Alimente esses algoritmos de aprendizado de máquina com dados diferentes e eles reagirão de maneira diferente. Se sua dieta habitual de filmes de terror de repente e inexplicavelmente incluir uma comédia romântica, os algoritmos de ML da Netflix reagirão a esses dados e começarão a sugerir outras comédias românticas ou romance de terror.

Deixando de lado o declínio do gosto por filmes, por que o aprendizado de máquina é importante para as pequenas e médias empresas? Pode ajudá-los a competir com concorrentes maiores. O software de BI com aprendizado de máquina recebe novos números toda vez que você atualiza. Você não está baseando a estratégia nos números de um relatório anual, você a está baseando em informações quase em tempo real e algoritmos que sabem como se adaptar a esses dados em mudança. Finley explica que a maneira tradicional e homogênea de uma empresa escalar o que quer que faça pode ser revolucionada com o ML:

“Eu posso ter estabelecido as melhores práticas e querer repetir os processos. Mas e se você pudesse apresentar as melhores práticas todos os dias, se tivesse informações para alterá-las e reformular sua estratégia todos os dias? Você tem dados graças ao ML que podem reescrever a estratégia todos os dias, e é assim que as SMBs estão realmente comendo o almoço dos caras maiores.”

Para o SMB interessado em estratégia de negócios ágil, o aprendizado de máquina pode ser mais do que uma maneira de se manter vivo. Poderia ser uma maneira de começar a tomar parte das quotas de mercado dos players estabelecidos.

  • Análise ad hoc
  • Consulta ad hoc
  • Análise avançada
  • Inteligência artificial
  • Big Data
  • Dados contextuais
  • Ponto de dados
  • Qualidade dos dados
  • Visualização de dados
  • Armazém de dados
  • Base de dados
  • Painéis
  • Detalhamento
  • ETL
  • Metadados
  • Métricas
  • BI moderno
  • BI tradicional
  • Software SaaS/nuvem
  • Fatia e dados
  • SQL
  • Termos que você quer saber...

Análise ad hoc

A análise ad hoc é a análise quando você precisa, em um nível que o não especialista em TI possa entender.

Se a inteligência de negócios acessível parece uma coisa óbvia de se desejar, nem sempre foi alcançável. Por muito tempo, os profissionais de BI tiveram que ser capazes de “falar computador” (ou seja, escrever em uma linguagem de codificação) para consultar programas de inteligência de negócios. Não sabia codificar em SQL, R ou Python? Pergunte a alguém em TI que saiba. Então espere. E então espere que os programas de inteligência de negócios funcionem, e então espere um pouco mais pela análise.

Felizmente, o BI finalmente amadureceu para a análise ad hoc. : Com este sistema, você não precisa esperar a TI, ou o ritmo mais lento da produção de relatórios tradicionais, para obter os dados necessários. Isso torna o seu trabalho, e o deles, mais fácil e menos estressante.

Se você não tem uma equipe de TI, a análise ad hoc resolve esse problema. A análise ad hoc também cria um tempo de percepção mais rápido (essa é outra palavra da moda que você pode ver; significa que leva menos tempo para obter as informações de que você precisa).

Consulta ad hoc

“Consultas” são perguntas que você pode pedir ao seu software de inteligência de negócios para responder. Por exemplo, você pode pedir ao seu software de BI uma lista alfabética de todos os clientes de olhos castanhos nascidos desde 1970. Você poderia facilmente chamar uma consulta de pergunta, mas com que frequência você consegue dizer “consulta” na conversa?

Uma consulta ad hoc é aquela que você pode solicitar quando precisar. Assim como nas análises de negócios mais antigas, as consultas mais antigas precisavam de alguém de TI para perguntar. As consultas também tendiam a ocorrer como parte de relatórios regulares que você obteria mensalmente ou anualmente. Com um software de BI mais antigo, você teria que fazer essa consulta em uma linguagem de programação. SQL era um padrão de longa data em inteligência de negócios; hoje em dia, R e Python são populares.

Você pode olhar para programas de computador, incluindo BI, como ramificações de uma burocracia, do DOJ ao HHS. Eles estão tecnicamente lá para realizar coisas, mas cada um tem sua própria linguagem e funciona de uma maneira particular. Um programador é como um burocrata que fala a língua e sabe como navegar em cada programa/departamento.

Análise avançada

Esse termo realmente vai além da inteligência de negócios. A “inteligência de negócios” tradicionalmente lida com a análise do que aconteceu. A análise avançada vai além, seja prevendo o que acontecerá no futuro ou analisando detalhes e fatores normalmente não associados à inteligência de negócios. Alguns exemplos de análise avançada são mineração de dados e texto , análise preditiva , previsão , análise de localização , análise de sentimento e aprendizado de máquina.

Inteligência artificial

O aprendizado de máquina é uma parte da IA, mas a IA é um conceito muito maior. A IA inclui qualquer coisa que você possa chamar de “ inteligência exibida por máquinas ”. “Inteligência”, no sentido de IA, significa a capacidade de fazer algo. Portanto, o entendimento comum de “inteligência” como apenas saber muito não é o tipo de inteligência encontrado na IA.

As “coisas” que a IA pode fazer já são variadas. Por exemplo, a Daisy Intelligence usa a IA para examinar os dados dos varejistas e, em seguida, fazer recomendações que, segundo eles, podem “aumentar as vendas em 5% ou mais”. Se, como eu, você gosta de agendar tanto quanto esperar no DMV, uma assistente virtual como Amy , que pode agendar reuniões com base nas preferências dos participantes, pode ser seu melhor novo amigo imaginário.

Big Data

Big data são conjuntos de dados extremamente grandes. Embora eu normalmente concorde com Stephen King que “ o caminho para o inferno é pavimentado com advérbios ”, esse “extremamente” é garantido. Uma pequena quantidade de dados seria, digamos, um livro curto. Um PDF do primeiro livro de Harry Potter tem cerca de um megabyte (MB).

Big Data seria algo como um petabyte de dados. Para continuar o exemplo do livro, tudo o que está escrito, desde o início da história registrada, é de 50 petabytes . Mega corporações, como o Google, são do tipo que lidam com petabytes. O sistema Mesa do Google , que monitora o tráfego de anúncios do Google, rastreia petabytes de dados.

Dados contextuais

Dados contextuais são dados adicionais sobre uma pessoa, lugar ou evento (que são chamados de “entidades” em dataspeak). Os dados contextuais ajudam a completar o que uma empresa sabe sobre um cliente em potencial e até mesmo a prever o que eles podem querer.

Embora não seja um negócio, a Universidade de Manchester, na Inglaterra, usa dados contextuais em seu processo de admissão para “ construir uma visão completa e completa de sua conquista e potencial ”. Juntamente com o formulário de admissão do aluno, a UM considera fatores como o código postal do candidato, a qualidade da escola onde fez os exames e “ se foi cuidado ou cuidado por mais de três meses”.

Para uma empresa, os dados contextuais podem ajudar nas vendas. Para um exemplo muito amplo, dados contextuais sobre um cliente anterior, com base no clima de sua localização, podem gerar receita. Um cliente em Tuscon, Arizona, tem mais probabilidade de comprar picolés em outubro do que um em International Falls, Minnesota .

Ponto de dados

Um ponto de dados é um único fragmento de dados. Um ponto de dados é qualquer unidade independente, ou datum, entre os dados que você rastreia. Um único ponto de dados pode ser qualquer coisa, desde “ o tamanho de um investimento ” até um único clique em um anúncio que você comprou no Google. No caso do Uber, a localização é um ponto de dados importante – um ponto tão importante que eles realmente o rastreiam após o término da viagem .

Se você estiver familiarizado com os principais indicadores de desempenho , estará familiarizado com os pontos de dados. Os KPIs medem certos tipos de pontos de dados, como receita ou tempo necessário para concluir um projeto.

Qualidade dos dados

A qualidade dos dados é a medida da utilidade dos seus dados. Dados de alta qualidade são limpos, organizados e disponíveis. Se os dados de uma biblioteca são seus livros, uma biblioteca com dados de alta qualidade teria livros que a população quer e precisa, em boas condições, arquivados nos lugares certos.

Existem seis dimensões de qualidade de dados:

  • Completude
  • Singularidade
  • Validade
  • Pontualidade
  • Consistência
  • Precisão

Visualização de dados

Uma visualização de dados é qualquer imagem, visual ou gráfico que exiba seus dados. Gráficos de pizza e gráficos de barras seriam os tipos mais comuns. Há uma gama muito maior de visualizações por aí, no entanto. Os Critérios de Avaliação do Gartner para Plataformas de Business Intelligence e Analytics para 2016 (protegido por paywall; vale a pena) classifica tipos de gráficos mais avançados como itens “preferidos” a serem procurados em sua solução de BI. Alguns desses tipos de gráficos preferidos e de maior qualidade para procurar são:

  • Cartas Marimekko
  • Gráficos X/Y
  • Gráficos de rede
  • Diagramas de Pareto
  • Nuvens de palavras

Armazém de dados

Um data warehouse é o sistema de computador onde os dados de vários bancos de dados e sistemas transacionais são mantidos e organizados. Muitas vezes, você verá o termo com uma “empresa” na frente, pois precisará de uma grande quantidade de dados de tamanho corporativo para precisar de um data warehouse.

Base de dados

Um banco de dados são dados, organizados para que você possa obter facilmente o que precisa. Já esteve no IMDB ? Claro que você tem. Isso é um banco de dados: filmes, atores, diretores, produtores, tudo organizado para facilitar a busca, como quando você precisa trapacear em um jogo de seis graus de Kevin Bacon .

Painéis

Essa foto está antes desta explicação porque é mais fácil mostrar como é um painel.

Para uma definição formal: um painel é uma representação visual dos dados que você está rastreando. Seu programa de BI absolutamente precisa ter um painel. Você não compraria um carro sem um painel. O mesmo vale para o software de BI.

Ao comprar um software de BI, certifique-se de que os painéis do seu programa tenham esses dois critérios básicos recomendados pelo Gartner (protegido por paywall; vale a pena):

  • “A capacidade de projetar painéis com, no mínimo, tipos básicos de gráficos, incluindo tabelas, gráficos de barras, gráficos de linhas, gráficos de área e gráficos de pizza sem exigir opções de terceiros, codificação ou script.”
  • “O que você vê é o que você obtém (WYSIWYG) design”, a capacidade de projetar um painel e analisar dados sem saber codificar.

Detalhamento

Drill down refere-se à capacidade de obter uma informação geral, como números de vendas anuais, e detalhar por mês, semana ou mesmo dia. “Drill down” significa que você pode restringir do geral para os detalhes que geralmente fazem a diferença entre informação e insight. Drill down é uma espécie de versão de business intelligence daquele velho filme de “potências de dez”.

ETL

ETL — ou extrair, transformar, carregar — ocorre entre a coleta de dados e a colocação desses dados no data warehouse.

A necessidade de “extrair” vem do fato de que os dados são coletados em bancos de dados ou softwares ERP antes de chegarem ao data warehouse. A necessidade de transformação vem do fato de que essas múltiplas fontes de dados geralmente estão em formatos diferentes e precisam ser transformadas no formato adequado para serem armazenadas e pesquisadas no data warehouse. A necessidade de carregamento é autoexplicativa; você precisa colocá-lo no data warehouse antes de pesquisar e comparar uma fonte de dados com outra.

Metadados

Metadados são dados sobre dados. Se isso soa, meta, é... são metadados !

Mas seriamente.

Metadados são informações sobre seus dados. Existem três categorias:

  • Técnico: os detalhes técnicos sobre seus dados, como seus modelos, formato e medidas.
  • Negócios: descrições dos dados em termos fáceis de usar (ou seja, inglês simples)
  • Processo: dados que informam o que foi feito com quais dados e quando.

Métricas

“Métrica” é apenas uma palavra chique para qualquer coisa que você esteja medindo.

Você está acompanhando seus lucros líquidos? Isso é uma métrica. De olho em quantas pessoas estão usando o software de BI na sua empresa? Isso também é uma métrica. De olho nessa taxa de conversa? Isso também é uma métrica. O truque com as métricas é escolher aquelas que são melhores para sua empresa. Cada empresa tem necessidades diferentes e é uma boa ideia considerar suas necessidades e prioridades ao escolher as métricas .

BI moderno

O termo business intelligence moderno vem do Gartner , que o define assim :

Uma plataforma de BI moderna oferece suporte ao desenvolvimento de conteúdo analítico habilitado para TI. Ele é definido por uma arquitetura independente que permite que usuários não técnicos executem de forma autônoma fluxos de trabalho analíticos de espectro completo, desde o acesso, ingestão e preparação de dados até a análise interativa e o compartilhamento colaborativo de insights.

Simplificando, o BI moderno coloca o usuário de negócios em primeiro lugar. Você não precisará depender de alguém de TI, ou precisará depender muito menos deles, para usar um programa de BI moderno. Onde os programas de BI tradicionais e mais antigos foram configurados para permitir apenas que o pessoal de TI crie conteúdo, por exemplo, os programas de BI modernos facilitam a criação de conteúdo por conta própria.

BI tradicional

Os programas tradicionais de business intelligence dependem muito do pessoal de TI. Eles geralmente exigem que os usuários conheçam SQL (uma linguagem de programação, veja abaixo), e leva muito mais tempo para obter respostas, pois você precisa inserir manualmente várias consultas nessa linguagem. Como tal, eles são muito menos ágeis, e especialistas como os do Gartner sugerem que os compradores procurem o tipo de recursos encontrados em programas modernos de BI .

Software SaaS/nuvem

O software como serviço é um modelo em que os compradores compram licenças para usar o software, em vez de comprá-lo e instalá-lo. A maioria dos softwares SaaS é feita pela internet (ou seja, na nuvem), o que reduz os custos iniciais de compra e instalação. Também dispensa o monitoramento dos servidores onde os softwares são mantidos; a empresa SaaS mantém o controle de possíveis interrupções.

Fatia e dados

Fatiar e dividir grandes conjuntos de dados para examinar os dados de diferentes perspectivas ou examinar certas partes com mais detalhes. Os recursos Slice and dice são o que, por exemplo, permitem que você verifique os dados por semana, depois por mês e por dia individual. Em vez de esperar por um relatório, slice and dice permite que você tome a iniciativa e verifique os dados específicos quando precisar.

SQL

Pronunciado “sequel”, SQL é uma linguagem de programação comum usada para obter informações de bancos de dados. Se você fala inglês, o banco de dados fala SQL e só saberá responder a perguntas formuladas dessa maneira. A menos, é claro, que seu software de inteligência de negócios tenha consulta de linguagem natural (NLQ), que permite fazer perguntas da mesma forma que faria em um mecanismo de pesquisa.

Termos que você quer saber...

Ou que você acha que beneficiaria os leitores desta lista? Deixe-me conhecê-los nos comentários abaixo. Idealmente, a seção de comentários poderia se tornar outro lugar para as pessoas solicitarem definições e eu para fornecê-las.

Se você quiser saber como esses termos podem ajudá-lo melhor, confira uma das opções no diretório de software de inteligência de negócios do Capterra e entre em contato com um fornecedor.