Qu'est-ce que l'apprentissage automatique ? Votre glossaire essentiel de Business Intelligence
Publié: 2022-05-07J'ai toujours considéré le nettoyage de printemps comme trop peu, trop tard. Pour moi, janvier est le moment où vous commandez, établissez des priorités et commencez à répondre aux questions de l'année à venir. C'est pourquoi j'ai choisi janvier pour répondre à une question que vous vous posez peut-être depuis un moment : qu'est-ce que l'apprentissage automatique ?
Je vais y répondre et définir également d'autres termes que vous devrez connaître pour rester au top de 2017. Si vous êtes intéressé par ce que le logiciel de business intelligence peut faire pour vous, vous devez d'abord connaître ces termes de base. .
J'ai mis l'apprentissage automatique en premier, car c'est l'une des dix principales tendances technologiques stratégiques de Gartner pour 2017 , mais le reste des entrées est classé par ordre alphabétique.
Apprentissage automatique
Avant l'apprentissage automatique, il fallait dire (programmer) aux ordinateurs comment penser. Avec l'apprentissage automatique, les ordinateurs peuvent penser (en quelque sorte) par eux-mêmes.
J'ai récemment parlé avec Michael Finley, responsable de l'apprentissage automatique chez la société de logiciels BI AnswerRocket , qui a aidé à élaborer. Avant l'apprentissage automatique, la plupart des logiciels "fonctionnaient comme ils étaient programmés : les gens transformaient les instructions en code informatique, et l'ordinateur faisait ce que ce code lui disait de faire". Un exemple très simple serait une calculatrice : vous avez fourni les nombres de la calculatrice, lui avez dit quoi faire (additionner, soustraire) et la calculatrice vous a donné des résultats. Avec l'apprentissage automatique, cependant, le logiciel peut s'adapter. Finley poursuit : "Un logiciel avec apprentissage automatique ne fait pas la même chose le jour où vous l'installez que le dixième ou le centième jour où vous l'exécutez." Si les valeurs introduites dans l'ordinateur changent, le logiciel s'adaptera à ces valeurs. Un ordinateur avec machine learning apprend à les intégrer.
Finley caractérise l'apprentissage automatique comme un logiciel qui sait comment gérer le concept de "j'aime", comme dans "Je veux entendre une chanson comme la dernière que je viens d'entendre". Le concept est simple pour les gens, mais difficile pour les ordinateurs. Finley a expliqué que les ordinateurs sont bons pour comprendre quels nombres sont plus grands ou plus petits, et pour faire correspondre les nombres et les noms, mais ils ont du mal avec l'idée de similitude. L'apprentissage automatique aide les ordinateurs à comprendre pourquoi une chose « ressemble » à une autre. La compréhension de la similarité par l'apprentissage automatique est particulièrement utile pour prédire les désirs des clients.
L'apprentissage automatique est à l'origine de la prochaine chanson que vous entendez sur Pandora ou du film suggéré par Netflix. Les algorithmes d'apprentissage automatique de Pandora et de Netflix sont «alimentés» de vos choix (et de véritables «j'aime», dans le cas de Pandora), et les utilisent pour prédire quelles chansons ou émissions similaires vous pourriez apprécier.
Alimentez ces algorithmes d'apprentissage automatique avec des données différentes, et ils réagiront différemment. Si votre régime habituel de films d'horreur inclut soudainement et inexplicablement une comédie romantique, les algorithmes ML de Netflix réagiront à ces données et commenceront à suggérer d'autres comédies romantiques ou romans d'horreur.
Mis à part le déclin du goût pour les films, pourquoi l'apprentissage automatique est-il important pour les PME ? Cela peut les aider à rivaliser avec des concurrents plus importants. Les logiciels de BI avec apprentissage automatique enregistrent de nouveaux chiffres à chaque actualisation. Vous ne basez pas votre stratégie sur les chiffres d'un rapport annuel, vous la basez sur des informations presque en temps réel et sur des algorithmes qui savent s'adapter à ces données changeantes. Finley explique que la manière traditionnelle et homogène d'une entreprise de faire évoluer tout ce qu'elle fait peut être révolutionnée avec le ML :
"J'ai peut-être défini les meilleures pratiques et je souhaite répéter les processus. Mais que se passerait-il si vous pouviez exposer chaque jour les meilleures pratiques, si vous disposiez d'informations pour les modifier et reformuler votre stratégie chaque jour ? Vous avez des données grâce au ML qui peuvent réécrire la stratégie tous les jours, et c'est ainsi que les PME mangent vraiment le déjeuner des plus gros.
Pour les PME intéressées par une stratégie commerciale agile, l'apprentissage automatique peut être plus qu'un moyen de rester en vie. Cela pourrait être un moyen de commencer à prendre des parts de marché aux acteurs établis.
- Analyse ad hoc
- Requête ad hoc
- Analytique avancée
- Intelligence artificielle
- Big Data
- Données contextuelles
- Point de données
- Qualité des données
- Visualisation de données
- Entrepôt de données
- Base de données
- Tableaux de bord
- Explorer vers le bas
- ETL
- Métadonnées
- Métrique
- BI moderne
- BI traditionnelle
- Logiciel SaaS/Cloud
- Émincer
- SQL
- Termes que vous voulez connaître…
Analyse ad hoc
L'analyse ad hoc est une analyse lorsque vous en avez besoin, à un niveau que le non-informaticien, le non-spécialiste peut comprendre.
Si l'intelligence d'affaires accessible semble être une chose évidente à vouloir, elle n'a pas toujours été réalisable. Pendant longtemps, les professionnels de la BI devaient savoir « parler informatique » (c'est-à-dire écrire dans un langage de codage) pour interroger les programmes d'informatique décisionnelle. Vous ne saviez pas coder en SQL, R ou Python ? Demandez à quelqu'un en informatique qui le fait. Puis attendre. Et puis attendez que les programmes d'intelligence d'affaires fonctionnent, puis attendez encore l'analyse.
Heureusement, la BI a finalement mûri pour devenir une analyse ad hoc. : Avec ce système, vous n'avez pas besoin d'attendre le service informatique ou le rythme plus lent de production de rapports traditionnels pour obtenir les données nécessaires. Cela rend votre travail, et le leur, plus facile et moins stressant.
Si vous n'avez pas de personnel informatique, l'analyse ad hoc résout ce problème. L'analyse ad hoc crée également un délai d'obtention des informations plus rapide (c'est un autre mot à la mode que vous pouvez voir ; cela signifie qu'il faut moins de temps pour obtenir les informations dont vous avez besoin).
Requête ad hoc
Les « requêtes » sont des questions auxquelles vous pouvez demander à votre logiciel de Business Intelligence de répondre. Par exemple, vous pourriez demander à votre logiciel de BI une liste alphabétique de tous les clients aux yeux bruns nés depuis 1970. Vous pourriez tout aussi bien appeler une requête une question, mais à quelle fréquence dites-vous « requête » dans une conversation ?
Une requête ad hoc est une requête que vous pouvez demander lorsque vous en avez besoin. Comme pour les analyses d'entreprise plus anciennes, les requêtes plus anciennes nécessitaient que quelqu'un du service informatique les pose. Les requêtes avaient également tendance à avoir lieu dans le cadre de rapports réguliers que vous receviez sur une base mensuelle ou annuelle. Avec les anciens logiciels de BI, vous deviez poser cette requête dans un langage de programmation. SQL était un standard de longue date en intelligence d'affaires ; ces jours-ci, R et Python sont populaires.
Vous pouvez considérer les programmes informatiques, BI inclus, comme des branches d'une bureaucratie, du DOJ au HHS. Ils sont techniquement là pour accomplir des choses, mais chacun a son propre langage et fonctionne à sa manière. Un programmeur est comme un bureaucrate qui parle la langue et sait comment naviguer dans chaque programme/département.
Analytique avancée
Ce terme va en fait au-delà de l'intelligence d'affaires. « L'intelligence d'affaires » a traditionnellement traité de l'analyse de ce qui s'est passé. L'analytique avancée va plus loin, qu'il s'agisse de prévoir ce qui se passera dans le futur ou d'analyser des détails et des facteurs généralement non associés à l'informatique décisionnelle. Quelques exemples d'analyses avancées sont l'exploration de données et de texte , l'analyse prédictive , la prévision , l'analyse de localisation , l'analyse des sentiments et l'apprentissage automatique.
Intelligence artificielle
L'apprentissage automatique est une partie de l'IA, mais l'IA est un concept beaucoup plus vaste. L'IA comprend tout ce que vous pourriez appeler " l'intelligence présentée par les machines ". « L'intelligence », au sens de l'IA, signifie la capacité de faire quelque chose. Ainsi, la compréhension commune de « l'intelligence » comme le simple fait de savoir beaucoup n'est pas le type d'intelligence que l'on trouve dans l'IA.
Les «quelques choses» que l'IA peut faire sont déjà variées. Par exemple, Daisy Intelligence utilise l'IA pour examiner les données des détaillants, puis faire des recommandations qui, selon eux, peuvent "augmenter les ventes de 5 % ou plus". Si, comme moi, vous aimez planifier autant que d'attendre au DMV, un assistant virtuel comme Amy , qui peut planifier des réunions en fonction des préférences des participants, pourrait être votre meilleur nouvel ami imaginaire.
Big Data
Les mégadonnées sont des ensembles de données extrêmement volumineux. Bien que je sois normalement d'accord avec Stephen King sur le fait que " la route de l'enfer est pavée d'adverbes ", "extrêmement" est justifié. Une petite quantité de données serait, disons, un petit livre. Un PDF du premier livre de Harry Potter est d'environ un mégaoctet (Mo).
Le Big Data serait quelque chose comme un pétaoctet de données. Pour continuer l'exemple du livre, tout ce qui est écrit, depuis le début de l'histoire enregistrée, est de 50 pétaoctets . Les méga-entreprises, comme Google, sont du genre à gérer des pétaoctets. Le système Mesa de Google , qui surveille le trafic publicitaire de Google, suit des pétaoctets de données.
Données contextuelles
Les données contextuelles sont des données supplémentaires sur une personne, un lieu ou un événement (appelées « entités » en langage de données). Les données contextuelles aident à compléter ce qu'une entreprise sait d'un client potentiel et même à prédire ce qu'il pourrait vouloir.
Bien qu'il ne s'agisse pas d'une entreprise, l'Université de Manchester en Angleterre utilise des données contextuelles dans son processus d'admission pour " construire une vue complète et complète de votre réussite et de votre potentiel ". En plus du formulaire d'admission de l'étudiant, UM prend en compte des facteurs tels que le code postal du candidat, la qualité de l'école où vous avez passé vos examens et « si vous avez été pris en charge ou pris en charge pendant plus de trois mois».
Pour une entreprise, les données contextuelles peuvent aider les ventes. Pour un exemple très large, des données contextuelles sur un ancien client, basées sur la météo de son emplacement, pourraient générer des revenus. Un client de Tuscon, en Arizona, est plus susceptible d'acheter des sucettes glacées en octobre qu'un client d' International Falls, au Minnesota .
Point de données
Un point de données est un morceau de données unique. Un point de données est une unité autonome, ou donnée, parmi les données que vous suivez. Un seul point de données peut être n'importe quoi, de " la taille d'un investissement " à un simple clic sur une annonce que vous avez achetée sur Google. Dans le cas d'Uber, l'emplacement est un point de données important, si important qu'il le suit une fois votre trajet terminé .
Si vous connaissez les indicateurs de performance clés , vous connaissez les points de données. Les KPI mesurent certains types de points de données, comme les revenus ou le temps nécessaire pour terminer un projet.
Qualité des données
La qualité des données est la mesure de l'utilité de vos données. Les données de haute qualité sont propres, organisées et disponibles. Si les données d'une bibliothèque sont ses livres, une bibliothèque avec des données de haute qualité aurait des livres que la population veut et dont elle a besoin, en bon état, rangés aux bons endroits.
Il existe six dimensions de la qualité des données :
- Complétude
- Unicité
- Validité
- Opportunité
- Cohérence
- Précision
Visualisation de données
Une visualisation de données est une image, un visuel ou un graphique qui affiche vos données. Les graphiques à secteurs et les graphiques à barres seraient les types les plus courants. Il existe cependant une gamme beaucoup plus large de visualisations. Les critères d'évaluation de Gartner pour les plates-formes de Business Intelligence et d'analyse pour 2016 (protégés par un mur payant ; cela en vaut la peine) classent les types de graphiques plus avancés comme des éléments "préférés" à rechercher dans votre solution de BI. Certains de ces types de graphiques préférés de qualité supérieure à rechercher sont :
- Cartes Marimekko
- Graphiques X/Y
- Cartes réseau
- Diagrammes de Pareto
- Nuages de mots
Entrepôt de données
Un entrepôt de données est le système informatique où les données de diverses bases de données et systèmes transactionnels sont conservées et organisées. Vous verrez souvent le terme avec une « entreprise » sur le devant, car vous aurez besoin d'une grande quantité de données à l'échelle de l'entreprise pour avoir besoin d'un entrepôt de données.
Base de données
Une base de données est constituée de données organisées de manière à ce que vous puissiez obtenir facilement ce dont vous avez besoin. Avez-vous déjà été sur IMDB ? Bien sûr que vous avez. C'est une base de données : films, acteurs, réalisateurs, producteurs, tous organisés pour faciliter la recherche, comme lorsqu'il faut tricher dans un jeu à six degrés de Kevin Bacon .
Tableaux de bord
Cette photo est avant cette explication car il est plus facile de montrer à quoi ressemble un tableau de bord.
Pour une définition formelle : un tableau de bord est une représentation visuelle des données que vous suivez. Votre programme BI doit absolument disposer d'un tableau de bord. Vous n'achèteriez pas une voiture sans tableau de bord. Il en va de même pour les logiciels de BI.
Lorsque vous magasinez pour un logiciel de BI, assurez-vous que les tableaux de bord de votre programme présentent ces deux critères de base recommandés par Gartner (paywall protégé ; ça vaut le coup) :
- "La possibilité de concevoir des tableaux de bord avec, au minimum, des types de graphiques de base, notamment des tableaux, des graphiques à barres, des graphiques linéaires, des graphiques en aires et des graphiques à secteurs sans nécessiter d'options, de codage ou de script tiers."
- "Ce que vous voyez est ce que vous obtenez (WYSIWYG) design", la possibilité de concevoir un tableau de bord et d'analyser des données sans savoir coder.
Explorer
L'exploration en profondeur fait référence à la possibilité de prendre une information générale, comme les chiffres de vente annuels, et d'explorer par mois, par semaine ou même par jour. «Drill down» signifie que vous pouvez vous limiter du général aux détails qui font souvent la différence entre l'information et la perspicacité. Drill down est un peu comme la version d'intelligence d'affaires de ce vieux film "pouvoirs de dix".
ETL
L'ETL (ou extraire, transformer, charger) a lieu entre la collecte des données et le placement de ces données dans l'entrepôt de données.
Le besoin « d'extraire » vient du fait que les données sont collectées dans des bases de données ou des logiciels ERP avant d'arriver à l'entrepôt de données. Le besoin de transformation vient du fait que ces multiples sources de données sont souvent dans des formats différents et doivent être transformées dans le format approprié pour être stockées et recherchées dans l'entrepôt de données. La nécessité de charger est explicite ; vous devez le placer dans l'entrepôt de données avant de pouvoir rechercher et comparer une source de données par rapport à une autre.
Métadonnées
Les métadonnées sont des données sur les données. Si ça sonne, méta, c'est… c'est des méta- données !
Mais sérieusement.
Les métadonnées sont des informations sur vos données. Il existe trois catégories :
- Technique : les détails techniques de vos données, comme ses modèles, son format et ses mesures.
- Entreprise : descriptions des données dans des termes conviviaux (c.-à-d. en langage courant)
- Processus : données qui vous indiquent ce qui a été fait avec quels éléments de données et quand.
Métrique
"Métrique" est juste un mot fantaisiste pour tout ce que vous mesurez.
Suivez-vous vos bénéfices nets ? C'est une métrique. Garder un œil sur le nombre de personnes qui utilisent le logiciel BI dans votre entreprise ? C'est aussi une métrique. Garder un œil sur ce taux de conversation ? C'est aussi une métrique. L'astuce avec les métriques est de choisir celles qui conviennent le mieux à votre entreprise. Chaque entreprise a des besoins différents, et c'est une bonne idée de tenir compte de vos besoins et de vos priorités lors de la sélection des métriques .
BI moderne
Le terme intelligence économique moderne vient de Gartner , qui le définit ainsi :
Une plate-forme de BI moderne prend en charge le développement de contenu analytique basé sur l'informatique. Il est défini par une architecture autonome qui permet aux utilisateurs non techniques d'exécuter de manière autonome des flux de travail analytiques complets, de l'accès aux données, de l'ingestion et de la préparation à l'analyse interactive et au partage collaboratif des informations.
En termes simples, la BI moderne donne la priorité à l'utilisateur professionnel. Vous n'aurez pas besoin de dépendre de quelqu'un du service informatique, ou vous en aurez besoin beaucoup moins, pour utiliser un programme de BI moderne. Alors que les anciens programmes de BI traditionnels étaient configurés pour permettre uniquement aux informaticiens de créer du contenu, par exemple, les programmes de BI modernes permettent aux utilisateurs professionnels de créer facilement du contenu par eux-mêmes.
BI traditionnelle
Les programmes traditionnels d'informatique décisionnelle s'appuient fortement sur le personnel informatique. Ils exigent généralement que les utilisateurs connaissent SQL (un langage de programmation, voir ci-dessous), et il faut beaucoup plus de temps pour obtenir des réponses, car vous devez saisir manuellement plusieurs requêtes dans ce langage. En tant que tels, ils sont beaucoup moins agiles et des experts comme ceux de Gartner suggèrent aux acheteurs de rechercher plutôt le type de fonctionnalités que l'on trouve dans les programmes de BI modernes .
Logiciel SaaS/Cloud
Le logiciel en tant que service est un modèle où les acheteurs achètent des licences pour utiliser le logiciel, plutôt que de l'acheter et de l'installer. La plupart des logiciels SaaS sont exécutés sur Internet (c'est-à-dire dans le cloud), ce qui réduit les coûts initiaux d'achat et d'installation. Il supprime également la nécessité de surveiller les serveurs sur lesquels le logiciel est conservé ; la société SaaS garde une trace de toutes les pannes potentielles.
Émincer
Découper et découper de grands ensembles de données pour examiner les données sous différents angles ou examiner certaines parties plus en détail. Les capacités de tranches et de dés sont ce qui, par exemple, vous permet de vérifier les données par semaine, puis par mois, puis par jour. Au lieu d'attendre un rapport, slice and dice vous permet de prendre l'initiative et de consulter les données spécifiques lorsque vous en avez besoin.
SQL
Prononcé « suite », SQL est un langage de programmation courant utilisé pour obtenir des informations à partir de bases de données. Si vous parlez anglais, la base de données parle SQL et ne saura répondre qu'aux questions formulées de cette façon. À moins, bien sûr, que votre logiciel de business intelligence ne dispose d'une requête en langage naturel (NLQ), qui vous permet de poser des questions de la même manière que vous le feriez avec un moteur de recherche.
Termes que vous voulez connaître…
Ou qui, selon vous, profiterait aux lecteurs de cette liste ? Faites-les moi savoir dans les commentaires ci-dessous. Idéalement, la section des commentaires pourrait devenir un autre endroit où les gens pourraient demander des définitions, et moi pour les fournir.
Si vous souhaitez savoir comment ces termes peuvent mieux vous aider, consultez l'une des options du répertoire des logiciels de Business Intelligence de Capterra et contactez un fournisseur.