Comment ajouter des solutions d'apprentissage automatique à votre entreprise à l'aide d'AWS
Publié: 2020-05-13L'apprentissage automatique évolue constamment et joue un rôle énorme dans l'économie mondiale, car il permet une analyse rapide et automatique de grandes portions de données.
Afin de rapprocher encore plus la technologie d'apprentissage automatique des programmeurs, Amazon propose actuellement plus de 10 services d'apprentissage automatique et d'intelligence artificielle sur sa plateforme AWS. Avec ces services, vous pouvez commencer à créer des modèles de manière simple, ce qui peut faire passer votre entreprise au niveau supérieur.
La plupart de ces services sont entièrement gérés, ce qui signifie que pour les utiliser, vous n'avez besoin d'aucune expérience en apprentissage automatique, car ces outils exploitent des modèles pré-formés pour travailler avec des données. En fonction de votre problème métier, vous pouvez choisir parmi des services ML pré-formés dans des domaines tels que la vision par ordinateur, le traitement du langage naturel, les recommandations et les prévisions. Le graphique ci-dessous montre un workflow de solution Machine Learning, ainsi que les outils AWS que vous pouvez utiliser à chacune des étapes.

Comment appliquer le machine learning aux affaires avec AWS
Premièrement : Collecter les données
L'élément le plus important dans la création de solutions ML est la donnée. Il existe 3 types de données : structurées, semi-structurées et non structurées.
- Les éléments des données structurées sont adressables et peuvent être stockés dans une base de données relationnelle. Ce type de données a un schéma prédéfini. Un exemple de données structurées est une base de données relationnelle avec des données numériques et de chaîne (texte).
- Les ensembles de données semi-structurés ne résident pas dans des bases de données relationnelles, mais ils ont néanmoins des éléments prédéfinis (schéma) qui les rendent plus faciles à analyser. XML, HTML, RDF ou JSON sont des exemples de types de fichiers de données semi-structurés.
- Les données non structurées sont tout le reste. Ce type de données n'a pas de structure prédéfinie et est généralement stocké sous la forme d'un ensemble de fichiers. Les exemples de données non structurées les plus populaires sont les documents texte, les photos, les fichiers vidéo et audio et les journaux d'application.
Chargement de données - Qu'est-ce que Kinesis ?
Le service AWS Kinesis ingère des données qui peuvent être générées en continu à partir de diverses sources, par exemple des applications Web et mobiles. Il s'agit d'un service de streaming de données en temps réel qui peut capturer très rapidement des gigaoctets de données. Kinesis propose les outils suivants :
- Kinesis Video Streaming – un outil qui peut vous aider à diffuser des vidéos depuis des appareils vers AWS
- Kinesis Data Streaming – un outil qui peut vous aider à collecter des données telles que les journaux informatiques, les clics sur le site Web ou les transactions financières
- Kinesis Data Firehose - un outil pour charger des données diffusées en continu dans des magasins de données (par exemple S3, Redshift) ou des outils d'analyse
- Kinesis Data Analytics - un outil qui traite les données diffusées en temps réel avec SQL ou Java
Chargement de données - qu'est-ce que Glue ?
Un autre service AWS qui peut aider au chargement des données est Glue qui est géré par Apache Spark . Il s'agit d'un outil d'extraction, de transformation et de chargement (ETL) qui peut être utilisé pour préparer les données avant qu'elles ne soient utilisées pour l'analyse. Glue peut fonctionner avec des données structurées et semi-structurées.
Les éléments de Glue sont le catalogue de données, le moteur ETL et un planificateur. Le catalogue de données Glue est la partie la plus importante de l'outil. Il enregistre les métadonnées sur les données données, automatiquement découvertes par les robots qui parcourent les sources de données et détectent leur schéma.
Les moteurs ETL peuvent générer du code Python et Scala à utiliser dans le processus ETL pour les utilisateurs non programmeurs. Il peut également traiter des données avec un code fourni par l'utilisateur. Le planificateur peut surveiller les travaux, exécuter des tâches et les déclencher en fonction de certains événements (par exemple, à une heure précise chaque lundi, ou lorsqu'une autre tâche se termine ou échoue).
Deuxièmement : Choisir les bons outils d'apprentissage automatique
Une fois que nous avons collecté les données dont nous avons besoin, nous pouvons commencer à créer nos solutions ML. AWS propose quelques outils d'apprentissage automatique capables de traiter des données de différents types.
Passons maintenant en revue chacun de ces outils, et présentons leurs principaux domaines d'application possibles en entreprise .
Qu'est-ce que Sage Maker ?
SageMaker est particulièrement utile pour les développeurs d'apprentissage automatique et les scientifiques des données. Ce service est une solution complète qui aide à faire passer les modèles d'apprentissage automatique du concept à la production avec un minimum d'effort. Amazon SageMaker dispose d'un riche ensemble d'outils (Ground Truth, Notebooks, Experiments, Debugger, Model Monitor, Neo) qui peuvent aider à étiqueter les données, créer, optimiser, former, tester et déployer des modèles.
Trouver manuellement le bon algorithme pour un problème donné nécessite souvent des heures de formation et de test. SageMaker dispose d'une option AutoPilot, qui utilise 50 modèles ML pré-formés différents pour trouver automatiquement le meilleur modèle ML pour le cas en question. Les développeurs peuvent utiliser cette solution pour trouver rapidement un modèle de référence.
Qu'est-ce que Personnaliser ?
Personalize est un service d'apprentissage automatique qui aide à créer des systèmes de recommandation. Personalize peut traiter les flux d'activité des applications, par exemple les clics, les pages vues, les achats, et les utiliser pour créer des recommandations personnalisées. Vous pouvez également utiliser des informations supplémentaires sur vos utilisateurs, telles que l'âge ou l'emplacement géographique. L'affichage des résultats de recommandation dans votre application peut être simplifié avec de courts appels d'API. La technologie d'apprentissage automatique dans Personalize a été améliorée pendant des années d'utilisation par Amazon.com.

Qu'est-ce que Comprendre ?
Comprehend est un service de traitement du langage naturel (NLP) qui utilise l'apprentissage automatique pour extraire des informations précieuses à partir de données textuelles non structurées. Ce service applique l'analyse des sentiments, l'extraction d'une partie du discours et la tokenisation pour détecter les principales caractéristiques du texte. Comprendre peut être utile pour comprendre à quel point un texte donné est positif ou négatif.
Comprehend dispose d'un outil supplémentaire : Amazon Comprehend Medical, spécifiquement pour l'industrie médicale. Amazon Comprehend Medical peut analyser la documentation médicale (comme les dossiers médicaux des patients, les notes cliniques) et extraire des informations sur les médicaments, les doses et les fréquences. Comprehend est un service entièrement géré.
Qu'est-ce que la prévision ?
Forecast utilise l'apprentissage automatique pour créer des modèles de prédiction de séries chronologiques. Il peut combiner des données de séries chronologiques historiques avec des variables supplémentaires (qui, selon vous, peuvent avoir un impact sur les prévisions) pour créer des modèles prédictifs. Cette solution Amazon s'applique à la prévision de valeurs telles que le cours des actions ou la demande de produits des clients. Forecast est également un service entièrement géré et peut être adapté aux besoins de l'entreprise.
Qu'est-ce que Lex ?
Lex utilise la reconnaissance vocale automatique (ASR) pour convertir la parole en texte et la compréhension du langage naturel (NLU) pour reconnaître l'intention du texte. Cette solution permet à l'utilisateur de construire des bots conversationnels.
Par exemple, vous pouvez utiliser Lex en remplacement du support client manuel qui répondra automatiquement aux questions des clients. Amazon Lex utilise la même technologie d'apprentissage en profondeur qu'Amazon Alexa (l'assistant virtuel d'Amazon).
Qu'est-ce que Polly ?
Polly est un service cloud qui utilise des algorithmes d'apprentissage en profondeur pour convertir du texte en discours réaliste. Il prend actuellement en charge 60 voix masculines et féminines dans 29 langues, dont le japonais, le chinois, le coréen et l'arabe. Polly peut également gérer l'heure, les dates, les unités, les fractions et les abréviations. Cette solution permet à l'utilisateur de créer des applications qui peuvent parler.
Qu'est-ce que le détecteur de fraude ?
Fraud Detector est un service AWS qui peut aider à identifier les activités en ligne frauduleuses, telles que les fraudes de paiement ou les faux comptes. Ce service est entièrement géré afin qu'un modèle de détection de fraude puisse être créé en quelques clics.
Qu'est-ce que le Textract ?
Textract est un service capable de lire automatiquement les données des documents numérisés. Textract peut traiter des millions de pages en quelques heures et peut aider à automatiser les flux de travail de documents. Ce service est utile pour traiter des documents tels que des demandes de prêt ou des documents médicaux.
Qu'est-ce que Traduire ?
Translate est un service d'apprentissage automatique AWS permettant d'effectuer une traduction de texte d'une langue à l'autre. Il utilise des modèles d'apprentissage en profondeur pour fournir une traduction plus précise et plus naturelle, par rapport aux algorithmes statistiques traditionnels. Translate prend en charge 54 langues (y compris par exemple l'afrikaans, le bulgare, l'estonien) et 2 804 paires de langues.
Qu'est-ce que la reconnaissance ?
Rekognition est un service de vision par ordinateur qui peut reconnaître des objets, des personnes et du texte à partir d'images et de films. Rekognition est capable d'identifier et de comparer les visages, de les analyser et d'identifier certaines caractéristiques du visage, comme la bouche, le nez ou les yeux.
Rekognition dispose d'un module pour détecter automatiquement les émotions telles que le bonheur, la tristesse ou la surprise dans les images faciales. Il peut également effectuer une vérification du visage de l'utilisateur, qui confirmera l'identité de l'utilisateur en comparant l'image en temps réel avec l'image de référence stockée.
Troisièmement : Déployer des solutions d'apprentissage automatique
La méthode de déploiement de modèles la plus largement utilisée est le service SageMaker, que vous pouvez utiliser de deux manières :
- Utilisation du service d'hébergement SageMaker pour configurer les points de terminaison HTTPS. Dans cette solution, les applications clientes envoient des requêtes aux points de terminaison HTTPS pour obtenir des prédictions à partir de modèles déployés. Pour utiliser cette solution, vous devez lui fournir votre image Docker. Si vous devez déployer plusieurs modèles, vous pouvez également utiliser des points de terminaison multimodèles.
- Utilisation de SageMaker Batch Transform , qui vous aide à obtenir des prédictions pour un ensemble de données entier. Pour déployer un modèle à l'aide de la transformation par lots, vous avez besoin d'un compartiment S3 pour stocker le modèle, les ensembles de données et les prédictions.
L'alternative de déploiement utilise AWS IoT Greengrass . Ce service étend AWS aux appareils de l'Internet des objets (IoT). Grâce à ce service, les appareils peuvent collecter, filtrer, traiter des données et ils peuvent également exécuter des fonctions Lambda, des conteneurs Docker et exécuter des prédictions basées sur des modèles ML même sans connexion au cloud. Lorsqu'il est connecté à Internet, Greengrass synchronise toutes les données avec les services cloud.
Sommaire
Comme vous pouvez le constater, Amazon Web Service propose un ensemble complet d'outils qui peuvent vous aider à créer des solutions d'apprentissage automatique percutantes pour votre entreprise. Avec les outils ML AWS, vous pouvez ajouter de nouvelles fonctionnalités à vos applications, telles que la détection de visage, les chatbots, la reconnaissance vocale, l'analyse des sentiments du contenu des médias sociaux. AWS ajoute de nouveaux services ML, basés sur de nouveaux cas d'utilisation, tous les quelques mois, ce qui en fait l'une des plates-formes à la croissance la plus rapide pour la création de solutions d'IA.
Développez une solution d'apprentissage automatique évolutive avec Miquido !