كيفية إضافة حلول التعلم الآلي إلى عملك باستخدام AWS
نشرت: 2020-05-13يتطور التعلم الآلي باستمرار ويلعب دورًا كبيرًا في الاقتصاد العالمي ، حيث يتيح التحليل السريع والتلقائي لأجزاء كبيرة من البيانات.
من أجل جعل تقنية التعلم الآلي أقرب إلى المبرمجين ، تقدم أمازون حاليًا أكثر من 10 خدمات للتعلم الآلي والذكاء الاصطناعي على نظامها الأساسي AWS. مع هذه الخدمات ، يمكنك البدء في بناء النماذج بطريقة بسيطة ، والتي يمكن أن ترفع عملك إلى المستوى التالي.
تتم إدارة معظم هذه الخدمات بشكل كامل ، مما يعني أنه من أجل استخدامها ، لا تحتاج إلى أي خبرة في التعلم الآلي لأن هذه الأدوات تستفيد من النماذج المدربة مسبقًا للعمل مع البيانات. اعتمادًا على مشكلة عملك ، يمكنك الاختيار من بين خدمات تعلم الآلة المدربة مسبقًا في مجالات مثل رؤية الكمبيوتر ومعالجة اللغة الطبيعية والتوصيات والتنبؤ. يوضح الرسم البياني أدناه سير عمل حل التعلم الآلي ، جنبًا إلى جنب مع أدوات AWS التي يمكنك استخدامها في كل مرحلة من المراحل.

كيفية تطبيق التعلم الآلي على الأعمال باستخدام AWS
أولاً: جمع البيانات
البيانات هي العنصر الأكثر أهمية في إنشاء حلول تعلم الآلة. هناك ثلاثة أنواع من البيانات: منظمة ، وشبه منظمة ، وغير منظمة.
- يمكن معالجة عناصر البيانات المنظمة ويمكن تخزينها في قاعدة بيانات علائقية. هذا النوع من البيانات له مخطط محدد مسبقًا. مثال على البيانات المنظمة هو قاعدة بيانات علائقية تحتوي على بيانات رقمية وسلسلة (نصية).
- لا توجد مجموعات البيانات شبه المهيكلة في قواعد البيانات العلائقية ، ولكنها مع ذلك تحتوي على بعض العناصر المحددة مسبقًا (المخطط) التي تسهل تحليلها. من أمثلة أنواع ملفات البيانات شبه المهيكلة XML أو HTML أو RDF أو JSON.
- البيانات غير المهيكلة هي كل شيء آخر. لا يحتوي نوع البيانات هذا على بنية محددة مسبقًا ويتم تخزينها عادةً كمجموعة من الملفات. أكثر أمثلة البيانات غير المنظمة شيوعًا هي المستندات النصية والصور والفيديو وملفات الصوت وسجلات التطبيق.
تحميل البيانات - ما هو Kinesis؟
تستوعب خدمة AWS Kinesis البيانات التي يمكن إنشاؤها باستمرار من مصادر مختلفة ، مثل تطبيقات الويب والجوال. إنها خدمة دفق بيانات في الوقت الفعلي يمكنها التقاط غيغابايت من البيانات بسرعة كبيرة. يقدم Kinesis الأدوات التالية:
- Kinesis Video Streaming - أداة يمكن أن تساعدك على دفق الفيديو من الأجهزة إلى AWS
- Kinesis Data Streaming - أداة يمكن أن تساعدك في جمع البيانات مثل سجلات تكنولوجيا المعلومات أو نقرات موقع الويب أو المعاملات المالية
- Kinesis Data Firehose - أداة لتحميل البيانات المتدفقة في مخازن البيانات (مثل S3 ، و Redshift) أو أدوات التحليل
- Kinesis Data Analytics - أداة تعالج البيانات المتدفقة في الوقت الفعلي باستخدام SQL أو Java
تحميل البيانات - ما هو الغراء؟
خدمة AWS الأخرى التي يمكن أن تساعد في تحميل البيانات هي خدمة Glue التي تديرها Apache Spark . إنها أداة استخراج وتحويل وتحميل (ETL) يمكن استخدامها لإعداد البيانات قبل استخدامها للتحليلات. يمكن أن يعمل الغراء مع كل من البيانات المنظمة وشبه المنظمة.
عناصر الغراء هي كتالوج البيانات ومحرك ETL وجدولة. يعد كتالوج Glue Data Catalog أهم جزء في الأداة. يحفظ البيانات الوصفية حول البيانات المعينة ، ويتم اكتشافها تلقائيًا بواسطة برامج الزحف التي تمر عبر مصادر البيانات وتكتشف مخططها.
يمكن لمحركات ETL إنشاء كود Python و Scala لاستخدامه في عملية ETL للمستخدمين غير المبرمجين. يمكنه أيضًا معالجة البيانات برمز يقدمه المستخدم. يمكن للمجدول مراقبة الوظائف وتشغيل المهام وتشغيلها بناءً على بعض الأحداث (على سبيل المثال في وقت محدد كل يوم اثنين أو عند اكتمال مهمة أخرى أو فشلها).
ثانيًا: اختيار أدوات التعلم الآلي الصحيحة
بعد أن نجمع البيانات التي نحتاجها ، يمكننا البدء في بناء حلول ML الخاصة بنا. تقدم AWS عددًا قليلاً من أدوات التعلم الآلي التي يمكنها معالجة البيانات من أنواع مختلفة.
دعونا الآن نلقي نظرة على كل من هذه الأدوات ، ونعرض المجالات الرئيسية الممكنة للتطبيق في مجال الأعمال .
ما هو SageMaker؟
يعتبر SageMaker أكثر فائدة لمطوري التعلم الآلي وعلماء البيانات. هذه الخدمة عبارة عن حل كامل يساعد في نقل نماذج التعلم الآلي من المفهوم إلى الإنتاج بأقل جهد ممكن. يحتوي Amazon SageMaker على مجموعة غنية من الأدوات (Ground Truth ، Notebooks ، Experiments ، Debugger ، Model Monitor ، Neo) التي يمكن أن تساعد في تصنيف البيانات ، وبناء النماذج وتحسينها والتدريب عليها واختبارها ونشرها.
غالبًا ما يتطلب العثور على الخوارزمية الصحيحة يدويًا لمشكلة معينة ساعات من التدريب والاختبار. يحتوي SageMaker على خيار AutoPilot ، والذي يستخدم 50 نموذجًا مختلفًا من ML مدربين مسبقًا للعثور تلقائيًا على أفضل نموذج ML للحالة الموجودة. يمكن للمطورين استخدام هذا الحل للعثور بسرعة على نموذج أساسي.
ما هو التخصيص؟
التخصيص هي خدمة تعلم آلي تساعد في بناء أنظمة التوصية. يمكن لإضفاء الطابع الشخصي معالجة تدفقات النشاط من التطبيقات ، على سبيل المثال النقرات ، وعروض الصفحة ، وعمليات الشراء ، واستخدامها لإنشاء توصيات مخصصة. يمكنك أيضًا استخدام معلومات إضافية حول المستخدمين ، مثل العمر أو الموقع الجغرافي. يمكن تبسيط عرض نتائج التوصيات في تطبيقك من خلال استدعاءات قصيرة لواجهة برمجة التطبيقات. تم تحسين تقنية التعلم الآلي في Personalize لسنوات من الاستخدام بواسطة Amazon.com.

ما هو الفهم؟
Comprehend هي خدمة معالجة اللغة الطبيعية (NLP) التي تستخدم التعلم الآلي لاستخراج رؤى قيمة من البيانات النصية غير المنظمة. تطبق هذه الخدمة تحليل المشاعر واستخراج جزء من الكلام والترميز للكشف عن السمات الرئيسية للنص. يمكن أن يكون الفهم مفيدًا في فهم مدى إيجابية أو سلبية نص معين.
لدى Comprehend أداة إضافية: Amazon Comprehend Medical ، خاصة للصناعة الطبية. يمكن لـ Amazon Comprehend Medical تحليل الوثائق الطبية (مثل السجلات الطبية للمرضى والملاحظات السريرية) واستخراج المعلومات حول الأدوية والجرعات والترددات. Comprehend هي خدمة مُدارة بالكامل.
ما هو التنبؤ؟
تستخدم التوقعات التعلم الآلي لبناء نماذج التنبؤ بالسلاسل الزمنية. يمكنه الجمع بين بيانات السلاسل الزمنية التاريخية والمتغيرات الإضافية (التي تعتقد أنها قد تؤثر على التوقعات) لبناء نماذج تنبؤية. ينطبق حل Amazon هذا على التنبؤ بقيم مثل أسعار الأسهم أو طلب العميل على المنتجات. التنبؤ هو أيضًا خدمة مُدارة بالكامل ويمكن توسيع نطاقها وفقًا لاحتياجات العمل.
ما هو ليكس؟
يستخدم Lex التعرف التلقائي على الكلام (ASR) لتحويل الكلام إلى نص ، وفهم اللغة الطبيعية (NLU) للتعرف على الغرض من النص. يمكّن هذا الحل المستخدم من بناء روبوتات للمحادثة.
على سبيل المثال ، يمكنك استخدام Lex كبديل لدعم العملاء اليدوي الذي سيجيب تلقائيًا على استفسارات العملاء. تستخدم Amazon Lex نفس تقنية التعلم العميق مثل Amazon Alexa (مساعد أمازون الافتراضي AI).
ما هي بولي؟
Polly هي خدمة سحابية تستخدم خوارزميات التعلم العميق لتحويل النص إلى كلام نابض بالحياة. يدعم حاليًا 60 صوتًا من الذكور والإناث عبر 29 لغة ، بما في ذلك اليابانية والصينية والكورية والعربية. يمكن أن يتعامل Polly أيضًا مع الوقت والتواريخ والوحدات والكسور والاختصارات. يتيح هذا الحل للمستخدم إنشاء تطبيقات يمكنها التحدث.
ما هو كاشف الاحتيال؟
أداة كشف الاحتيال هي خدمة AWS يمكنها المساعدة في تحديد الأنشطة الاحتيالية عبر الإنترنت ، مثل عمليات الاحتيال في الدفع أو الحسابات المزيفة. تتم إدارة هذه الخدمة بالكامل بحيث يمكن إنشاء نموذج للكشف عن الاحتيال ببضع نقرات فقط.
ما هو تيكستراكت؟
Textract هي خدمة يمكنها قراءة البيانات تلقائيًا من المستندات الممسوحة ضوئيًا. يمكن لـ Textract معالجة ملايين الصفحات في غضون ساعات ويمكن أن يساعد في أتمتة مهام سير عمل المستندات. هذه الخدمة مفيدة في معالجة المستندات مثل طلبات القروض أو الوثائق الطبية.
ما هي الترجمة؟
الترجمة عبارة عن تعلم آلي من AWS يمكن خدمته لإجراء ترجمة نصية من لغة إلى لغة. يستخدم نماذج التعلم العميق لتقديم ترجمة صوتية أكثر دقة وطبيعية ، مقارنة بالخوارزميات الإحصائية التقليدية. يدعم تطبيق الترجمة 54 لغة (بما في ذلك الأفريكانية والبلغارية والإستونية) و 2804 زوجًا من اللغات.
ما هو Rekognition؟
Rekognition هي خدمة رؤية كمبيوتر يمكنها التعرف على الأشياء والأشخاص والنصوص من الصور والأفلام. Rekognition قادر على تحديد ومقارنة الوجوه وتحليلها وتحديد بعض ملامح الوجه ، مثل الفم أو الأنف أو العينين.
يحتوي Rekognition على وحدة لاكتشاف المشاعر تلقائيًا مثل السعادة أو الحزن أو المفاجأة في صور الوجه. يمكنه أيضًا إجراء التحقق من وجه المستخدم ، والذي سيؤكد هوية المستخدم من خلال مقارنة الصورة في الوقت الفعلي بالصورة المرجعية المخزنة.
ثالثًا: نشر حلول التعلم الآلي
الطريقة الأكثر استخدامًا لنشر النماذج هي خدمة SageMaker ، والتي يمكنك استخدامها بإحدى طريقتين:
- استخدام خدمة استضافة SageMaker لإعداد نقاط نهاية HTTPS. في هذا الحل ، ترسل تطبيقات العملاء طلبات إلى نقاط نهاية HTTPS للحصول على تنبؤات من النماذج المنشورة. لاستخدام هذا الحل ، يجب عليك تزويده بصورة Docker الخاصة بك. إذا كنت بحاجة إلى نشر نماذج متعددة ، فيمكنك أيضًا استخدام نقاط النهاية متعددة النماذج.
- استخدام SageMaker Batch Transform ، والذي يساعدك في الحصول على تنبؤات لمجموعة بيانات كاملة. لنشر نموذج باستخدام Batch Transform ، تحتاج إلى حاوية S3 لتخزين النموذج ومجموعات البيانات والتنبؤات.
بديل النشر هو استخدام AWS IoT Greengrass . تمد هذه الخدمة AWS إلى أجهزة إنترنت الأشياء (IoT). باستخدام هذه الخدمة ، يمكن للأجهزة جمع البيانات وتصفيتها ومعالجتها ويمكنها أيضًا تشغيل وظائف Lambda وحاويات Docker وتنفيذ التنبؤات بناءً على نماذج ML حتى بدون اتصال سحابي. عند الاتصال بالإنترنت ، يقوم Greengrass بمزامنة جميع البيانات مع الخدمات السحابية.
ملخص
كما ترى ، تقدم Amazon Web Service مجموعة غنية من الأدوات التي يمكن أن تساعدك في إنشاء حلول تعلم آلي مؤثرة لعملك. باستخدام أدوات ML AWS ، يمكنك إضافة ميزات جديدة إلى تطبيقاتك ، مثل اكتشاف الوجه وروبوتات الدردشة والتعرف على الكلام وتحليل المشاعر لمحتوى الوسائط الاجتماعية. تضيف AWS خدمات ML جديدة ، بناءً على حالات الاستخدام الجديدة ، كل بضعة أشهر ، مما يجعلها واحدة من أسرع الأنظمة الأساسية نموًا لإنشاء حلول الذكاء الاصطناعي.
طوّر حلًا للتعلم الآلي متوافقًا مع المستقبل مع M Liquido!