วิธีเพิ่มโซลูชัน Machine Learning ให้กับธุรกิจของคุณโดยใช้ AWS
เผยแพร่แล้ว: 2020-05-13แมชชีนเลิร์นนิงมีการพัฒนาอย่างต่อเนื่องและมีบทบาทอย่างมากในเศรษฐกิจโลก เนื่องจากช่วยให้สามารถวิเคราะห์ข้อมูลส่วนใหญ่ได้อย่างรวดเร็วและอัตโนมัติ
เพื่อให้เทคโนโลยีแมชชีนเลิร์นนิงเข้าใกล้โปรแกรมเมอร์มากขึ้น ปัจจุบัน Amazon เสนอบริการแมชชีนเลิร์นนิงและปัญญาประดิษฐ์มากกว่า 10 รายการบนแพลตฟอร์ม AWS ด้วยบริการเหล่านี้ คุณสามารถเริ่มสร้างแบบจำลองด้วยวิธีง่ายๆ ซึ่งสามารถยกระดับธุรกิจของคุณไปอีกระดับ
บริการเหล่านี้ส่วนใหญ่ได้รับการจัดการอย่างเต็มรูปแบบ ซึ่งหมายความว่าเพื่อใช้งาน คุณไม่จำเป็นต้องมีประสบการณ์การเรียนรู้ด้วยเครื่องใดๆ เนื่องจากเครื่องมือเหล่านี้ใช้ประโยชน์จากโมเดลที่ได้รับการฝึกอบรมล่วงหน้าสำหรับการทำงานกับข้อมูล คุณสามารถเลือกบริการ ML ที่ได้รับการฝึกอบรมล่วงหน้าในด้านต่างๆ เช่น คอมพิวเตอร์วิทัศน์ การประมวลผลภาษาธรรมชาติ คำแนะนำ และการคาดการณ์ ทั้งนี้ขึ้นอยู่กับปัญหาทางธุรกิจของคุณ กราฟด้านล่างแสดงเวิร์กโฟลว์โซลูชัน Machine Learning พร้อมด้วยเครื่องมือ AWS ที่คุณสามารถใช้ได้ในแต่ละขั้นตอน

วิธีการใช้ Machine Learning กับธุรกิจด้วย AWS
ประการแรก: การรวบรวมข้อมูล
องค์ประกอบที่สำคัญที่สุดในการสร้างโซลูชัน ML คือข้อมูล ข้อมูลมี 3 ประเภท: มีโครงสร้าง กึ่งมีโครงสร้าง และไม่มีโครงสร้าง
- องค์ประกอบ ของข้อมูลที่มีโครงสร้าง สามารถระบุตำแหน่งได้และสามารถจัดเก็บไว้ในฐานข้อมูลเชิงสัมพันธ์ ข้อมูลประเภทนี้มีสคีมาที่กำหนดไว้ล่วงหน้า ตัวอย่างของข้อมูลที่มีโครงสร้างคือฐานข้อมูลเชิงสัมพันธ์ที่มีข้อมูลตัวเลขและสตริง (ข้อความ)
- ชุดข้อมูลกึ่งโครงสร้าง ไม่ได้อยู่ในฐานข้อมูลเชิงสัมพันธ์ แต่ยังมีองค์ประกอบที่กำหนดไว้ล่วงหน้า (สคีมา) ที่ช่วยให้วิเคราะห์ได้ง่ายขึ้น ตัวอย่างของประเภทไฟล์ข้อมูลกึ่งโครงสร้าง ได้แก่ XML, HTML, RDF หรือ JSON
- ข้อมูลที่ไม่มีโครงสร้าง เป็นอย่างอื่น ชนิดข้อมูลนี้ไม่มีโครงสร้างที่กำหนดไว้ล่วงหน้า และมักจะจัดเก็บเป็นชุดของไฟล์ ตัวอย่างข้อมูลที่ไม่มีโครงสร้างที่ได้รับความนิยมมากที่สุด ได้แก่ เอกสารข้อความ รูปภาพ วิดีโอ ไฟล์เสียง และบันทึกการใช้งาน
การโหลดข้อมูล – Kinesis คืออะไร
บริการ AWS Kinesis นำเข้าข้อมูลที่สามารถสร้างได้อย่างต่อเนื่องจากแหล่งต่างๆ เช่น เว็บและแอปพลิเคชันมือถือ เป็นบริการสตรีมข้อมูลแบบเรียลไทม์ที่สามารถบันทึกข้อมูลกิกะไบต์ได้อย่างรวดเร็ว Kinesis มีเครื่องมือดังต่อไปนี้:
- Kinesis Video Streaming – เครื่องมือที่สามารถช่วยคุณสตรีมวิดีโอจากอุปกรณ์ไปยัง AWS
- Kinesis Data Streaming – เครื่องมือที่สามารถช่วยคุณรวบรวมข้อมูล เช่น บันทึกไอที การคลิกเว็บไซต์ หรือธุรกรรมทางการเงิน
- Kinesis Data Firehose – เครื่องมือในการโหลดข้อมูลที่สตรีมไปยังที่เก็บข้อมูล (เช่น S3, Redshift) หรือเครื่องมือวิเคราะห์
- Kinesis Data Analytics – เครื่องมือที่ประมวลผลข้อมูลที่สตรีมแบบเรียลไทม์ด้วย SQL หรือ Java
การโหลดข้อมูล – กาวคืออะไร?
บริการของ AWS อื่นที่สามารถช่วยในการโหลดข้อมูลคือ Glue ซึ่งจัดการโดย Apache Spark เป็นเครื่องมือแยก แปลง และโหลด (ETL) ที่สามารถใช้เพื่อเตรียมข้อมูลก่อนที่จะใช้สำหรับการวิเคราะห์ กาวสามารถใช้ได้กับทั้งข้อมูลที่มีโครงสร้างและกึ่งโครงสร้าง
องค์ประกอบของกาวคือ Data Catalog, ETL engine และตัวจัดกำหนดการ แค็ตตาล็อกข้อมูลกาวเป็นส่วนที่สำคัญที่สุดของเครื่องมือ โดยจะบันทึกข้อมูลเมตาเกี่ยวกับข้อมูลที่กำหนด ซึ่งโปรแกรมรวบรวมข้อมูลจะค้นพบโดยอัตโนมัติโดยผ่านแหล่งข้อมูลและตรวจหาสคีมา
เอ็นจิ้น ETL สามารถสร้างโค้ด Python และ Scala เพื่อใช้ในกระบวนการ ETL สำหรับผู้ใช้ที่ไม่ได้ตั้งโปรแกรม นอกจากนี้ยังสามารถประมวลผลข้อมูลด้วยรหัสที่ผู้ใช้ให้มา ตัวจัดกำหนดการสามารถตรวจสอบงาน เรียกใช้งาน และทริกเกอร์งานตามเหตุการณ์บางอย่าง (เช่น ในเวลาที่กำหนดทุกวันจันทร์ หรือเมื่องานอื่นเสร็จสมบูรณ์หรือล้มเหลว)
ประการที่สอง: การเลือกเครื่องมือการเรียนรู้ของเครื่องที่เหมาะสม
หลังจากที่เราได้รวบรวมข้อมูลที่ต้องการแล้ว เราสามารถเริ่มสร้างโซลูชัน ML ของเราได้ AWS มี Machine Learning Tools สองสามตัวที่สามารถประมวลผลข้อมูลประเภทต่างๆ
ให้เราพิจารณาเครื่องมือแต่ละอย่างเหล่านี้ และนำเสนอส่วนหลักๆ ที่เป็นไปได้ของการใช้งานในธุรกิจ
SageMaker คืออะไร?
SageMaker มีประโยชน์มากที่สุดสำหรับนักพัฒนาแมชชีนเลิร์นนิงและนักวิทยาศาสตร์ข้อมูล บริการนี้เป็นโซลูชั่นที่สมบูรณ์ที่ช่วยนำโมเดลการเรียนรู้ของเครื่องจากแนวคิดไปสู่การผลิตโดยใช้ความพยายามเพียงเล็กน้อย Amazon SageMaker มีชุดเครื่องมือมากมาย (Ground Truth, Notebooks, Experiments, Debugger, Model Monitor, Neo) ที่สามารถช่วยในการติดป้ายกำกับข้อมูล การสร้าง การเพิ่มประสิทธิภาพ การฝึกอบรม การทดสอบ และการปรับใช้โมเดล
การค้นหาอัลกอริธึมที่เหมาะสมด้วยตนเองสำหรับปัญหาที่กำหนดมักต้องใช้เวลาในการฝึกอบรมและการทดสอบหลายชั่วโมง SageMaker มีตัวเลือก AutoPilot ซึ่งใช้รุ่น ML ที่ผ่านการฝึกอบรมล่วงหน้ากว่า 50 รุ่นเพื่อค้นหารุ่น ML ที่ดีที่สุดสำหรับเคสที่อยู่ในมือโดยอัตโนมัติ นักพัฒนาสามารถใช้โซลูชันนี้เพื่อค้นหาโมเดลพื้นฐานได้อย่างรวดเร็ว
Personalize คืออะไร?
Personalize คือบริการการเรียนรู้ของเครื่องที่ช่วยในการสร้างระบบการแนะนำ Personalize สามารถประมวลผลสตรีมกิจกรรมจากแอปพลิเคชัน เช่น การคลิก การดูหน้าเว็บ การซื้อ และใช้เพื่อสร้างคำแนะนำส่วนบุคคล คุณยังสามารถใช้ข้อมูลเพิ่มเติมเกี่ยวกับผู้ใช้ของคุณ เช่น อายุ หรือที่ตั้งทางภูมิศาสตร์ การแสดงผลลัพธ์คำแนะนำในแอปพลิเคชันของคุณนั้นง่ายขึ้นด้วยการเรียก API แบบสั้น เทคโนโลยีแมชชีนเลิร์นนิงใน Personalize ได้รับการปรับปรุงเพื่อการใช้งานโดย Amazon.com เป็นเวลาหลายปี

เข้าใจคืออะไร?
Comprehend เป็นบริการประมวลผลภาษาธรรมชาติ (NLP) ที่ใช้การเรียนรู้ของเครื่องเพื่อดึงข้อมูลเชิงลึกอันมีค่าจากข้อมูลที่เป็นข้อความที่ไม่มีโครงสร้าง บริการนี้ใช้การวิเคราะห์ความรู้สึก การแยกเสียงพูดบางส่วน และการแปลงโทเค็นเพื่อตรวจหาคุณลักษณะหลักของข้อความ ความเข้าใจจะเป็นประโยชน์ในการทำความเข้าใจว่าข้อความที่ให้มานั้นเป็นไปในเชิงบวกหรือเชิงลบ
Comprehend มีเครื่องมือเพิ่มเติม: Amazon Comprehend Medical สำหรับอุตสาหกรรมการแพทย์โดยเฉพาะ Amazon Comprehend Medical สามารถวิเคราะห์เอกสารทางการแพทย์ (เช่น เวชระเบียนของผู้ป่วย บันทึกทางคลินิก) และดึงข้อมูลเกี่ยวกับยา ปริมาณ และความถี่ Comprehend เป็นบริการที่มีการจัดการเต็มรูปแบบ
การพยากรณ์คืออะไร?
พยากรณ์ ใช้แมชชีนเลิร์นนิงเพื่อสร้างแบบจำลองการทำนายอนุกรมเวลา สามารถรวมข้อมูลอนุกรมเวลาในอดีตเข้ากับตัวแปรเพิ่มเติม (ซึ่งคุณเชื่อว่าอาจส่งผลต่อการคาดการณ์) เพื่อสร้างแบบจำลองการคาดการณ์ โซลูชัน Amazon นี้ใช้สำหรับการคาดการณ์มูลค่า เช่น ราคาหุ้นหรือความต้องการผลิตภัณฑ์ของลูกค้า พยากรณ์ยังเป็นบริการที่มีการจัดการเต็มรูปแบบและสามารถปรับขนาดได้ตามความต้องการทางธุรกิจ
เล็กซ์คืออะไร?
Lex ใช้การรู้จำเสียงพูดอัตโนมัติ (ASR) เพื่อแปลงคำพูดเป็นข้อความ และใช้การทำความเข้าใจภาษาธรรมชาติ (NLU) เพื่อรับรู้เจตนาของข้อความ โซลูชันนี้ช่วยให้ผู้ใช้สามารถสร้างบอทสนทนาได้
ตัวอย่างเช่น คุณสามารถใช้ Lex แทนการสนับสนุนลูกค้าด้วยตนเองซึ่งจะตอบคำถามของลูกค้าโดยอัตโนมัติ Amazon Lex ใช้เทคโนโลยีการเรียนรู้เชิงลึกแบบเดียวกับ Amazon Alexa (ผู้ช่วยเสมือนของ Amazon)
พอลลี่คืออะไร?
Polly เป็นบริการคลาวด์ที่ใช้อัลกอริธึมการเรียนรู้เชิงลึกเพื่อแปลงข้อความเป็นคำพูดที่เหมือนจริง ปัจจุบันรองรับเสียงชายและหญิง 60 เสียงใน 29 ภาษา รวมถึงญี่ปุ่น จีน เกาหลี และอาหรับ พอลลี่ยังสามารถจัดการเวลา วันที่ หน่วย เศษส่วน และตัวย่อได้ โซลูชันนี้ทำให้ผู้ใช้สามารถสร้างแอปพลิเคชันที่สามารถพูดคุยได้
เครื่องตรวจจับการทุจริตคืออะไร?
Fraud Detector เป็นบริการของ AWS ที่สามารถช่วยระบุกิจกรรมออนไลน์ที่เป็นการฉ้อโกง เช่น การฉ้อโกงการชำระเงินหรือบัญชีปลอม บริการนี้ได้รับการจัดการอย่างเต็มรูปแบบ ดังนั้นจึงสามารถสร้างแบบจำลองการตรวจจับการฉ้อโกงได้ด้วยการคลิกเพียงไม่กี่ครั้ง
ข้อความคืออะไร?
Text คือบริการที่สามารถอ่านข้อมูลจากเอกสารที่สแกนได้โดยอัตโนมัติ ข้อความสามารถประมวลผลหน้าหลายล้านหน้าในเวลาไม่กี่ชั่วโมงและช่วยในการทำให้เวิร์กโฟลว์เอกสารเป็นแบบอัตโนมัติ บริการนี้มีประโยชน์ในการประมวลผลเอกสาร เช่น การขอสินเชื่อหรือเอกสารทางการแพทย์
แปลภาษาคืออะไร?
Translate คือการเรียนรู้ของเครื่องของ AWS ที่สามารถให้บริการแปลข้อความจากภาษาเป็นภาษาได้ ใช้โมเดลการเรียนรู้เชิงลึกเพื่อการแปลที่แม่นยำและเป็นธรรมชาติมากขึ้น เมื่อเทียบกับอัลกอริธึมทางสถิติแบบดั้งเดิม แปลภาษารองรับ 54 ภาษา (เช่น แอฟริกา บัลแกเรีย เอสโตเนีย) และคู่ภาษา 2,804 คู่
การรับรู้คืออะไร?
Rekognition เป็นบริการคอมพิวเตอร์วิทัศน์ที่สามารถจดจำวัตถุ คน และข้อความจากภาพและภาพยนตร์ การจดจำสามารถระบุและเปรียบเทียบใบหน้า วิเคราะห์ใบหน้า และระบุลักษณะใบหน้าบางอย่าง เช่น ปาก จมูก หรือตา
Rekognition มีโมดูลที่จะตรวจจับอารมณ์ต่างๆ เช่น ความสุข ความเศร้า หรือความประหลาดใจในภาพใบหน้าโดยอัตโนมัติ นอกจากนี้ยังสามารถดำเนินการตรวจสอบใบหน้าผู้ใช้ ซึ่งจะยืนยันตัวตนของผู้ใช้โดยการเปรียบเทียบภาพแบบเรียลไทม์กับภาพอ้างอิงที่จัดเก็บไว้
ประการที่สาม: การปรับใช้โซลูชันการเรียนรู้ของเครื่อง
วิธีการปรับใช้โมเดลที่ใช้กันอย่างแพร่หลายมากที่สุดคือ SageMaker Service ซึ่งคุณสามารถใช้หนึ่งในสองวิธี:
- การใช้ SageMaker Hosting Service เพื่อตั้งค่าปลายทาง HTTPS ในโซลูชันนี้ แอปพลิเคชันไคลเอนต์ส่งคำขอไปยังปลายทาง HTTPS เพื่อรับการคาดการณ์จากโมเดลที่ปรับใช้ ในการใช้โซลูชันนี้ คุณต้องจัดเตรียมอิมเมจ Docker ของคุณ หากคุณต้องการปรับใช้หลายรุ่น คุณยังสามารถใช้ตำแหน่งข้อมูลหลายรุ่นได้
- การใช้ SageMaker Batch Transform ซึ่งช่วยให้คุณได้รับการคาดการณ์สำหรับชุดข้อมูลทั้งหมด ในการปรับใช้โมเดลโดยใช้ Batch Transform คุณต้องมีบัคเก็ต S3 เพื่อจัดเก็บโมเดล ชุดข้อมูล และการคาดการณ์
ทางเลือกในการปรับใช้คือการใช้ AWS IoT Greengrass บริการนี้ขยาย AWS ไปยังอุปกรณ์อินเทอร์เน็ตของสรรพสิ่ง (IoT) ด้วยการใช้บริการนี้ อุปกรณ์สามารถรวบรวม กรอง ประมวลผลข้อมูล และยังสามารถเรียกใช้ฟังก์ชัน Lambda, Docker container และดำเนินการคาดการณ์ตามแบบจำลอง ML ได้แม้จะไม่มีการเชื่อมต่อบนคลาวด์ เมื่อเชื่อมต่อกับอินเทอร์เน็ต Greengrass จะซิงโครไนซ์ข้อมูลทั้งหมดกับบริการคลาวด์
สรุป
อย่างที่คุณเห็น Amazon Web Service มีชุดเครื่องมือมากมายที่สามารถช่วยคุณสร้างโซลูชันแมชชีนเลิร์นนิงที่มีประสิทธิภาพสำหรับธุรกิจของคุณ ด้วยเครื่องมือ ML AWS คุณสามารถเพิ่มคุณสมบัติใหม่ให้กับแอปพลิเคชันของคุณ เช่น การตรวจจับใบหน้า แชทบอท การรู้จำคำพูด การวิเคราะห์ความรู้สึกของเนื้อหาโซเชียลมีเดีย AWS เพิ่มบริการ ML ใหม่ตามกรณีการใช้งานใหม่ทุกสองสามเดือน ซึ่งทำให้เป็นหนึ่งในแพลตฟอร์มที่เติบโตเร็วที่สุดสำหรับการสร้างโซลูชัน AI
พัฒนาโซลูชันแมชชีนเลิร์นนิงในอนาคตด้วย Miquido!