Supervised vs Unsupervised Learning: โมเดลการเรียนรู้ของเครื่องใดที่เหมาะกับคุณ?
เผยแพร่แล้ว: 2022-05-07การเรียนรู้ของเครื่องไม่จำเป็นต้องทำให้งง เราจะแบ่งประเภทที่พบบ่อยที่สุดสองประเภทและกรณีการใช้งานในบทความนี้
ในฐานะผู้นำธุรกิจ คุณทราบดีว่าการนำเทคโนโลยีใหม่มาใช้สามารถบรรเทาความเจ็บปวดและทำให้ธุรกิจของคุณสามารถแข่งขันได้มากขึ้น นั่นเป็นสาเหตุว่าทำไมในช่วงปีที่ Disruption เกิดขึ้น ธุรกิจจำนวนมากจึงหันมาใช้การเปลี่ยนแปลงทางดิจิทัลเพื่อให้ผ่านพ้นไปได้
คุณอาจทราบถึงศักยภาพของเทคโนโลยีเกิดใหม่ เช่น แมชชีนเลิร์นนิง ที่สามารถทำให้ธุรกิจของคุณพิสูจน์ได้ในอนาคต แต่ผู้ซื้อจงระวัง—หากคุณไม่เข้าใจแอปพลิเคชันของแมชชีนเลิร์นนิง คุณอาจเสี่ยงที่จะเสียเงินไปกับผลลัพธ์ที่ใช้ไม่ได้ ใช้ตัวอย่างด้านล่างเพื่อดูว่าเราหมายถึงอะไร
เพื่อเตรียมเขียนบทความนี้ เราใช้เครื่องมือสร้างภาษาธรรมชาติ (NLG) เพื่อช่วยให้เราเข้าใจวิธีแยกแยะการเรียนรู้ภายใต้การดูแลและการเรียนรู้ที่ไม่ได้รับการดูแลได้ดีที่สุด นี่คือข้อความที่ตัดตอนมาจากคู่สัญญา NLG ของเรา:
“แต่ละโมเดลการเรียนรู้แบบ unsupervised จะให้เมทริกซ์เทนรองตามค่าสัมประสิทธิ์สหสัมพันธ์ การตอบสนองที่ผิดพลาด ข้อมูลที่มีประโยชน์ทางสถิติเพียงเล็กน้อย (หรือขึ้นอยู่กับมันมาก) ใช้สำหรับการลดขนาดโดยใช้กราฟและต้นไม้เพื่อสร้างจุดข้อมูลขีดจำกัดของตัวเอง”
รู้สึกสับสน? พวกเราด้วย แต่ถึงแม้จะมีรูปแบบประโยคที่น่าสับสนของเครื่องมือ NLG ก็ตาม การทดลองด้วยปัญญาประดิษฐ์ (AI) นี้ไม่ได้ช่วยอะไรเลย ทำให้เราตระหนักดีว่าการได้ผลลัพธ์ที่ดีที่สุดจาก AI นั้น การค้นหาแอปพลิเคชันที่เหมาะสมมีความสำคัญ—นั่นคือเหตุผลที่เราเขียนคู่มือนี้เพื่อช่วยคุณ
เราได้พูดคุยกับ Thomas Wood ที่ปรึกษาด้านวิทยาศาสตร์ข้อมูลของ Fast Data Science และเขาช่วยแบ่งหัวข้อด้วยเงื่อนไขที่เข้าใจง่าย ด้วยความช่วยเหลือของ Wood เราจะอธิบายความแตกต่างระหว่างวิธีการแมชชีนเลิร์นนิงทั่วไปสองวิธี การเรียนรู้ภายใต้การดูแลและไม่ได้รับการดูแล และกรณีการใช้งานใดที่เหมาะสมที่สุดสำหรับแต่ละวิธี
หากเพิ่งเคยใช้แมชชีนเลิร์นนิง ทบทวนแนวคิดหลักเหล่านี้ก่อนเข้าสู่ส่วนอื่นๆ ของบทความนี้:
- การเรียนรู้ของเครื่อง (ML) คือชุดย่อยของปัญญาประดิษฐ์ (AI) ที่แก้ปัญหาโดยใช้อัลกอริทึมและแบบจำลองทางสถิติเพื่อดึงความรู้จากข้อมูล พูดอย่างกว้างๆ โมเดลการเรียนรู้ของเครื่องทั้งหมดสามารถแบ่งออกเป็นการเรียนรู้ภายใต้การดูแลหรือการเรียนรู้ที่ไม่มีผู้ดูแล
- อัลกอริทึม ในการเรียนรู้ของเครื่องเป็นขั้นตอนที่ทำงานบนข้อมูลเพื่อสร้างแบบจำลองการเรียนรู้ของเครื่อง
- โมเดล ในการเรียนรู้ของเครื่องคือผลลัพธ์ของอัลกอริธึมการเรียนรู้ของเครื่องที่ทำงานบนข้อมูล ความหมาย โมเดลแสดงถึงสิ่งที่เรียนรู้โดยอัลกอริธึมการเรียนรู้ของเครื่อง
อะไรคือความแตกต่างที่สำคัญระหว่างการเรียนรู้ภายใต้การดูแลและการเรียนรู้ที่ไม่มีผู้ดูแล?
หากเราต้องสรุปให้เหลือเพียงประโยคเดียว ก็คงจะเป็นดังนี้: ความแตกต่างหลักระหว่างการเรียนรู้ภายใต้การดูแลและการเรียนรู้ที่ไม่ได้รับการดูแลคือการเรียนรู้ภายใต้การดูแลใช้ข้อมูลที่มีป้ายกำกับเพื่อช่วยทำนายผลลัพธ์ ในขณะที่การเรียนรู้แบบไม่มีผู้ดูแลจะไม่ใช้
อย่างไรก็ตาม มีความแตกต่างเพิ่มเติมระหว่างสองแนวทางนี้ ซึ่งเราจะชี้แจงต่อไป เพื่อให้คุณสามารถเลือกแนวทางที่ดีที่สุดสำหรับสถานการณ์ของคุณได้
แมชชีนเลิร์นนิงภายใต้การดูแลทำงานอย่างไร
เช่นเดียวกับที่เรากล่าวไว้ข้างต้น การเรียนรู้ภายใต้การดูแลจะใช้ข้อมูลที่มีป้ายกำกับเพื่อฝึกโมเดล แต่ในทางทฤษฎีหมายความว่าอย่างไร? มาดูตัวอย่างกันเพื่อเริ่มต้น
ด้วยการเรียนรู้ภายใต้การดูแล โมเดลนี้มีทั้งอินพุตและเอาต์พุตที่เกี่ยวข้อง สมมติว่าเรากำลังฝึกแบบจำลองเพื่อระบุและจำแนกผลไม้ประเภทต่างๆ ในตัวอย่างนี้ คุณจะให้รูปภาพผลไม้หลายรูปเป็นข้อมูลป้อนเข้า พร้อมด้วยรูปร่าง ขนาด สี และรสชาติของผลไม้ ถัดไป คุณจะต้องระบุชื่อผลไม้แต่ละชนิดให้กับโมเดลเป็นผลลัพธ์ของคุณ
ในที่สุด อัลกอริทึมจะเลือกรูปแบบระหว่างลักษณะของผลไม้ (อินพุต) และชื่อ (ผลลัพธ์) เมื่อเกิดเหตุการณ์นี้ขึ้น โมเดลจะได้รับอินพุตใหม่ และโมเดลจะคาดการณ์ผลลัพธ์ให้กับคุณ การเรียนรู้ภายใต้การดูแลประเภทนี้ เรียกว่า การจำแนกประเภท เป็นเรื่องธรรมดา ที่สุด
แมชชีนเลิร์นนิงทำงานอย่างไร
ตรงกันข้าม การเรียนรู้แบบ unsupervised โดยการสอนแบบจำลองเพื่อระบุรูปแบบด้วยตัวมันเอง (ด้วยเหตุนี้ unsupervised ) จากข้อมูลที่ไม่มีป้ายกำกับ ซึ่งหมายความว่ามีอินพุต แต่ไม่ใช่เอาต์พุต
เพื่อให้เข้าใจถึงวิธีการทำงาน มาต่อด้วยตัวอย่างผลไม้ที่ให้ไว้ข้างต้น ด้วยการเรียนรู้แบบไม่มีผู้ดูแล คุณจะจัดเตรียมชุดข้อมูลอินพุตให้กับโมเดล (รูปภาพของผลไม้และลักษณะของผลไม้) แต่คุณจะไม่ให้ผลลัพธ์ (ชื่อของผลไม้)
โมเดลจะใช้อัลกอริธึมที่เหมาะสมในการฝึกตัวเองเพื่อแบ่งผลไม้ออกเป็นกลุ่มต่างๆ ตามลักษณะที่คล้ายคลึงกันมากที่สุดระหว่างผลไม้เหล่านั้น การเรียนรู้แบบ unsupervised แบบนี้เรียกว่า คลัสเตอร์ เป็นเรื่องปกติมากที่สุด
ต้องการเรียกใช้แบบจำลองการเรียนรู้ของเครื่องทั้งสองอีกครั้งหรือไม่ ดูวิดีโอสั้น ๆ นี้สำหรับคำอธิบายระดับสูง:
เมื่อใดควรใช้การเรียนรู้ภายใต้การดูแลกับการเรียนรู้ที่ไม่ได้รับการดูแล
ไม่ว่าคุณจะควรใช้การเรียนรู้ภายใต้การดูแลหรือไม่อยู่ภายใต้การดูแลนั้นขึ้นอยู่กับเป้าหมายและโครงสร้างและปริมาณของข้อมูลที่คุณมี ก่อนตัดสินใจ ให้นักวิทยาศาสตร์ข้อมูลของคุณประเมินสิ่งต่อไปนี้:
- ข้อมูลอินพุตเป็นชุดข้อมูลที่ไม่มีป้ายกำกับหรือติดป้ายกำกับหรือไม่ หากไม่มีป้ายกำกับ ทีมของคุณสามารถสนับสนุนการติดป้ายกำกับเพิ่มเติมได้หรือไม่
- เป้าหมายที่คุณต้องการบรรลุคืออะไร? คุณกำลังทำงานกับปัญหาที่เกิดซ้ำและมีรายละเอียดชัดเจน หรืออัลกอริทึมจำเป็นต้องคาดการณ์ปัญหาใหม่หรือไม่
- มีอัลกอริทึมที่รองรับปริมาณข้อมูลและโครงสร้างของคุณหรือไม่? พวกเขามีมิติที่คุณต้องการ (จำนวนคุณลักษณะหรือคุณลักษณะ) หรือไม่?
เมื่อใดควรใช้แมชชีนเลิร์นนิงภายใต้การดูแล
จากข้อมูลของ Gartner การเรียนรู้ภายใต้การดูแลเป็นประเภทการเรียนรู้ของเครื่องที่ได้รับความนิยมและใช้บ่อยที่สุดในสถานการณ์ทางธุรกิจ อาจเป็นเพราะแม้ว่าการจัดประเภทข้อมูลขนาดใหญ่อาจเป็นความท้าทายที่แท้จริงในการเรียนรู้ภายใต้การดูแล แต่ผลลัพธ์มีความแม่นยำและเชื่อถือได้สูง (แหล่งข้อมูลเต็มรูปแบบพร้อมให้แก่ลูกค้า)
ต่อไปนี้คือตัวอย่างกรณีการใช้งานสำหรับการเรียนรู้ภายใต้การดูแล บางอย่างเป็นข้อมูลเฉพาะอุตสาหกรรม ในขณะที่บางองค์กรสามารถนำไปใช้กับองค์กรใดก็ได้:
- การระบุปัจจัยเสี่ยงของโรคและการวางแผนมาตรการป้องกัน
- การจำแนกว่าอีเมลเป็นสแปมหรือไม่
- ทำนายราคาบ้าน
- การคาดคะเนลูกค้าปั่น
- พยากรณ์ปริมาณน้ำฝนและสภาพอากาศ
- ค้นหาว่าผู้ขอสินเชื่อมีความเสี่ยงต่ำหรือมีความเสี่ยงสูง
- การทำนายความล้มเหลวของชิ้นส่วนเครื่องจักรกลในเครื่องยนต์รถยนต์
- การทำนายคะแนนการแชร์บนโซเชียลมีเดียและคะแนนประสิทธิภาพ
Wood แบ่งปันตัวอย่างว่าเขาใช้การเรียนรู้ภายใต้การดูแลเพื่อสร้างระบบคัดแยกอีเมลขาเข้าของลูกค้าอย่างไร ด้วยความช่วยเหลือของระบบ CRM อีเมลจะถูกจัดประเภทเป็นกลุ่มที่แสดงถึงคำถามทั่วไป (เช่น ลูกค้าเปลี่ยนที่อยู่ การร้องเรียน) Wood จึงใช้หมวดหมู่เหล่านี้ในการฝึกโมเดล เพื่อที่ว่าเมื่อได้รับอีเมลขาเข้าใหม่ มันจะรู้ว่าควรกำหนดอีเมลประเภทใด เขาพูดว่า:
“การเรียนรู้ภายใต้การดูแลเป็นไปได้ในกรณีนี้เนื่องจากการมีอยู่ของระบบ CRM ซึ่งจัดเตรียม 'ป้ายกำกับ' เพื่อฝึกโมเดล หากไม่มีสิ่งเหล่านี้ ก็จะเป็นไปได้เฉพาะการเรียนรู้ที่ไม่ได้รับการดูแลเท่านั้น”
เมื่อใดควรใช้แมชชีนเลิร์นนิงโดยไม่ได้รับการดูแล
ตรงกันข้ามกับการเรียนรู้ภายใต้การดูแล การเรียนรู้แบบไม่มีผู้ดูแลสามารถจัดการข้อมูลปริมาณมากในแบบเรียลไทม์ และเนื่องจากตัวแบบจะระบุโครงสร้างในข้อมูลโดยอัตโนมัติ (การจำแนกประเภท) จึงมีประโยชน์ในกรณีที่มนุษย์มีปัญหาในการค้นหาแนวโน้มภายในข้อมูลด้วยตนเอง
ตัวอย่างเช่น หากคุณพยายามแบ่งกลุ่มผู้มีโอกาสเป็นลูกค้าออกเป็นกลุ่มเพื่อวัตถุประสงค์ทางการตลาด วิธีการจัดกลุ่มแบบไม่มีผู้ดูแลจะเป็นจุดเริ่มต้นที่ดี
ต่อไปนี้คือตัวอย่างกรณีการใช้งานสำหรับการเรียนรู้แบบไม่มีผู้ดูแล:
- การจัดกลุ่มลูกค้าตามพฤติกรรมการซื้อ
- การค้นหาความสัมพันธ์ในข้อมูลลูกค้า (เช่น คนที่ซื้อกระเป๋าบางแบบอาจสนใจรองเท้าบางสไตล์ด้วย)
- การแบ่งกลุ่มข้อมูลตามประวัติการซื้อ
- จำแนกคนตามความสนใจที่แตกต่างกัน
- การจัดกลุ่มสินค้าคงเหลือตามเมตริกการผลิตและการขาย
Wood อธิบายให้เราฟังว่าครั้งหนึ่งเขาเคยทำงานให้กับบริษัทยาที่มีโรงงานผลิตอยู่ทั่วโลก ซอฟต์แวร์ที่บริษัทใช้ในการบันทึกข้อผิดพลาดที่เกิดขึ้นในโรงงานไม่มีเมนูแบบเลื่อนลงพร้อมตัวเลือกข้อผิดพลาดทั่วไปให้เลือก
ด้วยเหตุนี้ พนักงานในโรงงานจึงบันทึกข้อผิดพลาดเป็นข้อความธรรมดา (ไม่ว่าจะเป็นภาษาอังกฤษหรือภาษาท้องถิ่น) บริษัทต้องการทราบสาเหตุของปัญหาการผลิตทั่วไป แต่ไม่มีการจัดหมวดหมู่ข้อผิดพลาด จึงเป็นไปไม่ได้ที่จะทำการวิเคราะห์ทางสถิติเกี่ยวกับข้อมูล
Wood ใช้อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลเพื่อค้นหาสิ่งที่เหมือนกันในข้อผิดพลาด เขาสามารถระบุรูปแบบที่ใหญ่ที่สุดและสร้างสถิติได้ เช่น การแจกแจงแบบแผนภูมิวงกลมของปัญหาการผลิตทั่วไปในบริษัท ไม้ พูดว่า:
“สิ่งนี้ทำให้บริษัทเห็นภาพรวมโดยย่อเกี่ยวกับปัญหาในธุรกิจของพวกเขา ซึ่งมิฉะนั้นจะต้องใช้แรงงานคนเป็นจำนวนมาก”
เตรียมพร้อมสำหรับอนาคตอันชาญฉลาด: เปิดรับแมชชีนเลิร์นนิง
แมชชีนเลิร์นนิงเป็นเครื่องมืออันทรงพลังที่สามารถช่วยคุณแก้ปัญหาทางธุรกิจและตัดสินใจโดยใช้ข้อมูลเป็นหลัก หวังว่าบทความนี้จะช่วยให้คุณมีแนวคิดเกี่ยวกับวิธีการนำแมชชีนเลิร์นนิงภายใต้การดูแลหรือไม่มีผู้ดูแลมาใช้ในองค์กรของคุณ
หากคุณพร้อมที่จะรับเอาเทคโนโลยีการเรียนรู้ของเครื่อง ขั้นตอนต่อไปคือการประเมินความสามารถของชุดซอฟต์แวร์ปัจจุบันของคุณ จากนั้นให้ถามผู้ขายของคุณสำหรับกรณีการใช้งานจากลูกค้ารายอื่นในอุตสาหกรรมของคุณที่สอดคล้องกับแอปพลิเคชันที่คุณต้องการใช้การเรียนรู้ของเครื่อง
รู้สึกว่ามีอะไรให้เรียนรู้มากกว่านี้ไหม ตรวจสอบการอ่านที่เกี่ยวข้องเหล่านี้จาก Capterra:
- การเรียนรู้ของเครื่องคืออะไร? อภิธานศัพท์ Business Intelligence ที่จำเป็นของคุณ
- คู่มือธุรกิจขนาดเล็กที่มีความชำนาญสำหรับการเรียนรู้ของเครื่องเทียบกับปัญญาประดิษฐ์
- แอปพลิเคชั่นยอดนิยมของปัญญาประดิษฐ์สำหรับธุรกิจขนาดเล็ก
นอกจากนี้ ให้ตรวจสอบไดเรกทอรีซอฟต์แวร์การเรียนรู้ของเครื่องของ Capterra ซึ่งคุณสามารถอ่านบทวิจารณ์จากผู้ใช้จริงและเครื่องมือกรองตามราคาหรือคุณลักษณะ