Supervised vs Unsupervised Learning: โมเดลการเรียนรู้ของเครื่องใดที่เหมาะกับคุณ?

เผยแพร่แล้ว: 2022-05-07

การเรียนรู้ของเครื่องไม่จำเป็นต้องทำให้งง เราจะแบ่งประเภทที่พบบ่อยที่สุดสองประเภทและกรณีการใช้งานในบทความนี้

บุคคลและเครื่องแบ่งปันข้อมูลซึ่งกันและกัน

ในฐานะผู้นำธุรกิจ คุณทราบดีว่าการนำเทคโนโลยีใหม่มาใช้สามารถบรรเทาความเจ็บปวดและทำให้ธุรกิจของคุณสามารถแข่งขันได้มากขึ้น นั่นเป็นสาเหตุว่าทำไมในช่วงปีที่ Disruption เกิดขึ้น ธุรกิจจำนวนมากจึงหันมาใช้การเปลี่ยนแปลงทางดิจิทัลเพื่อให้ผ่านพ้นไปได้

คุณอาจทราบถึงศักยภาพของเทคโนโลยีเกิดใหม่ เช่น แมชชีนเลิร์นนิง ที่สามารถทำให้ธุรกิจของคุณพิสูจน์ได้ในอนาคต แต่ผู้ซื้อจงระวัง—หากคุณไม่เข้าใจแอปพลิเคชันของแมชชีนเลิร์นนิง คุณอาจเสี่ยงที่จะเสียเงินไปกับผลลัพธ์ที่ใช้ไม่ได้ ใช้ตัวอย่างด้านล่างเพื่อดูว่าเราหมายถึงอะไร

เพื่อเตรียมเขียนบทความนี้ เราใช้เครื่องมือสร้างภาษาธรรมชาติ (NLG) เพื่อช่วยให้เราเข้าใจวิธีแยกแยะการเรียนรู้ภายใต้การดูแลและการเรียนรู้ที่ไม่ได้รับการดูแลได้ดีที่สุด นี่คือข้อความที่ตัดตอนมาจากคู่สัญญา NLG ของเรา:

“แต่ละโมเดลการเรียนรู้แบบ unsupervised จะให้เมทริกซ์เทนรองตามค่าสัมประสิทธิ์สหสัมพันธ์ การตอบสนองที่ผิดพลาด ข้อมูลที่มีประโยชน์ทางสถิติเพียงเล็กน้อย (หรือขึ้นอยู่กับมันมาก) ใช้สำหรับการลดขนาดโดยใช้กราฟและต้นไม้เพื่อสร้างจุดข้อมูลขีดจำกัดของตัวเอง”

รู้สึกสับสน? พวกเราด้วย แต่ถึงแม้จะมีรูปแบบประโยคที่น่าสับสนของเครื่องมือ NLG ก็ตาม การทดลองด้วยปัญญาประดิษฐ์ (AI) นี้ไม่ได้ช่วยอะไรเลย ทำให้เราตระหนักดีว่าการได้ผลลัพธ์ที่ดีที่สุดจาก AI นั้น การค้นหาแอปพลิเคชันที่เหมาะสมมีความสำคัญ—นั่นคือเหตุผลที่เราเขียนคู่มือนี้เพื่อช่วยคุณ

เราได้พูดคุยกับ Thomas Wood ที่ปรึกษาด้านวิทยาศาสตร์ข้อมูลของ Fast Data Science และเขาช่วยแบ่งหัวข้อด้วยเงื่อนไขที่เข้าใจง่าย ด้วยความช่วยเหลือของ Wood เราจะอธิบายความแตกต่างระหว่างวิธีการแมชชีนเลิร์นนิงทั่วไปสองวิธี การเรียนรู้ภายใต้การดูแลและไม่ได้รับการดูแล และกรณีการใช้งานใดที่เหมาะสมที่สุดสำหรับแต่ละวิธี

หากเพิ่งเคยใช้แมชชีนเลิร์นนิง ทบทวนแนวคิดหลักเหล่านี้ก่อนเข้าสู่ส่วนอื่นๆ ของบทความนี้:

  • การเรียนรู้ของเครื่อง (ML) คือชุดย่อยของปัญญาประดิษฐ์ (AI) ที่แก้ปัญหาโดยใช้อัลกอริทึมและแบบจำลองทางสถิติเพื่อดึงความรู้จากข้อมูล พูดอย่างกว้างๆ โมเดลการเรียนรู้ของเครื่องทั้งหมดสามารถแบ่งออกเป็นการเรียนรู้ภายใต้การดูแลหรือการเรียนรู้ที่ไม่มีผู้ดูแล
  • อัลกอริทึม ในการเรียนรู้ของเครื่องเป็นขั้นตอนที่ทำงานบนข้อมูลเพื่อสร้างแบบจำลองการเรียนรู้ของเครื่อง
  • โมเดล ในการเรียนรู้ของเครื่องคือผลลัพธ์ของอัลกอริธึมการเรียนรู้ของเครื่องที่ทำงานบนข้อมูล ความหมาย โมเดลแสดงถึงสิ่งที่เรียนรู้โดยอัลกอริธึมการเรียนรู้ของเครื่อง

อะไรคือความแตกต่างที่สำคัญระหว่างการเรียนรู้ภายใต้การดูแลและการเรียนรู้ที่ไม่มีผู้ดูแล?

หากเราต้องสรุปให้เหลือเพียงประโยคเดียว ก็คงจะเป็นดังนี้: ความแตกต่างหลักระหว่างการเรียนรู้ภายใต้การดูแลและการเรียนรู้ที่ไม่ได้รับการดูแลคือการเรียนรู้ภายใต้การดูแลใช้ข้อมูลที่มีป้ายกำกับเพื่อช่วยทำนายผลลัพธ์ ในขณะที่การเรียนรู้แบบไม่มีผู้ดูแลจะไม่ใช้

อย่างไรก็ตาม มีความแตกต่างเพิ่มเติมระหว่างสองแนวทางนี้ ซึ่งเราจะชี้แจงต่อไป เพื่อให้คุณสามารถเลือกแนวทางที่ดีที่สุดสำหรับสถานการณ์ของคุณได้

แมชชีนเลิร์นนิงภายใต้การดูแลทำงานอย่างไร

เช่นเดียวกับที่เรากล่าวไว้ข้างต้น การเรียนรู้ภายใต้การดูแลจะใช้ข้อมูลที่มีป้ายกำกับเพื่อฝึกโมเดล แต่ในทางทฤษฎีหมายความว่าอย่างไร? มาดูตัวอย่างกันเพื่อเริ่มต้น

ด้วยการเรียนรู้ภายใต้การดูแล โมเดลนี้มีทั้งอินพุตและเอาต์พุตที่เกี่ยวข้อง สมมติว่าเรากำลังฝึกแบบจำลองเพื่อระบุและจำแนกผลไม้ประเภทต่างๆ ในตัวอย่างนี้ คุณจะให้รูปภาพผลไม้หลายรูปเป็นข้อมูลป้อนเข้า พร้อมด้วยรูปร่าง ขนาด สี และรสชาติของผลไม้ ถัดไป คุณจะต้องระบุชื่อผลไม้แต่ละชนิดให้กับโมเดลเป็นผลลัพธ์ของคุณ

ในที่สุด อัลกอริทึมจะเลือกรูปแบบระหว่างลักษณะของผลไม้ (อินพุต) และชื่อ (ผลลัพธ์) เมื่อเกิดเหตุการณ์นี้ขึ้น โมเดลจะได้รับอินพุตใหม่ และโมเดลจะคาดการณ์ผลลัพธ์ให้กับคุณ การเรียนรู้ภายใต้การดูแลประเภทนี้ เรียกว่า การจำแนกประเภท เป็นเรื่องธรรมดา ที่สุด

แมชชีนเลิร์นนิงทำงานอย่างไร

ตรงกันข้าม การเรียนรู้แบบ unsupervised โดยการสอนแบบจำลองเพื่อระบุรูปแบบด้วยตัวมันเอง (ด้วยเหตุนี้ unsupervised ) จากข้อมูลที่ไม่มีป้ายกำกับ ซึ่งหมายความว่ามีอินพุต แต่ไม่ใช่เอาต์พุต

เพื่อให้เข้าใจถึงวิธีการทำงาน มาต่อด้วยตัวอย่างผลไม้ที่ให้ไว้ข้างต้น ด้วยการเรียนรู้แบบไม่มีผู้ดูแล คุณจะจัดเตรียมชุดข้อมูลอินพุตให้กับโมเดล (รูปภาพของผลไม้และลักษณะของผลไม้) แต่คุณจะไม่ให้ผลลัพธ์ (ชื่อของผลไม้)

โมเดลจะใช้อัลกอริธึมที่เหมาะสมในการฝึกตัวเองเพื่อแบ่งผลไม้ออกเป็นกลุ่มต่างๆ ตามลักษณะที่คล้ายคลึงกันมากที่สุดระหว่างผลไม้เหล่านั้น การเรียนรู้แบบ unsupervised แบบนี้เรียกว่า คลัสเตอร์ เป็นเรื่องปกติมากที่สุด

ต้องการเรียกใช้แบบจำลองการเรียนรู้ของเครื่องทั้งสองอีกครั้งหรือไม่ ดูวิดีโอสั้น ๆ นี้สำหรับคำอธิบายระดับสูง:

เมื่อใดควรใช้การเรียนรู้ภายใต้การดูแลกับการเรียนรู้ที่ไม่ได้รับการดูแล

ไม่ว่าคุณจะควรใช้การเรียนรู้ภายใต้การดูแลหรือไม่อยู่ภายใต้การดูแลนั้นขึ้นอยู่กับเป้าหมายและโครงสร้างและปริมาณของข้อมูลที่คุณมี ก่อนตัดสินใจ ให้นักวิทยาศาสตร์ข้อมูลของคุณประเมินสิ่งต่อไปนี้:

  • ข้อมูลอินพุตเป็นชุดข้อมูลที่ไม่มีป้ายกำกับหรือติดป้ายกำกับหรือไม่ หากไม่มีป้ายกำกับ ทีมของคุณสามารถสนับสนุนการติดป้ายกำกับเพิ่มเติมได้หรือไม่
  • เป้าหมายที่คุณต้องการบรรลุคืออะไร? คุณกำลังทำงานกับปัญหาที่เกิดซ้ำและมีรายละเอียดชัดเจน หรืออัลกอริทึมจำเป็นต้องคาดการณ์ปัญหาใหม่หรือไม่
  • มีอัลกอริทึมที่รองรับปริมาณข้อมูลและโครงสร้างของคุณหรือไม่? พวกเขามีมิติที่คุณต้องการ (จำนวนคุณลักษณะหรือคุณลักษณะ) หรือไม่?

เมื่อใดควรใช้แมชชีนเลิร์นนิงภายใต้การดูแล

จากข้อมูลของ Gartner การเรียนรู้ภายใต้การดูแลเป็นประเภทการเรียนรู้ของเครื่องที่ได้รับความนิยมและใช้บ่อยที่สุดในสถานการณ์ทางธุรกิจ อาจเป็นเพราะแม้ว่าการจัดประเภทข้อมูลขนาดใหญ่อาจเป็นความท้าทายที่แท้จริงในการเรียนรู้ภายใต้การดูแล แต่ผลลัพธ์มีความแม่นยำและเชื่อถือได้สูง (แหล่งข้อมูลเต็มรูปแบบพร้อมให้แก่ลูกค้า)

ต่อไปนี้คือตัวอย่างกรณีการใช้งานสำหรับการเรียนรู้ภายใต้การดูแล บางอย่างเป็นข้อมูลเฉพาะอุตสาหกรรม ในขณะที่บางองค์กรสามารถนำไปใช้กับองค์กรใดก็ได้:

  • การระบุปัจจัยเสี่ยงของโรคและการวางแผนมาตรการป้องกัน
  • การจำแนกว่าอีเมลเป็นสแปมหรือไม่
  • ทำนายราคาบ้าน
  • การคาดคะเนลูกค้าปั่น
  • พยากรณ์ปริมาณน้ำฝนและสภาพอากาศ
  • ค้นหาว่าผู้ขอสินเชื่อมีความเสี่ยงต่ำหรือมีความเสี่ยงสูง
  • การทำนายความล้มเหลวของชิ้นส่วนเครื่องจักรกลในเครื่องยนต์รถยนต์
  • การทำนายคะแนนการแชร์บนโซเชียลมีเดียและคะแนนประสิทธิภาพ

Wood แบ่งปันตัวอย่างว่าเขาใช้การเรียนรู้ภายใต้การดูแลเพื่อสร้างระบบคัดแยกอีเมลขาเข้าของลูกค้าอย่างไร ด้วยความช่วยเหลือของระบบ CRM อีเมลจะถูกจัดประเภทเป็นกลุ่มที่แสดงถึงคำถามทั่วไป (เช่น ลูกค้าเปลี่ยนที่อยู่ การร้องเรียน) Wood จึงใช้หมวดหมู่เหล่านี้ในการฝึกโมเดล เพื่อที่ว่าเมื่อได้รับอีเมลขาเข้าใหม่ มันจะรู้ว่าควรกำหนดอีเมลประเภทใด เขาพูดว่า:

“การเรียนรู้ภายใต้การดูแลเป็นไปได้ในกรณีนี้เนื่องจากการมีอยู่ของระบบ CRM ซึ่งจัดเตรียม 'ป้ายกำกับ' เพื่อฝึกโมเดล หากไม่มีสิ่งเหล่านี้ ก็จะเป็นไปได้เฉพาะการเรียนรู้ที่ไม่ได้รับการดูแลเท่านั้น”

ต้องการล้างกล่องจดหมายของคุณ? เริ่มต้นใช้งานซอฟต์แวร์ CRM

เมื่อใดควรใช้แมชชีนเลิร์นนิงโดยไม่ได้รับการดูแล

ตรงกันข้ามกับการเรียนรู้ภายใต้การดูแล การเรียนรู้แบบไม่มีผู้ดูแลสามารถจัดการข้อมูลปริมาณมากในแบบเรียลไทม์ และเนื่องจากตัวแบบจะระบุโครงสร้างในข้อมูลโดยอัตโนมัติ (การจำแนกประเภท) จึงมีประโยชน์ในกรณีที่มนุษย์มีปัญหาในการค้นหาแนวโน้มภายในข้อมูลด้วยตนเอง

ตัวอย่างเช่น หากคุณพยายามแบ่งกลุ่มผู้มีโอกาสเป็นลูกค้าออกเป็นกลุ่มเพื่อวัตถุประสงค์ทางการตลาด วิธีการจัดกลุ่มแบบไม่มีผู้ดูแลจะเป็นจุดเริ่มต้นที่ดี

ต่อไปนี้คือตัวอย่างกรณีการใช้งานสำหรับการเรียนรู้แบบไม่มีผู้ดูแล:

  • การจัดกลุ่มลูกค้าตามพฤติกรรมการซื้อ
  • การค้นหาความสัมพันธ์ในข้อมูลลูกค้า (เช่น คนที่ซื้อกระเป๋าบางแบบอาจสนใจรองเท้าบางสไตล์ด้วย)
  • การแบ่งกลุ่มข้อมูลตามประวัติการซื้อ
  • จำแนกคนตามความสนใจที่แตกต่างกัน
  • การจัดกลุ่มสินค้าคงเหลือตามเมตริกการผลิตและการขาย

Wood อธิบายให้เราฟังว่าครั้งหนึ่งเขาเคยทำงานให้กับบริษัทยาที่มีโรงงานผลิตอยู่ทั่วโลก ซอฟต์แวร์ที่บริษัทใช้ในการบันทึกข้อผิดพลาดที่เกิดขึ้นในโรงงานไม่มีเมนูแบบเลื่อนลงพร้อมตัวเลือกข้อผิดพลาดทั่วไปให้เลือก

ด้วยเหตุนี้ พนักงานในโรงงานจึงบันทึกข้อผิดพลาดเป็นข้อความธรรมดา (ไม่ว่าจะเป็นภาษาอังกฤษหรือภาษาท้องถิ่น) บริษัทต้องการทราบสาเหตุของปัญหาการผลิตทั่วไป แต่ไม่มีการจัดหมวดหมู่ข้อผิดพลาด จึงเป็นไปไม่ได้ที่จะทำการวิเคราะห์ทางสถิติเกี่ยวกับข้อมูล

Wood ใช้อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลเพื่อค้นหาสิ่งที่เหมือนกันในข้อผิดพลาด เขาสามารถระบุรูปแบบที่ใหญ่ที่สุดและสร้างสถิติได้ เช่น การแจกแจงแบบแผนภูมิวงกลมของปัญหาการผลิตทั่วไปในบริษัท ไม้ พูดว่า:

“สิ่งนี้ทำให้บริษัทเห็นภาพรวมโดยย่อเกี่ยวกับปัญหาในธุรกิจของพวกเขา ซึ่งมิฉะนั้นจะต้องใช้แรงงานคนเป็นจำนวนมาก”

เตรียมพร้อมสำหรับอนาคตอันชาญฉลาด: เปิดรับแมชชีนเลิร์นนิง

แมชชีนเลิร์นนิงเป็นเครื่องมืออันทรงพลังที่สามารถช่วยคุณแก้ปัญหาทางธุรกิจและตัดสินใจโดยใช้ข้อมูลเป็นหลัก หวังว่าบทความนี้จะช่วยให้คุณมีแนวคิดเกี่ยวกับวิธีการนำแมชชีนเลิร์นนิงภายใต้การดูแลหรือไม่มีผู้ดูแลมาใช้ในองค์กรของคุณ

หากคุณพร้อมที่จะรับเอาเทคโนโลยีการเรียนรู้ของเครื่อง ขั้นตอนต่อไปคือการประเมินความสามารถของชุดซอฟต์แวร์ปัจจุบันของคุณ จากนั้นให้ถามผู้ขายของคุณสำหรับกรณีการใช้งานจากลูกค้ารายอื่นในอุตสาหกรรมของคุณที่สอดคล้องกับแอปพลิเคชันที่คุณต้องการใช้การเรียนรู้ของเครื่อง

รู้สึกว่ามีอะไรให้เรียนรู้มากกว่านี้ไหม ตรวจสอบการอ่านที่เกี่ยวข้องเหล่านี้จาก Capterra:

  • การเรียนรู้ของเครื่องคืออะไร? อภิธานศัพท์ Business Intelligence ที่จำเป็นของคุณ
  • คู่มือธุรกิจขนาดเล็กที่มีความชำนาญสำหรับการเรียนรู้ของเครื่องเทียบกับปัญญาประดิษฐ์
  • แอปพลิเคชั่นยอดนิยมของปัญญาประดิษฐ์สำหรับธุรกิจขนาดเล็ก

นอกจากนี้ ให้ตรวจสอบไดเรกทอรีซอฟต์แวร์การเรียนรู้ของเครื่องของ Capterra ซึ่งคุณสามารถอ่านบทวิจารณ์จากผู้ใช้จริงและเครื่องมือกรองตามราคาหรือคุณลักษณะ