วิธีใช้การเรียนรู้ของเครื่องในการวิเคราะห์ข้อมูลขนาดใหญ่
เผยแพร่แล้ว: 2022-09-30แมชชีนเลิร์นนิงช่วยให้องค์กรเปลี่ยนข้อมูลขนาดใหญ่เป็นข้อมูลเชิงลึกที่ช่วยเพิ่มผลกำไร เรียนรู้ว่าบิ๊กดาต้าและแมชชีนเลิร์นนิงเกี่ยวข้องกันอย่างไรและใช้งานอย่างไร
หลายปีก่อน เจ้าของธุรกิจต้องพึ่งพาหน่วยความจำในการปรับแต่งวิธีการให้บริการลูกค้า เมื่อนางสาวโจนส์เดินเข้ามา เจ้าของร้านต้องนึกถึงสิ่งที่เธอซื้อครั้งล่าสุด ไม่ว่าสุดท้ายแล้วเธอจะนำมันกลับมาหรือไม่ และเธอบ่นเกี่ยวกับมันในระหว่างการเยือนครั้งล่าสุดหรือไม่
ต้องขอบคุณบิ๊กดาต้า ข้อมูลลูกค้าและธุรกิจมากมายอยู่ใกล้แค่ปลายนิ้วคุณ คุณรู้ว่าคุณโจนส์อาศัยอยู่ที่ไหน เธอซื้ออะไรมาบ้างในช่วง 10 ปีที่ผ่านมา เธอใช้เงินไปเท่าไหร่ เธอส่งคืนสินค้าบ่อยแค่ไหน และตัวชี้วัดอื่นๆ อีกหลายสิบตัว เมื่อใช้การเรียนรู้ของเครื่อง คุณสามารถเปลี่ยนข้อมูลนี้และข้อมูลอื่นๆ ให้เป็นข้อมูลเชิงลึกที่ช่วยส่งเสริมธุรกิจได้ ต่อไปนี้คือรายละเอียดของข้อมูลขนาดใหญ่และแมชชีนเลิร์นนิง และวิธีที่คุณสามารถใช้ประโยชน์จากข้อมูลเหล่านี้เพื่อขับเคลื่อนธุรกิจของคุณ
บิ๊กดาต้าและแมชชีนเลิร์นนิงคืออะไร
บิ๊กดาต้าและแมชชีนเลิร์นนิงแตกต่างกันแต่มีความเชื่อมโยงอย่างใกล้ชิด
ข้อมูลขนาดใหญ่คืออะไร?
ข้อมูลขนาดใหญ่หมายถึงชุดข้อมูลขนาดใหญ่หรือซับซ้อนอย่างไม่น่าเชื่อ ซึ่งอาจเป็นไปไม่ได้ที่จะใช้ประโยชน์ได้หากไม่มีเครื่องมือพิเศษ ธุรกิจบางแห่งไม่จำเป็นต้องจัดการกับข้อมูลขนาดใหญ่ ตัวอย่างเช่น หากคุณมีร้านอาหารที่มีสถานที่สามแห่งที่ผลิตข้อมูลการขายและสินค้าคงคลัง นั่นไม่ใช่ "ข้อมูลขนาดใหญ่"
ในทางกลับกัน หากร้านอาหารเดียวกันนั้นเพิ่มสถานที่อีก 10 แห่งและแอปบนอุปกรณ์เคลื่อนที่ที่ช่วยให้ลูกค้าสามารถสั่งซื้อทางออนไลน์ ใช้ประโยชน์จากรางวัลความภักดี และแชทกับตัวแทนฝ่ายบริการลูกค้าผ่านข้อความ ตอนนี้คุณมีสถานการณ์ข้อมูลขนาดใหญ่ แอปเพียงอย่างเดียวอาจสร้างข้อมูลเกี่ยวกับ:
- เมนูที่ลูกค้าสั่งบ่อยที่สุด
- ช่วงเวลาของวันที่ลูกค้าสั่งซื้อ
- ที่ที่ลูกค้าสั่งอาหารจากข้อมูลตำแหน่งทางภูมิศาสตร์
- ที่ที่ลูกค้าอาศัยอยู่และสถิติการซื้อที่เกี่ยวข้องกับแต่ละเมือง
- ข้อมูลการขายจากแต่ละสถานที่
- วิธีที่ลูกค้าใช้คะแนนสะสม
- ข้อมูลการจัดซื้อในช่วงพีคและช่วงวันหยุดยาว
ตัวอย่างเหล่านี้เป็นเพียงรอยขีดข่วนบนพื้นผิว แอปประเภทนี้สามารถสร้างชุดข้อมูลได้หลายสิบชุด นอกจากนี้ ข้อมูลจะถูกสตรีมเข้ามาอย่างสม่ำเสมอ นั่นคือข้อมูลขนาดใหญ่
การเรียนรู้ของเครื่องคืออะไร?
การเรียนรู้ของเครื่อง (ML) หมายถึงการใช้คอมพิวเตอร์เพื่อจดจำรูปแบบในข้อมูล แมชชีนเลิร์นนิงทำสิ่งนี้โดยใช้อัลกอริทึม ซึ่งเป็นชุดคำสั่งที่วางไว้ทีละขั้นตอน โมเดลการเรียนรู้ของเครื่องใช้ขั้นตอนในอัลกอริทึมเพื่อเรียนรู้รูปแบบ ซึ่งรวมถึงการรับรู้เมื่อรูปแบบถูกทำลายและเรียนรู้วิธีเปรียบเทียบรูปแบบซึ่งกันและกัน
ตัวอย่างเช่น สมมติว่าคุณต้องการสร้างอัลกอริธึมการเรียนรู้ของเครื่องเพื่อวิเคราะห์ข้อมูลการขาย คุณมีตัวเลขยอดขายห้าปี เป้าหมายของคุณคือเพิ่มผลกำไรในช่วงฤดูร้อนให้สูงสุดโดยหาว่าผลิตภัณฑ์ใดที่คุณควรเสนอขายระหว่างเดือนมิถุนายนถึงสิงหาคม
คุณสามารถตั้งโปรแกรมระบบการเรียนรู้ของเครื่องเพื่อ:
- รวบรวมข้อมูลการขายสำหรับแต่ละผลิตภัณฑ์ของคุณแบบเดือนต่อเดือน
- ระบุผลิตภัณฑ์ที่มียอดขายสูงสุดระหว่างเดือนมิถุนายนถึงเดือนสิงหาคม
- คาดการณ์ยอดขายที่เกี่ยวข้องกับการนำเสนอแต่ละผลิตภัณฑ์
- บอกคุณว่าผลิตภัณฑ์ใดที่จะนำเสนอ และคุณควรเสนอผลิตภัณฑ์เหล่านั้นในเดือนมิถุนายน กรกฎาคม สิงหาคม หรือตลอดสามเดือนหรือไม่
แน่นอน คุณสามารถก้าวไปอีกขั้นของ ML และรวมต้นทุนขาย (COGS) ของคุณสำหรับแต่ละผลิตภัณฑ์ ซึ่งรวมถึงการจัดส่ง แรงงาน การจัดเก็บ และข้อมูลอื่นๆ โมเดล ML ของคุณสามารถแนะนำไม่เพียงแค่ผลิตภัณฑ์ที่มีปริมาณการขายช่วงฤดูร้อนสูงสุดเท่านั้น แต่ยังสามารถบอกคุณได้ว่าผลิตภัณฑ์ใดมีกำไรสุทธิมากที่สุด
จากนั้นคุณสามารถใช้แบบจำลองเดียวกันนี้เพื่อนำเสนอข้อมูลเชิงลึกด้านการขายสำหรับ:
- ผลิตภัณฑ์ส่วนบุคคลในช่วงหนึ่งปี
- ผลิตภัณฑ์ใหม่ที่มุ่งเป้าไปที่ตลาดเป้าหมายที่คล้ายกัน
- ทุกเดือนเว้นปี
การเรียนรู้ของเครื่องในข้อมูลขนาดใหญ่คืออะไร?
ในบริบทของข้อมูลขนาดใหญ่ เมื่อใดก็ตามที่อาจมีรูปแบบในข้อมูล คุณสามารถใช้การเรียนรู้ของเครื่องเพื่อค้นพบและให้ข้อมูลเชิงลึกที่เป็นประโยชน์ นอกจากนี้ คุณสามารถใช้ ML เพื่อให้คำแนะนำตามรูปแบบที่อัลกอริทึมวิเคราะห์
แมชชีนเลิร์นนิงทำงานอย่างไรกับบิ๊กดาต้า
แอปพลิเคชันที่ได้รับความนิยมมากที่สุดอย่างหนึ่งของการเรียนรู้ด้วยเครื่องคือยานพาหนะที่ขับเคลื่อนด้วยตนเอง รถใช้แมชชีนเลิร์นนิงเพื่อตัดสินใจว่าจะทำอย่างไรกับข้อมูลที่รวบรวมจากสภาพแวดล้อมและยานพาหนะอื่นๆ
ตัวอย่างเช่น เมื่อกล้องในรถยนต์ที่ขับด้วยตนเอง "เห็น" ป้ายหยุด พวกเขาสามารถรับรู้ได้และเบรกโดยอัตโนมัติ กระบวนการเบื้องหลังการตัดสินใจนี้น่าจะเริ่มจากกลุ่มนักวิทยาศาสตร์ข้อมูลทดสอบอัลกอริธึมการเรียนรู้ของเครื่องหลายตัว ในระดับสูง ดำเนินการสามขั้นตอน:
1. การฝึกอบรม
ในการวิเคราะห์ข้อมูลขนาดใหญ่ ขั้นแรกนักวิทยาศาสตร์ด้านข้อมูลจะใช้ชุดการฝึกอบรมเพื่อสอนอัลกอริทึมอย่างน้อยหนึ่งอย่างถึงสิ่งที่พวกเขาควรมองหา
ตัวอย่างเช่น เมื่อมีป้ายหยุด ชุดการฝึกจะเป็นภาพป้ายหยุดหลายพันภาพ วิศวกรข้อมูลจะนำเสนอภาพป้ายหยุดจากมุมต่างๆ ในสภาพแสงที่แตกต่างกัน และแม้กระทั่งต้นไม้หรือวัตถุอื่นๆ ที่ขวางกั้นบางส่วน
ในตอนท้ายของขั้นตอนการฝึกอบรม ความหวังคืออัลกอริทึมได้ระบุรูปแบบในรูปทรงและสีของป้ายหยุด กล่าวอีกนัยหนึ่งคือรู้ว่าป้ายหยุด "มีลักษณะอย่างไร" และในสภาพแสงที่แตกต่างกันและจากมุมต่างๆ
2. การตรวจสอบความถูกต้อง
ชุดตรวจสอบความถูกต้องจะใช้เพื่อค้นหาว่าแบบจำลอง ML นั้นใช้ชุดข้อมูลขนาดใหญ่ที่แตกต่างกันโดยสิ้นเชิงเพียงใด จุดประสงค์ของขั้นตอนการตรวจสอบความถูกต้องคือการหาวิธีปรับแต่งโมเดล ML
ตัวอย่างเช่น สมมติว่าโมเดล ML ที่ออกแบบมาเพื่อระบุสัญญาณหยุดมีความแม่นยำ 95% และภาพที่ผิดพลาดทั้งหมดนั้นมืดมาก นักพัฒนาสามารถใช้สูตรอื่นที่เพิ่มคอนทราสต์ของแต่ละภาพ ทำให้ลักษณะสำคัญง่ายขึ้นสำหรับโมเดล ML เพื่อดู
3. การทดสอบ
ขั้นตอนการทดสอบเกี่ยวข้องกับการป้อนข้อมูลขนาดใหญ่ให้กับโมเดล ML ซึ่งแตกต่างจากที่เห็นโดยสิ้นเชิงระหว่างขั้นตอนการฝึกอบรมและการตรวจสอบความถูกต้อง

ตัวอย่างเช่น ในการทดสอบรูปแบบป้ายหยุด โปรแกรมเมอร์สามารถแสดงรูปภาพของป้ายประเภทต่างๆ ได้ 250,000 ภาพในแบบจำลอง ML ซึ่งบางภาพเป็นป้ายหยุด จากนั้นพวกเขาจะวิเคราะห์ผลลัพธ์เพื่อดูว่าแบบจำลองสามารถแยกแยะสัญญาณหยุดได้อย่างแม่นยำเพียงใด - รวมทั้งหลีกเลี่ยงการระบุสัญญาณประเภทอื่นอย่างไม่ถูกต้อง
ความท้าทายกับแมชชีนเลิร์นนิงและบิ๊กดาต้า
ความท้าทายที่น่ากลัวที่สุดสองประการที่นักวิทยาศาสตร์ด้านข้อมูลกำลังเผชิญโดยใช้ ML เพื่อศึกษาข้อมูลขนาดใหญ่คือความไม่ถูกต้องและประเด็นขัดแย้งด้านจริยธรรม
1. ความไม่ถูกต้อง
โดยธรรมชาติแล้ว แม้จะมีกระบวนการคำนวณขั้นสูงที่เกี่ยวข้อง คุณยังคงต้องเผชิญกับองค์ประกอบของการลองผิดลองถูกทุกครั้งที่คุณใช้การเรียนรู้ของเครื่องในการวิเคราะห์ข้อมูลขนาดใหญ่ เนื่องจากคุณไม่มีทางรู้ว่าปัจจัยใดที่อาจบิดเบือนผลลัพธ์ของคุณในขณะที่คุณฝึก ตรวจสอบ และทดสอบแบบจำลองของคุณ
ตัวอย่างเช่น เมื่อระบุภาพ เช่น ป้ายหยุดหรือใบหน้ามนุษย์ มีหลายปัจจัยที่อาจส่งผลต่อประสิทธิภาพที่ไม่ดีในแบบจำลอง ML ของคุณ ตัวอย่างเช่น สมมติว่าคุณกำลังพัฒนาโมเดลการเรียนรู้ของเครื่องเพื่อปรับปรุงระบบรักษาความปลอดภัยของบริษัทของคุณ โดยเฉพาะอย่างยิ่ง คุณต้องการโมเดลที่สามารถระบุใบหน้าของผู้บริหารและบุคคลระดับสูงอื่นๆ เพื่อให้สามารถเข้าถึงพื้นที่อ่อนไหวของอาคารได้ ในระหว่างขั้นตอนการตรวจสอบความถูกต้อง ระบบมีความแม่นยำเพียง 65% เท่านั้น แต่อาจเป็นเพราะตัวแปรหลายอย่าง เช่น:
- ภาพพิกเซลของใบหน้า
- ภาพที่หลุดโฟกัส
- บุคคลที่ละสายตาจากการสแกนใบหน้า
- บุคคลที่ตัดสินใจสวมแว่นกันแดด หน้ากาก ผ้าพันคอ หรือสิ่งอื่นใดที่อาจบิดเบือนผลการระบุตัวตน
2. ประเด็นขัดแย้งทางจริยธรรม
นอกจากนี้ยังมีความท้าทายด้านจริยธรรม ตัวอย่างเช่น สมมติว่าแผนกทรัพยากรบุคคลใช้แมชชีนเลิร์นนิงเพื่อระบุผู้สมัครที่มีคุณสมบัติเหมาะสมที่สุด โดยดึงพวกเขาออกจากกองดิจิทัล 1,500 เรซูเม่
หากโมเดล ML ได้รับการฝึกอบรมโดยใช้บริษัทและแผนกจ้างงานที่ดำเนินการโดยผู้ชายเท่านั้น ข้อมูลอาจรวมถึงอคติ ผู้ชายบางคนอาจมีแนวโน้มที่จะจ้างผู้ชายคนอื่นมากกว่า—ด้วยเหตุผลอื่นนอกเหนือจากคุณธรรมหรือคุณสมบัติ ดังนั้น ผู้สมัครที่ "ประสบความสำเร็จ" ซึ่งวิศวกรได้ฝึกฝนโมเดล ML เพื่อค้นหาอาจเป็นเพศชายโดยส่วนใหญ่ นางแบบจึงแนะนำผู้ชายแทนผู้หญิงที่อาจมีคุณสมบัติมากกว่า
ในบริบททางธุรกิจ บิ๊กดาต้าและแมชชีนเลิร์นนิงเกี่ยวข้องกันอย่างไร
ในบริบททางธุรกิจ แมชชีนเลิร์นนิงใช้บิ๊กดาต้าที่องค์กรของคุณสร้างขึ้นเพื่อปรับปรุงหรือทำให้กระบวนการที่สำคัญต่อธุรกิจเป็นไปโดยอัตโนมัติ และปรับปรุงความปลอดภัยและความปลอดภัย แอปพลิเคชันที่มีศักยภาพนั้นไม่มีที่สิ้นสุดอย่างแท้จริง และมีความหลากหลายเท่ากับข้อมูลประเภทต่างๆ ที่คุณสร้างขึ้น
ตัวอย่างเช่น โรงงานหรือโรงงานผลิตสามารถใช้แมชชีนเลิร์นนิงเพื่อปรับอุณหภูมิและความชื้นให้เหมาะสมสำหรับพื้นโรงงาน ตัวอย่างเช่น โมเดลแมชชีนเลิร์นนิงสามารถระบุ:
- ระดับอุณหภูมิและความชื้นที่ช่วยเพิ่มประสิทธิภาพการทำงานของพนักงานในขณะที่ลดจำนวนการพักโดยไม่ได้วางแผนไว้ให้น้อยที่สุด
- ระดับอุณหภูมิและความชื้นในอุดมคติสำหรับอุปกรณ์ที่มีความละเอียดอ่อนที่อาจเสื่อมสภาพเร็วขึ้นเมื่ออยู่ในสภาวะที่ไม่ถูกต้อง
- สภาวะอุณหภูมิและความชื้นที่คุ้มค่าที่สุด โดยพิจารณาจากค่าใช้จ่ายในการเดินระบบ HVAC และเครื่องลดความชื้น
จากนั้นระบบสามารถใช้เพื่อควบคุมระบบบรรยากาศของคุณโดยอัตโนมัติเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด
แมชชีนเลิร์นนิงและการวิเคราะห์ข้อมูลขนาดใหญ่ใช้ในด้านการตลาดอย่างไร
การตลาดนำเสนอแอพพลิเคชั่นการเรียนรู้ของเครื่องและการวิเคราะห์ข้อมูลขนาดใหญ่ที่มีแนวโน้มมากที่สุด พิจารณาตัวอย่างชีวิตจริงต่อไปนี้
Albert ของ Harley Davidson ช่วยเพิ่มโอกาสในการขายได้ถึง 2,930%
Harley Davidson สร้างหุ่นยนต์ชื่อ Albert ซึ่งใช้แมชชีนเลิร์นนิงในการตัดสินใจทางการตลาด [1] นี่คือวิธีที่อัลเบิร์ตช่วยผู้บริหารของ Harley Davidson ออกไปในยามพระอาทิตย์ตกดินที่สว่างไสว
Harley Davidson ต้องการยกระดับความสัมพันธ์ที่มีอยู่กับลูกค้าเดิม พวกเขาใช้อัลเบิร์ตวิเคราะห์:
- มีคนซื้อบ่อยแค่ไหน
- ลูกค้าเหล่านี้ใช้จ่ายไปเท่าไร
- ลูกค้าใช้เวลาเรียกดูเว็บไซต์ของ Harley Davidson นานเท่าใด
อัลเบิร์ตจึงใช้ข้อมูลนี้เพื่อแยกลูกค้าออกเป็นกลุ่มต่างๆ ทีมการตลาดจึงสร้างแคมเปญทดสอบสำหรับลูกค้าแต่ละประเภท หลังจากทดสอบความสำเร็จของแคมเปญแล้ว ทีมงานได้ขยายขนาดเพื่อให้เข้าถึงกลุ่มลูกค้าก่อนหน้าในวงกว้าง
ด้วยเหตุนี้ Harley Davidson จึงเพิ่มยอดขายได้ถึง 40% พวกเขายังสร้างโอกาสในการขายเพิ่มขึ้น 2,930% ครึ่งหนึ่งของผู้นำเหล่านั้นถูกระบุโดยตรงโดยอัลเบิร์ตเขา [มัน?] ตนเอง Albert ศึกษาโปรไฟล์ของลีดที่มีแนวโน้มสูงที่จะแปลงเป็นลูกค้าที่ชำระเงิน จากนั้นจึงศึกษาโปรไฟล์ข้อมูลของผู้ใช้รายอื่นและระบุ "คนที่มีลักษณะคล้ายกัน" หรือผู้ที่มีสิ่งที่เหมือนกันมากกับลูกค้าที่มี Conversion สูง
ไม่ว่าคุณจะพยายามคิดว่า Ms. Jones จะซื้ออะไรต่อไปหรือเพิ่มประสิทธิภาพของสิ่งอำนวยความสะดวกในการผลิตที่ซับซ้อน การเรียนรู้ของเครื่องสามารถเปลี่ยนข้อมูลขนาดใหญ่ที่สุ่มดูเหมือนเป็นข้อมูลเชิงลึกที่เปลี่ยนแปลงได้ ด้วยการระดมสมองและความคิดสร้างสรรค์เพียงเล็กน้อย คุณจะสามารถค้นหาวิธีใช้ ML และบิ๊กดาต้าเพื่อแซงหน้าคู่แข่งและนำองค์กรของคุณไปสู่อีกระดับ
ต้องการเรียนรู้เพิ่มเติมเกี่ยวกับเครื่องมือที่สามารถช่วยเหลือข้อมูลขนาดใหญ่ได้หรือไม่
ซอฟต์แวร์ข้อมูลขนาดใหญ่สามารถช่วยให้แน่ใจว่าธุรกิจของคุณจะได้รับประโยชน์สูงสุดจากข้อมูลขนาดใหญ่และการวิเคราะห์ เรียกดูและเปรียบเทียบเครื่องมือยอดนิยมบางส่วน อ่านบทวิจารณ์ และค้นหาโซลูชันที่ดีที่สุดสำหรับความต้องการทางธุรกิจเฉพาะของคุณ
แหล่งที่มา
1. Harley Davidson NYC ฮิตตลอดกาลกับ Albert, Albert.ai