การทดสอบหลายตัวแปร: วิธีเรียกใช้การทดสอบที่ดีที่สุดเพื่อผลลัพธ์ที่ดีที่สุด
เผยแพร่แล้ว: 2017-02-09การทดสอบ A/B เป็นวิธีที่ง่ายที่สุดวิธีหนึ่งในการหาแนวคิดในการเพิ่มประสิทธิภาพสำหรับหน้า Landing Page หลังการคลิกของคุณ แต่ก็ไม่ใช่วิธีที่มีประสิทธิภาพที่สุดเสมอไป
ก่อนที่คุณจะเริ่มทดสอบทีละสอง สาม หรือสี่หน้า ค้นหาวิธีทดสอบเพิ่มเติม และค้นหาองค์ประกอบที่ผสมผสานกันดีที่สุดเพื่อแปลงผู้เยี่ยมชมของคุณ
คลิกเพื่อทวีต
การทดสอบ A/B คืออะไร
การทดสอบ A/B หรือที่เรียกว่าการทดสอบแยก ช่วยให้คุณสามารถเปรียบเทียบหน้าเว็บสองเวอร์ชันที่แตกต่างกันเพื่อพิจารณาว่าเวอร์ชันใดเปลี่ยนผู้เยี่ยมชมได้ดีกว่า
ทั้งสองหน้าสามารถ:
- แตกต่างกันเล็กน้อย
หากคุณมีการออกแบบที่มีการแปลงสูงและต้องการทราบวิธีการปรับปรุงองค์ประกอบเดียว คุณสามารถทดสอบสองหน้าที่ต่างกันด้วยความแตกต่างเพียงสิ่งเดียว หากคุณต้องการดูว่าความอยากรู้อยากเห็นหรือพาดหัวที่เน้นข่าวทำงานได้ดีกว่าหรือไม่ คุณสามารถทดสอบพาดหัวเทียบกับพาดหัวข่าวได้ หากต้องการดูว่าวิดีโอหรือ gif ส่งผลต่อ Conversion มากกว่ากันหรือไม่ คุณสามารถทดสอบได้ในแต่ละหน้า
หลังจากเพิ่มปริมาณการเข้าชมให้เท่ากันแล้ว ผู้ที่สร้าง Conversion ได้มากที่สุดคือผู้ชนะ และเหตุผลที่ทำให้หน้าหนึ่งสร้าง Conversion มากขึ้นก็ชัดเจน เนื่องจากมีความแตกต่างเพียงข้อเดียวระหว่างสองหน้า
- แตกต่างกันอย่างมาก
คุณยังสามารถทดสอบสองหน้าที่แตกต่างกันได้หลายวิธี หน้าเดิมของคุณสามารถมีพาดหัว ภาพเด่น และปุ่มเรียกร้องให้ดำเนินการแตกต่างจากหน้ารูปแบบใหม่ของคุณ การทดสอบอาจมีลักษณะดังนี้:
หลังจากเพิ่มปริมาณการเข้าชมที่เท่ากันให้กับทั้งหน้าเดิม (A หรือ "ควบคุม") และหน้ารูปแบบใหม่ (B) แล้ว ผู้ที่ทำ Conversion ได้ดีกว่าคือผู้ชนะ แต่แตกต่างจากเมื่อคุณเปลี่ยนเพียงองค์ประกอบเดียวต่อการทดสอบ เมื่อคุณทดสอบหน้าที่แตกต่างกันอย่างมาก คุณจะไม่มีทางระบุเหตุผลที่หน้าใดหน้าหนึ่งชนะได้
จากผลลัพธ์ของตัวอย่างด้านบน เราจะทราบเพียงว่ารุ่น "b" ดีกว่ารุ่น "a" แต่ไม่ใช่เหตุผล ว่าทำไม จึงดีกว่า เนื่องจากมีสาเหตุหลายประการที่สามารถระบุสาเหตุได้ การแปลงอาจมาจากการปรับแถบนำทางจากซ้ายไปขวา หรือจากแบบฟอร์มลงทะเบียนจากบนลงล่าง สิ่งที่คุณบอกได้อย่างแน่นอนเมื่อคุณทดสอบ A/B กับการออกแบบที่แตกต่างกันอย่างมากก็คือ หน้าหนึ่งดีกว่าอีกหน้าหนึ่ง
แต่มีการทดสอบอีกประเภทหนึ่งที่คุณสามารถเรียกใช้เพื่อพิจารณาว่าการเปลี่ยนแปลงขององค์ประกอบหลายรายการโต้ตอบกันอย่างไร เรียกว่าการทดสอบหลายตัวแปร
การทดสอบหลายตัวแปรคืออะไร?
การทดสอบหลายตัวแปรเป็นกระบวนการที่เครื่องมือเพิ่มประสิทธิภาพใช้เพื่อเปรียบเทียบหน้าเว็บสองหน้าที่แตกต่างกัน วิธีการนี้มุ่งเน้นไปที่การเปรียบเทียบการเปลี่ยนแปลงเล็กน้อยระหว่างองค์ประกอบหลายๆ อย่าง จากนั้นจึงวัดว่าองค์ประกอบเหล่านั้นมีปฏิสัมพันธ์กันอย่างไร โดยมีเป้าหมายเพื่อค้นหาประสิทธิภาพสูงสุด
ความแตกต่างระหว่างการทดสอบ A/B และการทดสอบหลายตัวแปร
คุณอาจเคยอ่านกรณีศึกษาการทดสอบ A/B จำนวนมากที่พบว่าหน้าเว็บที่ชนะโดยการเปรียบเทียบบรรทัดแรกหนึ่งกับอีกหน้าหนึ่ง หรือรูปภาพเด่นเทียบกับวิดีโอ หรือคำกระตุ้นการตัดสินใจหนึ่งหน้าเทียบกับข้อความที่แตกต่างกันเล็กน้อย แม้ว่า จะสามารถ ใช้ทำสิ่งนั้นได้อย่างแม่นยำ แต่เครื่องมือเพิ่มประสิทธิภาพของ Widemile ระบุว่ามีวิธีที่เหมาะสมกว่าในการใช้การทดสอบ A/B:
พวกเขากล่าวว่าการใช้งานในอุดมคติสำหรับการทดสอบ A/B คือสำหรับ "การทดสอบหน้าเว็บที่แตกต่างกันสองหน้าหรือมากกว่านั้น" ในแง่ของการทดสอบ การทดสอบ A/B จะดีกว่าเพื่อค้นหาสิ่งที่เรียกว่า "ค่าสูงสุดสากล" และการทดสอบหลายตัวแปรเพื่อปรับแต่งไปสู่ "ค่าสูงสุดเฉพาะที่"
ค่าสูงสุดทั่วโลกและค่าสูงสุดในพื้นที่
แม้จะยากแค่ไหน ลองนึกภาพสักนิดว่าคุณไม่เคยมีไอศกรีมสักลูกในชีวิตของคุณ และคุณกำลังยืนอยู่ในร้านไอศกรีมและพยายามตัดสินใจว่าคุณต้องการซื้อไอศกรีมรสใดจาก 30 รสที่แตกต่างกัน .
มีช็อกโกแลต 10 ชนิด วานิลลา 10 ชนิด และสตรอเบอร์รี่ 10 ชนิด คุณจะลองทั้ง 30 รสชาติก่อนที่จะตัดสินใจว่าคุณต้องการรสชาติไหน?
อาจจะไม่. คุณอาจจะลองชิมรสชาติที่แตกต่างกันอย่างมากอย่างใดอย่างหนึ่ง เช่น ช็อกโกแลต 1 สตรอเบอร์รี่ และวานิลลา 1 อย่าง เพื่อจำกัดให้แคบลงว่าคุณจะชอบรสชาติใดมากที่สุด หากคุณค้นพบว่าคุณชอบช็อกโกแลตมากกว่าวานิลลาและสตรอเบอร์รี่ คุณจะเริ่มลองรสชาติต่างๆ เช่น "แป้งคุกกี้ช็อกโกแลตชิป" และ "เนยถั่วช็อกโกแลต" และ "ช็อกโกแลตฟัดจ์" เพื่อตัดสินใจว่าช็อกโกแลตใดที่คุณชอบมากที่สุด
ในแง่สถิติ เราจะเรียกความหลากหลายที่คุณชอบมากที่สุด (ช็อกโกแลต วานิลลา หรือสตรอเบอร์รี่) ว่าสูงสุดทั่วโลก นี่คือรสชาติที่อร่อยที่สุดสำหรับคุณจากสามประเภทที่แตกต่างกันอย่างมาก รสชาติเฉพาะของความหลากหลาย (ช็อกโกแลตฟัดจ์, แป้งคุกกี้ช็อกโกแลตชิป, เนยถั่วช็อกโกแลต) จะเป็นรสชาติสูงสุดในท้องถิ่น เป็นรุ่นที่ดีที่สุดของความหลากหลายที่คุณเลือก
ในฐานะนักเพิ่มประสิทธิภาพ คุณต้องการทดสอบในทำนองเดียวกัน คุณต้องการค้นหาหน้าเว็บที่แปลงผู้เข้าชมของคุณได้ดีที่สุด (สูงสุดทั่วโลก) จากนั้นปรับแต่งองค์ประกอบเฉพาะในหน้านั้นเพื่อปรับปรุงให้เป็นหน้าที่มีการแปลงสูงสุด (สูงสุดในท้องถิ่น) ที่คุณกำลังมองหาจะเป็นตัวกำหนดการทดสอบที่คุณใช้
เมื่อใดควรใช้การทดสอบ A/B และเมื่อใดควรใช้การทดสอบหลายตัวแปร
การทดสอบ A/B ดีที่สุดสำหรับการทดสอบค่าสูงสุดทั่วโลก พวกเขาทำได้ดีที่สุดในการค้นหาว่าผู้เข้าชมของคุณต้องการเปลี่ยนหน้าใด ใช้ตัวอย่างนี้จาก MarketingExperiments ซึ่งใช้การทดสอบ A/B เพื่อช่วยให้ Investopedia เพิ่มการแปลงสำหรับจดหมายข่าว Investopedia Advisor
ข้อเสนอนั้นเรียบง่าย — จดหมายข่าวฟรีพร้อมคำแนะนำเกี่ยวกับหุ้น — และหน้าเดิมก็สะท้อนให้เห็นเช่นนั้น มันไม่ยาว ซับซ้อน หรือยุ่งเหยิงด้วยองค์ประกอบมากมาย โดยมีจุดเด่นอยู่ที่แบบฟอร์มบันทึกโอกาสในการขายแบบฟิลด์เดียว สำเนาสัญลักษณ์แสดงหัวข้อย่อย และอินโฟกราฟิก:
แต่ถึงแม้จะมีข้อเสนอฟรีที่มีค่า แต่ก็มีการแปลงเพียง 1.33% ทีมงานของ MarketingExperiments ตัดสินใจที่จะยกเครื่องหน้าใหม่ทั้งหมด พวกเขาเปลี่ยนบรรทัดแรก รูปแบบ ปุ่ม CTA และเพิ่มป้าย เหนือสิ่งอื่นใด จากนั้น พวกเขาทดสอบ A/B กับหน้าใหม่เทียบกับหน้าเดิม และพบว่าหน้าใหม่มีการแปลงสูงขึ้น 89.4% นี่คือสิ่งที่ดูเหมือน:
สิ่งสำคัญคือต้องจำไว้ว่าด้วยการทดสอบ A/B นี้ ผู้ทดสอบไม่เข้าใจว่า ทำไม หน้าใหม่จึงแปลงได้ดีกว่าหน้าเก่า แต่พวกเขาพบตัวแปลงใหม่ที่สูงกว่า กล่าวอีกนัยหนึ่งคือพวกเขาพบค่าสูงสุดใหม่ทั่วโลก เมื่อถึงจุดนั้น ถ้าต้องการ พวกเขาสามารถปรับแต่งหน้านี้ด้วยการทดสอบหลายตัวแปรเพื่อพิจารณาว่าชุดค่าผสมใดที่แปลงผู้เข้าชมได้มากที่สุด
นั่นคือสิ่งที่ผู้ทดสอบในตัวอย่างสมมุตินี้จาก Optimizely ต้องการทำ พวกเขาต้องการทราบว่าชุดข้อความพาดหัวและรูปภาพใดที่แปลงผู้เข้าชมได้มากที่สุด
ดังนั้น พวกเขาจึงสร้างหน้าเว็บหลายหน้าโดยใช้พาดหัวและรูปภาพต่างๆ กัน เพื่อดูว่าหน้าใดทำงานได้ดีที่สุด
ไม่ว่าเวอร์ชันใดในสี่เวอร์ชันนี้จะมาจากการทดสอบที่มีอัตรา Conversion สูงสุดจะเป็นผู้ชนะ หากสองเวอร์ชันที่มีหลอดไฟทำงานได้ดีกว่าสองเวอร์ชันที่มีเกียร์ คุณอาจสรุปได้ว่ารูปภาพหลอดไฟมีผลกระทบมากที่สุดต่อการแปลง จากตรงนั้น คุณจะเห็นว่าบรรทัดแรกใดที่สร้าง Conversion มากกว่ากัน และใช้หน้านั้น
วิธีดำเนินการทดสอบหลายตัวแปร
ไม่กี่ปีที่ผ่านมา เมื่อ Paras Chopra ผู้ก่อตั้ง VWO ต้องการเพิ่มการดาวน์โหลดบนหน้าเว็บของเขา เขาใช้การทดสอบหลายตัวแปรเพื่อหาวิธีการ หากคุณคุ้นเคยกับขั้นตอนในการดำเนินการทดสอบ A/B คุณจะจำขั้นตอนส่วนใหญ่ในตัวอย่างการทดสอบหลายตัวแปรนี้ได้
1. ระบุปัญหา
ก่อนที่คุณจะเริ่มปรับปรุงหน้าเว็บ วิธีที่ดีที่สุดคือการเจาะลึกข้อมูลและดูว่าผู้เยี่ยมชมมีปฏิสัมพันธ์กับหน้าเว็บอย่างไร สิ่งที่เขาพบคือผู้คนไม่คลิกปุ่ม "ดาวน์โหลด" มากเท่าที่เขาคาดหมายไว้ ดังนั้นเขาจึงสำรวจหน้าเว็บเพื่อหาสาเหตุ
2. กำหนดสมมติฐาน
หลังจากตรวจสอบอย่างละเอียด เขาก็ตระหนักว่าลิงก์ดาวน์โหลดนั้นไม่มีใครสังเกตเห็นได้ เขาจึงตั้งสมมุติฐานในการปรับปรุงเพจขึ้นมาว่า
วิธีแก้ไขที่ชัดเจนในการทำให้ผู้เข้าชมสังเกตเห็นลิงก์ดาวน์โหลดคือการทำให้ส่วนดาวน์โหลดเป็นส่วนที่โดดเด่นที่สุดของหน้า ในการออกแบบหน้า ขนาดและสีของส่วนหัว "ดาวน์โหลด" เข้ากันได้ดีกับส่วนอื่นๆ ของหน้า ซึ่งทำให้ผู้คนขาดลิงก์ดาวน์โหลด
ด้วยการทำให้ลิงก์ "ดาวน์โหลด" มองเห็นได้ชัดเจนยิ่งขึ้น เขาเชื่อว่าจะสามารถเพิ่มการแปลงได้ นี่คือวิธีที่เขาตัดสินใจทำ
3. สร้างรูปแบบต่างๆ
ตอนนี้ได้เวลาสร้างหน้ารูปแบบต่างๆ สำหรับการทดสอบแล้ว ตามที่ Paras:
สำหรับการทดสอบหลายตัวแปร ฉันได้เลือกสองปัจจัยในหน้าสำหรับสร้างรูปแบบต่างๆ ได้แก่ ส่วนหัว "ดาวน์โหลด" ในแถบด้านข้างและลิงก์ดาวน์โหลด "PDFProducer" ที่ด้านล่าง จุดเน้นของการทดสอบคือการสังเกตผลกระทบของคำว่า "ฟรี" และผลของการเน้นส่วนดาวน์โหลด
นี่คือวิธีที่เขาตัดสินใจทำให้ส่วนดาวน์โหลดดูโดดเด่นและดึงดูดใจมากขึ้น
สำหรับลิงก์ "ดาวน์โหลด" ดั้งเดิม เขาได้ทดสอบรูปแบบที่แตกต่างกันสามแบบ:
- “ดาวน์โหลด” สีแดง
- “ดาวน์โหลดฟรี” สีแดง
- “ดาวน์โหลด” ในสีเริ่มต้น แต่ขนาดตัวอักษรที่ใหญ่กว่า
สำหรับลิงก์ “PDFProducer” ดั้งเดิม เขาทดสอบรูปแบบที่แตกต่างกันสองรูปแบบ:
- “PDFProducer” เป็นสีเริ่มต้น แต่ขนาดตัวอักษรใหญ่กว่า
- “PDFProducer” สีแดง
นี่คือลักษณะของชุดค่าผสมทั้งหมด:
ด้วยลิงก์ดาวน์โหลดสี่เวอร์ชัน (รวมถึงต้นฉบับ) และข้อความ “PDFProducer” สามเวอร์ชัน (รวมถึงต้นฉบับอีกครั้ง) รูปแบบที่แตกต่างกัน 12 แบบจึงถูกสร้างขึ้นเพื่อดำเนินการทดสอบแฟกทอเรียลเต็มรูปแบบ แฟกทอเรียลแบบเต็มจะทดสอบชุดค่าผสมทั้งหมด ซึ่งตรงข้ามกับแฟกทอเรียลที่เป็นเศษส่วนซึ่งจะทดสอบเฉพาะค่าที่มีผลกระทบมากที่สุดเท่านั้น
แม้ว่าจะมีหลายวิธีในการวิเคราะห์หลายตัวแปร — ฟูลแฟกทอเรียล แฟกทอเรียลเศษส่วน และทากุจิ เครื่องมือเพิ่มประสิทธิภาพส่วนใหญ่แนะนำให้ใช้แฟกทอเรียลแบบเต็มเพื่อความแม่นยำ Alex Birkett จาก CXL กล่าวอ้าง
4. กำหนดขนาดตัวอย่างของคุณ
ก่อนที่คุณจะเริ่มกระตุ้นการเข้าชมหน้าเว็บของคุณ คุณต้องกำหนดขนาดตัวอย่างของคุณ — จำนวนผู้เข้าชมแต่ละหน้าที่ต้องสร้างก่อนที่คุณจะสามารถสรุปผลการทดสอบของคุณได้
เครื่องคำนวณนี้จาก VWO จะช่วยให้คุณทราบจำนวนผู้เยี่ยมชม และระยะเวลาที่คุณต้องทำการทดสอบโดยพิจารณาจากการเข้าชมเว็บไซต์ จำนวนรูปแบบที่คุณมี และนัยสำคัญทางสถิติของคุณ
หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับการบรรลุนัยสำคัญทางสถิติ และทุกสิ่งที่คุณต้องใช้ในการคำนวณ โปรดดูบล็อกโพสต์นี้
5. ทดสอบเครื่องมือของคุณ
ทดสอบทุกอย่างก่อนที่จะเริ่มเปิดการจราจร หน้า Landing Page หลังการคลิกของคุณมีลักษณะเหมือนกันในทุกเบราว์เซอร์หรือไม่ ปุ่ม CTA ของคุณใช้งานได้หรือไม่ ลิงก์ทั้งหมดในโฆษณาของคุณถูกต้องหรือไม่
ก่อนที่คุณจะเริ่มดำเนินการใดๆ สิ่งสำคัญคือต้องทำ QA ทุกแง่มุมของแคมเปญของคุณเพื่อให้แน่ใจว่าไม่มีสิ่งใดทำให้ผลลัพธ์ของคุณเป็นพิษ
6. เริ่มขับเคลื่อนการจราจร
ตอนนี้คุณได้สร้างรูปแบบต่างๆ และทราบแล้วว่าคุณต้องสร้างปริมาณการเข้าชมเท่าใดสำหรับแต่ละรูปแบบ คุณจึงเริ่มเพิ่มปริมาณการเข้าชมให้กับรูปแบบเหล่านั้นได้อย่างปลอดภัย ข้อเสียที่ใหญ่ที่สุดของการทดสอบหลายตัวแปรคือปริมาณการรับส่งข้อมูลจำนวนมหาศาลที่คุณต้องการก่อนที่คุณจะสามารถสรุปได้ ดังนั้นคุณจะต้องอดทน
เมื่อคุณทำการทดสอบ A/B มีเพียงสองหน้าเท่านั้นที่คุณจะต้องกระตุ้นการเข้าชมที่มีนัยสำคัญ แต่ในการทดสอบหลายตัวแปร เช่นของ Paras มีหน้าที่แตกต่างกัน 12 หน้าที่ต้องรวบรวมตัวอย่างขนาดใหญ่ก่อนที่คุณจะสามารถเรียกการทดสอบได้
จับตาดูภัยคุกคามต่อความถูกต้องของคุณและอย่าลืมคำนึงถึงอัตราผลบวกลวงที่เพิ่มขึ้น Leonid Pekelis กล่าว:
“คุณกำลังเรียกใช้การทดสอบ A/B แยกต่างหากสำหรับการโต้ตอบแต่ละครั้ง หากคุณมีการโต้ตอบ 20 รายการที่ต้องวัด และขั้นตอนการทดสอบของคุณมีอัตรา 5% ของการค้นหาผลบวกปลอมสำหรับแต่ละรายการ คุณคาดหมายทันทีว่าจะมีการตรวจพบการโต้ตอบ 1 รายการที่มีนัยสำคัญโดยสิ้นเชิงโดยบังเอิญ มีหลายวิธีในการพิจารณาเรื่องนี้ โดยทั่วไปเรียกว่าการแก้ไขการทดสอบหลายครั้ง แต่อีกครั้ง ค่าใช้จ่ายคือคุณมีแนวโน้มที่จะต้องการผู้เยี่ยมชมมากขึ้นเพื่อดูผลลัพธ์ที่สรุปได้”
7. วิเคราะห์ผลลัพธ์ของคุณ
หลังจากทำการทดสอบเป็นเวลาสี่สัปดาห์ นี่คือสิ่งที่ Paras พบ:
คุณสามารถสังเกตว่าบรรทัดแรก "ดาวน์โหลดฟรี" เป็นสีแดงทำให้อัตรา Conversion ดาวน์โหลดจาก 39% เป็น 63% ซึ่งเพิ่มขึ้นอย่างมากถึง 60% การมี "ดาวน์โหลด" ในขนาดตัวอักษรขนาดใหญ่ (รวมกับสีของลิงก์เป็นสีแดง) ก็มีการปรับปรุงในเชิงบวก (43%) จากค่าเริ่มต้น จากผลลัพธ์ทั้งหมด สามอันดับแรกมีนัยสำคัญทางสถิติที่ระดับความเชื่อมั่น 95% ขึ้นไป
Paras อาจใช้หน้าใหม่ของเขาและลืมเกี่ยวกับการทดสอบนี้ แต่เขาเน้นขั้นตอนสุดท้ายที่สำคัญแทน:
8. เรียนรู้จากผลลัพธ์ของคุณ
ควรใช้แบบทดสอบแต่ละรายการเพื่อเรียนรู้บางอย่างเกี่ยวกับหน้าเว็บและผู้เยี่ยมชม ซึ่งคุณสามารถใช้เพื่อแจ้งการทดสอบในอนาคตได้
เขาได้เรียนรู้ว่าบนหน้าเว็บของเขา:
- คำว่า "ฟรี" โดนใจผู้เข้าชมเว็บไซต์
- ลักษณะที่ไม่มีค่าใช้จ่ายของข้อเสนอได้รับการโฆษณาอย่างดีที่สุดในหรือใกล้กับคำกระตุ้นการตัดสินใจ
- สีแดงดึงความสนใจของผู้มาเยือน
- คำกระตุ้นการตัดสินใจที่ใหญ่กว่าดึงดูดสายตาผู้เข้าชมได้มากขึ้น
แต่จำไว้ว่านี่คือผลการทดสอบ ของเขา แม้ว่าคำว่า "ฟรี" จะใช้ได้ดีเสมอบนหน้าเว็บใดๆ ที่โฆษณาข้อเสนอที่ไม่มีค่าใช้จ่าย แต่ตำแหน่งที่ดีที่สุด ขนาด และสีของ CTA ของคุณอาจแตกต่างออกไปในหน้าเว็บของคุณ วิธีเดียวที่จะรู้ได้อย่างแน่นอนคือการทดสอบ
คุณได้ลองทดสอบหลายตัวแปรแล้วหรือยัง?
คุณเคยหลงทางจากการทดสอบหลายตัวแปรเพราะคิดว่ามันซับซ้อนเกินไปหรือไม่? ลงทะเบียนสำหรับการสาธิต Instapage Enterprise วันนี้