جميع أنواع الاختبارات المختلفة التي يمكنك إجراؤها على موقعك (+ وقت إجرائها)
نشرت: 2022-09-20لقد انتقل عالم التجارب في الغالب إلى ما هو أبعد من اختبارات لون الزر البسيط A / B.
قد يكون لهم مكانهم في مجموعة التجارب التي تجريها ، ولكن نأمل ، في هذه المرحلة ، ألا يكونوا مرادفين للتجربة أو CRO.
يمكن أن تكون التجربة أكبر من ذلك بكثير.
باستخدام أنواع مختلفة من التجارب ، يمكننا التعرف على التباين في مواقعنا الإلكترونية ، واختبار التجارب الجديدة ، واكتشاف مسارات جديدة للصفحات ، وتحقيق قفزات كبيرة أو خطوات صغيرة ، وتحديد التركيبة المثلى من العناصر على الصفحة.
يجب أن ينعكس ما تأمل في تعلمه من التجربة في تصميمها ، وتصميم التجارب يتجاوز مجرد اختبار A مقابل B باستخدام فرضية ملموسة.
في الواقع ، هناك مجال فرعي كامل للدراسة يُعرف باسم تصميم التجارب (DoE) يغطي هذا المجال.
- تصميم التجارب: مقدمة في التصميم التجريبي
- 16 أنواع شائعة من التجارب
- 1. اختبار A / A
- 2. اختبار A / B بسيط
- 3. اختبار A / B / n
- 4. اختبار متعدد المتغيرات
- 5. اختبار الاستهداف
- 6. اختبار اللصوص
- 7. الخوارزميات التطورية
- 8. انقسام اختبار مسار الصفحة
- 9. اختبار الوجود
- 10. اختبار الباب المطلي
- 11. اختبار الاكتشاف
- 12. الاختبار التكراري
- 13. اختبار مبتكر
- 14. اختبار عدم الدونية
- 15. ميزة العلم
- 16. شبه التجارب
- استنتاج
تصميم التجارب: مقدمة في التصميم التجريبي
تصميم التجارب (DoE) هو أسلوب علمي يستخدم لتحديد العلاقة بين العوامل التي تؤثر على العملية ومخرجات تلك العملية.
تصميم التجارب هو مفهوم شاعه الإحصائي رون فيشر في عشرينيات وثلاثينيات القرن الماضي.
يسمح لنا DoE بفهم كيفية تأثير متغيرات الإدخال المختلفة على إخراج العملية من خلال تغيير المدخلات بشكل منهجي ومراقبة التغييرات الناتجة في المخرجات. يمكن استخدام هذا النهج لتحسين عملية أو تطوير منتجات أو ميزات جديدة أو معرفة العناصر التي تعمل بشكل أفضل مع بعضها البعض.
في التسويق ، نستخدم DoE لتحسين فهمنا لكيفية تأثير العناصر المختلفة على الصفحة (العوامل) على معدلات التحويل (المخرجات). من خلال تصميم التجارب بشكل فعال ، يمكننا تحديد العناصر التي لها أكبر تأثير على معدلات التحويل.
هناك العديد من أنواع التجارب المختلفة ، ويمكن استخدام كل نوع لتعلم أشياء مختلفة عن موقعك على الويب أو تطبيقك.
في هذه المقالة ، سأغطي 16 نوعًا من التجارب.
قد يلاحظ منتقو النيتروجين أن هذه ليست كلها تصميمات تجريبية مختلفة اختلافًا جوهريًا ؛ بدلاً من ذلك ، بعضها "أنواع" مختلفة بسبب كيفية إنشاء فرضيتك أو الأطر التي تكمن وراء أسباب إجراء التجربة.
بالإضافة إلى ذلك ، فإن بعضها ليس "تجارب" تمامًا ، ولكنه بالأحرى قواعد تحسين مبنية على نماذج التعلم الآلي.
ومع ذلك ، فإن كل مما يلي له غرض مميز ويمكن اعتباره أداة فريدة في مجموعة أدوات المجرب.
16 أنواع شائعة من التجارب
هناك العديد من الأنواع المختلفة من التجارب الخاضعة للرقابة التي يمكنك إجراؤها على موقع الويب الخاص بك ، ولكن إليك 16 من أكثر التجارب شيوعًا:
1. اختبار أ / أ
2. اختبار A / B بسيط
3. اختبار A / B / n
4. اختبار متعدد المتغيرات
5. اختبار الاستهداف
6. اختبار اللصوص
7. الخوارزميات التطورية
8. انقسام اختبار مسار الصفحة
9. اختبار الوجود
10. اختبار الباب المطلي
11. اختبار الاكتشاف
12. الاختبار التزايدي
13. اختبار مبتكر
14. اختبار عدم النقص
15. علامة مميزة
16. شبه التجارب
1. اختبار A / A
يعد اختبار A / A مفهومًا بسيطًا: فأنت تختبر نسختين متطابقتين من الصفحة.
لماذا ستفعل هذا؟
هناك مجموعة من الأسباب ، أساسًا في السعي وراء المعايرة وفهم البيانات الأساسية وسلوك المستخدم وآليات التوزيع العشوائي لأداة الاختبار الخاصة بك. يمكن أن يساعدك اختبار A / A:
- حدد مستوى التباين في بياناتك
- تحديد أخطاء أخذ العينات داخل أداة الاختبار الخاصة بك
- إنشاء معدلات التحويل الأساسية وأنماط البيانات.
إجراء اختبارات A / A أمر مثير للجدل بشكل غريب. يقسم البعض به. يقول البعض إنها مضيعة للوقت.
ما رأيي؟ من المحتمل أن يكون الأمر يستحق تشغيل واحدة على الأقل مرة واحدة ، لجميع الأسباب المذكورة أعلاه. سبب آخر لأني أحب تشغيل اختبارات A / A هو شرح الإحصائيات لاختبار المبتدئين.
عندما تُظهر لشخص ما تجربة "مهمة" لمدة يومين من البيانات التي تم جمعها ، فقط لتكشف لاحقًا أنها كانت اختبار أ / أ ، فعادةً ما يفهم أصحاب المصلحة سبب وجوب إجراء التجربة حتى نهايتها.
إذا كنت ترغب في قراءة المزيد حول اختبار A / A (إنه موضوع ضخم ، في الواقع) ، فإن برنامج التحويل يحتوي على دليل متعمق عنها.
حالات الاستخدام: المعايرة وتحديد تباين البيانات ، ومراجعة أخطاء منصة التجريب ، وتحديد معدل التحويل الأساسي ومتطلبات العينة.
2. اختبار A / B بسيط
يعلم الجميع ما هو اختبار A / B البسيط: أنت تختبر نسختين من الصفحة ، واحدة مع تغيير والأخرى بدون.
اختبارات A / B هي الخبز والزبدة للتجربة. إنها سهلة الإعداد وسهلة الفهم ، ولكن يمكن استخدامها أيضًا لاختبار التغييرات الكبيرة.
تُستخدم اختبارات A / B بشكل شائع لاختبار التغييرات على واجهة المستخدم ، والهدف من اختبار A / B البسيط هو دائمًا تحسين معدل التحويل في صفحة معينة.
بالمناسبة ، معدل التحويل هو مقياس عام يغطي جميع أنواع النسب ، مثل معدل تنشيط مستخدمي المنتجات الجديدة ، ومعدلات تحقيق الدخل لمستخدمي freemium ، ومعدلات تحويل العملاء المحتملين على موقع الويب ، ونسب النقر إلى الظهور.
باستخدام اختبار A / B البسيط ، يكون لديك فرضية فردية وتغيير عنصرًا واحدًا في كل مرة لتتعلم قدر المستطاع عن العناصر السببية لتغييرك. قد يكون هذا شيئًا مثل تغيير العنوان أو تغيير لون الزر أو الحجم أو إضافة مقطع فيديو أو إزالته أو أي شيء.
عندما نقول "اختبار أ / ب" ، فإننا في الغالب نستخدم مصطلحًا عامًا ليشمل معظم أنواع التجارب المتبقية التي سأدرجها في هذا المنشور. عادةً ما يتم استخدامه كمصطلح شامل ليعني ، "لقد غيّرنا * شيئًا ما * - كبير أو صغير أو عناصر كثيرة - من أجل تحسين المقياس."
حالات الاستخدام: كثير! عادة لاختبار تغيير فردي لتجربة رقمية مستنيرة بفرضية ملموسة. عادةً ما يتم إجراء اختبارات A / B بهدف تحسين أحد المقاييس ، ولكن أيضًا للتعرف على أي تغيير يحدث في سلوك المستخدم مع التدخل.
3. اختبار A / B / n
تشبه اختبارات A / B / n إلى حد كبير اختبارات A / B ، ولكن بدلاً من اختبار نسختين من الصفحة ، فأنت تختبر إصدارات متعددة.
تتشابه اختبارات A / B / n ، في بعض النواحي ، مع الاختبارات متعددة المتغيرات (والتي سأستكشفها لاحقًا). ومع ذلك ، فبدلاً من إجراء اختبار "متعدد المتغيرات" ، كنت أعتبره اختبارًا متعدد المتغيرات.
تعد الاختبارات متعددة المتغيرات مفيدة لفهم العلاقات بين العناصر المختلفة على الصفحة. على سبيل المثال ، إذا كنت ترغب في اختبار عناوين وصور وأوصاف مختلفة على صفحة منتج ، وتريد أيضًا معرفة المجموعات التي يبدو أنها تتفاعل بشكل أفضل ، يمكنك استخدام اختبار متعدد المتغيرات.
تُعد اختبارات A / B / n مفيدة لاختبار إصدارات متعددة من عنصر واحد ولا تهتم كثيرًا بتأثيرات التفاعل بين العناصر.
على سبيل المثال ، إذا كنت ترغب في اختبار ثلاثة عناوين مختلفة على صفحة مقصودة ، فيمكنك استخدام اختبار A / B / n. أو يمكنك فقط اختبار سبعة إصدارات مختلفة تمامًا من الصفحة. إنه مجرد اختبار أ / ب مع أكثر من تجربتين تم اختبارهما.
تعد اختبارات A / B / n اختيارات قوية عندما يكون لديك عدد كبير من الزيارات وترغب في اختبار العديد من المتغيرات بكفاءة. بالطبع ، يجب تصحيح الإحصائيات لمتغيرات متعددة. هناك أيضًا الكثير من الجدل حول عدد المتغيرات التي يجب على المرء تضمينها في اختبار A / B / n.
في كثير من الأحيان ، يمكنك دفع بعض المتغيرات الأصلية والإبداعية عند اختبار عدة تجارب في وقت واحد بدلاً من التكرار عبر عدة اختبارات A / B بسيطة.
حالة الاستخدام: عندما يكون لديك حركة مرور متاحة ، فإن المتغيرات المتعددة تكون رائعة لاختبار مجموعة متنوعة واسعة النطاق من التجارب أو التكرارات المتعددة لعنصر ما.
4. اختبار متعدد المتغيرات
اختبار متعدد المتغيرات هو تجربة مع تغييرات متعددة. عندما يقوم اختبار A / B / n باختبار الإصدارات المركبة لكل متغير مقابل كل متغير آخر ، يهدف اختبار متعدد المتغيرات أيضًا إلى تحديد تأثيرات التفاعل بين العناصر التي تم اختبارها.
تخيل ، على سبيل المثال ، أنك تعيد تصميم صفحة رئيسية. لقد أجريت بحثًا عن التحويل واكتشفت مشكلات تتعلق بالوضوح في العنوان ، ولكن لديك أيضًا بعض الفرضيات حول مستوى التباين والوضوح في CTA الخاص بك.
لا تهتم فقط بتحسين كل من هذين العنصرين على حدة ، ولكن أداء هذين العنصرين يعتمد أيضًا على الأرجح. لذلك ، تريد معرفة أي مجموعة من العناوين الجديدة وعبارات الحث على اتخاذ إجراء تعمل بشكل أفضل.
يصبح تصميم التجربة أكثر تعقيدًا عندما تدخل منطقة متعددة المتغيرات. هناك عدة أنواع مختلفة من إعدادات التجربة متعددة المتغيرات ، بما في ذلك التصميم الشامل الكامل ، والتصميم الجزئي أو الجزئي ، واختبار تاغوشي.
وكمسألة تتعلق بالمنطق الإحصائي ، تتطلب الاختبارات متعددة المتغيرات بشكل شبه مؤكد حركة مرور أكثر من اختبارات A / B البسيطة. يزيد كل عنصر أو تجربة إضافية تقوم بتغييرها من مقدار حركة المرور التي تحتاجها للحصول على نتيجة صحيحة.
حالات الاستخدام: تبدو التجارب متعددة المتغيرات مفيدة بشكل خاص لتحسين التجربة عن طريق تعديل العديد من المتغيرات الصغيرة. عندما تريد تحديد التركيبة المثلى للعناصر ، يجب مراعاة الاختبارات متعددة المتغيرات.
5. اختبار الاستهداف
تهدف اختبارات الاستهداف ، المعروفة باسم التخصيص ، إلى إظهار الرسالة الصحيحة للشخص المناسب في الوقت المناسب.
باستخدام اختبار الاستهداف ، يمكنك إنشاء إصدارات مختلفة من الصفحة وعرض كل إصدار لمجموعة مختلفة من الأشخاص. الهدف عادة هو زيادة معدلات التحويل من خلال عرض المحتوى ذي الصلة لكل مستخدم.
لاحظ أن التخصيص والتجريب ليسا مترادفين. يمكنك تخصيص تجربة ما دون التعامل معها كتجربة. على سبيل المثال ، يمكنك أن تقرر بدون بيانات أو نية جمع البيانات ، وأنك ستستخدم رمزًا مميزًا للاسم الأول في رسائل البريد الإلكتروني الخاصة بك لتخصيص الرسائل باسم المستلم.
إضفاء الطابع الشخصي؟ نعم. التجريب؟ رقم.
ولكن يمكنك أيضًا إجراء تجارب تستهدف شرائح معينة من المستخدمين. هذا شائع بشكل خاص في تجربة المنتج ، حيث يمكنك عزل المجموعات النموذجية بناءً على فئة التسعير ووقت الاشتراك ومصدر الاشتراك وما إلى ذلك.
تنطبق نفس الإحصائيات على تجارب التخصيص ، لذلك من المهم اختيار شرائح ذات معنى لاستهدافها. إذا أصبحت أكثر دقة - لنفترض استهداف مستخدمي Chrome على الأجهزة المحمولة في المناطق الريفية في كانساس والذين لديهم ما بين 5 و 6 جلسات - فلن يكون من المستحيل فقط تحديد التأثير إحصائيًا ، ولكن من غير المحتمل أن يكون له تأثير تجاري مفيد أيضًا.
يُنظر إلى التخصيص عادةً على أنه امتداد طبيعي لاختبار A / B البسيط ، ولكن من نواح كثيرة ، فإنه يقدم الكثير من التعقيد الجديد. لكل قاعدة تخصيص جديدة تستخدمها ، هذا "عالم" جديد أنشأته للمستخدمين لإدارته وتحديثه وتحسينه.
تساعدك أدوات التخصيص التنبؤية في تحديد الشرائح المستهدفة بالإضافة إلى التجارب التي يبدو أنها تعمل بشكل أفضل معها. بخلاف ذلك ، غالبًا ما يتم تحديد قواعد التخصيص عن طريق إجراء تجزئة ما بعد الاختبار.
حالات الاستخدام: اعزل العلاجات إلى شرائح محددة من قاعدة المستخدمين.
6. اختبار اللصوص
يعد اختبار الماكينة أو استخدام خوارزميات ماكينات الحظ أمرًا تقنيًا بعض الشيء. لكنها تختلف في الأساس عن اختبارات A / B لأنهم يتعلمون باستمرار ويغيرون المتغير الذي يظهر للمستخدمين.
عادةً ما تكون اختبارات A / B عبارة عن تجارب "أفق ثابت" (مع التحذير الفني باستخدام الاختبار المتسلسل) ، مما يعني أنك تحدد مسبقًا فترة تجريبية عند إجراء الاختبار. عند الانتهاء ، تتخذ قرارًا إما بطرح المتغير الجديد أو العودة إلى الأصل.
اختبارات قطاع الطرق ديناميكية. يقومون باستمرار بتحديث تخصيص حركة المرور لكل متغير بناءً على أدائه.
تسير النظرية على هذا النحو: أنت تدخل كازينو وتتعثر في العديد من ماكينات القمار (ماكينات الألعاب المتعددة). إذا افترضنا أن لكل آلة مكافآت مختلفة ، فإن مشكلة اللصوص تساعد في "تحديد الآلات التي سيتم تشغيلها ، وعدد مرات تشغيل كل آلة وترتيب تشغيلها ، وما إذا كنت تريد الاستمرار في الآلة الحالية أو تجربة آلة مختلفة".
يتم تقسيم عملية اتخاذ القرار هنا إلى "استكشاف" ، حيث تحاول جمع البيانات والمعلومات ، و "الاستغلال" الذي يستفيد من تلك المعرفة لإنتاج مكافآت أعلى من المتوسط.
لذلك ، فإن اختبار الماكينة على موقع ويب سيسعى إلى العثور ، في الوقت الفعلي ، على المتغير الأمثل ، وإرسال المزيد من حركة المرور إلى هذا المتغير.
حالات الاستخدام: تجارب قصيرة ذات "قابلية عالية للتلف" (بمعنى أن التعلم من النتائج لن يمتد بعيدًا في المستقبل) ، والتحسين الديناميكي على المدى الطويل "اضبطه ونسيانه".
7. الخوارزميات التطورية
الخوارزميات التطورية هي نوع من الجمع بين الاختبارات متعددة المتغيرات واختبارات قطاع الطرق. في سياق التجارب التسويقية ، تسمح لك الخوارزميات التطورية باختبار عدد كبير من المتغيرات في نفس الوقت.
الهدف من الخوارزمية التطورية هو العثور على التركيبة المثلى للعناصر على الصفحة. إنهم يعملون من خلال إنشاء "مجتمع" من المتغيرات ثم اختبارها جميعًا ضد بعضها البعض. ثم يتم استخدام الخيار الأفضل أداءً كنقطة انطلاق للجيل القادم.
كما هو مقترح من الاسم ، فإنه يستخدم التكرارات التطورية كنموذج للتحسين. لديك الكثير من الإصدارات المختلفة من العناوين الرئيسية والأزرار ونسخة الجسم ومقاطع الفيديو ، ويمكنك لصق كل منها معًا لإنشاء طفرات جديدة ، وتحاول بشكل ديناميكي القضاء على المتغيرات الضعيفة وإرسال المزيد من الزيارات إلى المتغيرات القوية.
إنه يشبه الاختبار متعدد المتغيرات على المنشطات ، وإن كان ذلك مع شفافية أقل في تأثيرات التفاعل (وبالتالي ، إمكانات تعليمية أقل).
تتطلب هذه التجارب أيضًا قدرًا كبيرًا من زيارات موقع الويب للعمل بشكل جيد.
حالات الاستخدام: اختبار ضخم متعدد المتغيرات ، دمج عدة إصدارات من المواد الإبداعية معًا وإيجاد الفائز الناشئ بين جميع المجموعات.
8. انقسام اختبار مسار الصفحة
يعد اختبار مسار الصفحة المنقسمة أيضًا نوعًا شائعًا جدًا من اختبارات A / B.
بدلاً من تغيير عنصر في صفحة واحدة ، فأنت تقوم بتغيير المسار الكامل الذي يسلكه المستخدم عبر موقع الويب الخاص بك.
باستخدام اختبار مسار الصفحة المنقسمة ، فأنت تختبر بشكل أساسي نسختين مختلفتين من موقع الويب أو المنتج أو مسار التحويل. الهدف عادةً هو العثور على الإصدار الذي ينتج عنه المزيد من التحويلات أو المبيعات. يمكن أن يساعد أيضًا في تحديد نقاط الانسحاب في مسار التحويل ، والتي يمكنها تشخيص مناطق التركيز لمزيد من التحسين.
بشكل أساسي ، بدلاً من تغيير النسخة على زر ، يمكنك تغيير الصفحة التالية التي ترسلك الأزرار إليها إذا نقرت عليها. إنها طريقة فعالة لتجربة رحلة العميل.
حالات الاستخدام: تحديد وتحسين مسارات الصفحات ومسارات المستخدم في منتج أو على موقع ويب.
9. اختبار الوجود
اختبار الوجود هو مفهوم مثير للاهتمام. ما تحاول القيام به هو تحديد التأثير (أو عدمه) لعنصر معين في منتجك أو موقع الويب الخاص بك.
وفقًا لمقال CXL ، "ببساطة ، نزيل عناصر موقعك ونرى ما سيحدث لمعدل التحويل الخاص بك."
بمعنى آخر ، أنت تختبر لمعرفة ما إذا كان للتغيير أي تأثير على الإطلاق.
من الناحية الاستراتيجية ، هذه استراتيجية تم التقليل من شأنها. غالبًا ما نفترض ، إما من خلال الاستدلال الخاص بنا أو من خلال البحث النوعي ، العناصر الأكثر أهمية في الصفحة.
بالتأكيد ، الفيديو التوضيحي للمنتج مهم. اختبار الوجود هو وسيلة للتشكيك في هذا الاعتقاد والحصول على إجابة بسرعة.
ما عليك سوى إزالة الفيديو ومعرفة ما سيحدث.
زيادة معدل التحويل أم نقصان؟ مثير للاهتمام - هذا يعني أن العنصر أو العقار الذي يشغله مؤثر بطريقة ما.
لا تأثير؟ هذا مثير للاهتمام أيضًا. في هذه الحالة ، أود توجيه تركيز فريقي إلى أجزاء أخرى من التجربة الرقمية ، مع العلم أنه حتى إزالة العنصر تمامًا لا يفعل شيئًا لمؤشرات الأداء الرئيسية الخاصة بنا.
حالات الاستخدام: "تعيين إشارة التحويل". بشكل أساسي ، يمكن أن يخبرك هذا بمرونة العناصر على موقع الويب الخاص بك ، هل هي مهمة بما يكفي لتركيز جهود التحسين الخاصة بك عليها؟
10. اختبار الباب المطلي
يشبه اختبار الباب المطلي اختبار الوجود بطريقة ما. إنها شائعة جدًا لاختبار العروض الجديدة بالإضافة إلى اختبار الطلب على ميزات المنتج الجديد.
في الأساس ، يعد اختبار الباب المطلي تجربة لمعرفة ما إذا كان الأشخاص سيستخدمون بالفعل ميزة جديدة أم لا. أنت لا تقضي الوقت والموارد فعليًا لإنشاء العرض أو الميزة الجديدة. بدلاً من ذلك ، تقوم بإنشاء "باب مرسوم" لمعرفة ما إذا كان الأشخاص الذين يمرون بجواره سيحاولون فتحه (على سبيل المثال ، تقوم بإنشاء زر أو صفحة مقصودة ومعرفة ما إذا كان الأشخاص ينقرون عليها ، لاستنتاج الاهتمام).
الهدف من اختبار الباب المطلي هو معرفة ما إذا كان هناك أي طلب على الشيء الذي تختبره. إذا كان الأشخاص يستخدمون الميزة الجديدة بالفعل ، فأنت تعلم أنها تستحق المتابعة. إذا لم يكن الأمر كذلك ، فأنت تعلم أن الأمر لا يستحق وقتك ويمكنك إلغاء الفكرة.
تُعرف أيضًا باسم اختبارات الدخان .
تُعد اختبارات الأبواب المطلية طريقة رائعة لاختبار الأفكار الجديدة دون استثمار الكثير من الوقت أو المال.
نظرًا لعدم وجود عرض أو خبرة في الإنشاء ، لا يمكنك عادةً استخدام مؤشرات الأداء الرئيسية مثل معدل التحويل. بدلاً من ذلك ، عليك أن تصمم عتبة الحد الأدنى للقيمة المتوقعة. على سبيل المثال ، سيكلف إنشاء ميزة X Y ، لذلك نظرًا لبياناتنا الأساسية الحالية ، سنحتاج إلى رؤية نسبة النقر إلى الظهور Y لضمان إنشاء تجربة "حقيقية".
قائمة انتظار ما قبل الإطلاق هي ، في بعض النواحي ، اختبار باب مطلي (مع المثال الشهير هو شفرات هاري).
حالات الاستخدام: أثبت جدوى العمل لاستثمار الوقت والموارد في إنشاء ميزة أو عرض أو تجربة جديدة.
11. اختبار الاكتشاف
إن اختبارات الاكتشاف ، التي سحبتها من منهجية الاختبار القائمة على الانضباط لأندرسون أندرسون ، تدور حول زيادة نطاق الخيارات الممكنة.
إنها دائمًا نسخة من اختبارات A / B / n بمتغيرات متعددة ، لكن لا يلزم بالضرورة تصميمها بهذه الطريقة. الغرض الأكبر من هذه الخيارات هو اختبار الخيارات خارج نطاق ما كنت عادة ما تعتبره معقولاً. هذا يخفف من تحيزك ، والذي يمكن أن يحد من نطاق الخيارات التي تفكر فيها.
بدلاً من تحديد فرضية بشكل ضيق ، فأنت تأمل في الخروج من تحيزاتك الخاصة ومن المحتمل أن تتعلم شيئًا جديدًا تمامًا حول ما يناسب جمهورك.
لإجراء اختبار اكتشاف ، عليك أن تأخذ قطعة من العقارات على منتجك أو موقعك على الويب وتقوم بإنشاء مجموعة من المتغيرات المختلفة. الهدف هو أن كل متغير مختلف تمامًا عن السابق ، مما يمنحك مجموعة واسعة من الخيارات غير المتشابهة. الهدف هو العثور على شيء يعمل ، حتى لو كنت لا تعرف ما هو عليه في وقت مبكر.
في اختبارات الاكتشاف ، من المهم تعيين تجربتك لمؤشر الأداء الرئيسي الكلي وليس تحسين التحويلات الصغيرة. من المهم أيضًا إجراء اختبار على تجارب حركة مرور عالية وذات مغزى ، حيث سترغب في الحصول على قوة إحصائية مناسبة للكشف عن الارتفاعات بين المتغيرات العديدة.
لرؤية مثال لتجربة كهذه ، تحقق من مثال أندرو أندرسون من Malwarebytes حيث اختبروا 11 متغيرًا مختلفًا إلى حد كبير.
حالات الاستخدام: قم بإلغاء تقييد جهود التجريب الخاصة بك من الفرضيات المتحيزة وابحث عن حلول خارج الصندوق والتي قد تتعارض مع حدسك ، إلا أنها تؤدي في النهاية إلى نتائج الأعمال.
12. الاختبار التكراري
هناك مفهوم معروف في علوم الكمبيوتر باسم "مشكلة تسلق التلال". في الأساس ، تسعى خوارزميات تسلق التل إلى العثور على أعلى نقطة في منظر طبيعي من خلال البدء من الأسفل والتحرك باستمرار لأعلى.
يمكن تطبيق نفس المفهوم على تجارب التسويق.
من خلال الاختبار التكراري ، تبدأ بتغيير بسيط ثم تستمر في تكبيره حتى تصل إلى نقطة تناقص الغلة. تسمى هذه النقطة من تناقص الغلة "الحد الأقصى المحلي". الحد الأقصى المحلي هو أعلى نقطة في المشهد يمكن الوصول إليها من نقطة البداية.
الهدف من الاختبار التكراري هو إيجاد الحد الأقصى المحلي لتغيير معين. يمكن أن تكون هذه طريقة فعالة للغاية لاختبار أشياء مثل تغييرات العرض أو تغييرات الأسعار ، بالإضافة إلى أي عنصر وجدته مؤثرًا من خلال البحث أو من خلال اختبار الوجود.
في الأساس ، أنت تعلم أن عنصر X مهم ، وأنت تعلم أن هناك مجالًا إضافيًا للمناورة لتحسين KPI Y من خلال تحسين العنصر X. لذا فإنك تأخذ عدة طعنات صغيرة ومتكررة في تغيير العنصر X حتى يظهر أنه لا يمكنك تحسين المقياس بعد الآن (أو من الصعب جدًا القيام بذلك).
يأتي أحد الأمثلة السهلة للاختبار التكراري من موقع الويب الخاص بي. أقوم بتشغيل النوافذ المنبثقة المغناطيسية. أعلم أنهم يقودون رسائل البريد الإلكتروني ، ومن المحتمل أن تكون هناك نقطة تراجع في العوائد ، لكنني لا أعتقد أنني وصلت إليها بعد. لذلك كل بضعة أشهر ، أقوم بتغيير متغير واحد - إما العنوان ، أو العرض نفسه ، أو الصورة ، على أمل الضغط على مصعد صغير.
حالات الاستخدام: قم بتحسين العناصر أو التجارب المستهدفة عن طريق الاختبار المتتالي للعديد من التكرارات الصغيرة للتجربة للوصول إلى الحد الأقصى المحلي.
13. اختبار مبتكر
على عكس الاختبار التكراري ، تسعى الاختبارات المبتكرة إلى إيجاد تلال جديدة تمامًا لتسلقها.
وفقًا لمقال CXL ، تم تصميم الاختبارات المبتكرة "لاستكشاف منطقة مجهولة وإيجاد فرص جديدة."
الاختبارات المبتكرة تدور حول تجربة شيء جديد تمامًا. عادة ما تكون أكثر خطورة من الأنواع الأخرى من التجارب ، لكنها قد تكون مجزية للغاية. إذا كنت تبحث عن مكاسب كبيرة ، فإن الاختبار المبتكر هو السبيل للذهاب.
تندرج عمليات إعادة تصميم الصفحة الرئيسية أو الصفحة المقصودة الكاملة ضمن هذه الفئة. اختبار الاكتشاف هو شكل من أشكال الاختبارات المبتكرة. ستكون اختبارات لون الزر هي العكس تمامًا للاختبار المبتكر.
يجب أن يجعلك الاختبار المبتكر تشعر بعدم الارتياح إلى حد ما أنت أو أصحاب المصلحة لديك (ولكن تذكر أن جمال التجارب هو أنها محدودة المدة وتحد من الجانب السلبي لديك).
أعطت CXL مثالًا للاختبار المبتكر الذي أجروه لأحد العملاء هنا:
حالات الاستخدام: خذ أرجوحة كبيرة وابحث عن "تل" جديد لتسلقه. لف عدة فرضيات معًا وقم بتغيير التجربة بشكل جذري.
14. اختبار عدم الدونية
يستخدم اختبار عدم الدونية لتحديد ما إذا كان العلاج الجديد ليس أسوأ من العلاج القياسي.
الهدف من اختبار عدم الدونية هو إظهار أن العلاج الجديد فعال على الأقل مثل العلاج القياسي.
لماذا تجري اختبارًا كهذا؟
أسباب عديدة. أفضل ما يمكنني التفكير فيه هو ما إذا كان لديك متغير "أفضل" في بعض الأبعاد الأخرى (من الأرخص الحفاظ عليه ، والالتزام بمعايير العلامة التجارية بشكل أفضل ، وما إلى ذلك) ، ولكنك تريد التأكد من أنه لا يضر بك KPIs الأساسية للأعمال.
أو في منظور التجارب السريرية الطبية ، تخيل أنه تم تطوير دواء يكلف 1/10 من الأدوية الموصوفة بشكل شائع. طالما أنه لا يعمل * أسوأ * من الدواء الحالي ، فإن قدرته على تحمل التكاليف تعني أنه خيار أفضل بكثير لطرحه.
السبب الآخر الذي أجريته هو إذا كان العلاج مفضلًا بشدة من قبل مسؤول تنفيذي أو صاحب مصلحة. أكره كسرها لك ، ولكن لمجرد أننا نتمتع بإمكانية الوصول إلى البيانات كمتخصصين في التجارب لا يعني أننا نتجنب فوضى التفكير المتحيز والسياسة الإنسانية.
يسعدني إجراء الاختبار العرضي المقدم من HiPPO وتشغيله من خلال عتبة أدنى من اليقين مثل اختبار عدم الدونية. طالما أنه لا يفسد * * مؤشرات الأداء الرئيسية الخاصة بي ، فلا ضرر من طرحه ، ويحظى بدعم سياسي.
حالات الاستخدام: الحد من الجانب السلبي للتجارب حيث يكون هناك بُعد آخر متفوق (التكلفة ، والتفضيل من قبل أصحاب المصلحة ، وتجربة المستخدم ، والعلامة التجارية ، وما إلى ذلك).
15. ميزة العلم
علامات الميزات هي تقنية لتطوير البرامج تسمح لك بتشغيل ميزات أو وظائف معينة أو إيقاف تشغيلها واختبار ميزات جديدة في الإنتاج.
بدون الدخول في الكثير من التفاصيل الفنية ، فإنها تسمح لك باختبار الميزات في الإنتاج أو طرحها ببطء على مجموعات فرعية أصغر من المستخدمين ، مع الحفاظ على القدرة على تقليص الميزة أو إيقافها بسرعة إذا لم تكن تعمل.
من نواح كثيرة ، تعتبر منهجية لضمان الجودة. ولكن مرة أخرى ، من نواحٍ عديدة ، كذلك اختبارات أ / ب.
مصطلح "علم الميزة" إلى حد ما مصطلح شامل يتضمن العديد من وظائف "التبديل" ذات الصلة ، مثل إصدارات الكناري ، والاختبار في الإنتاج ، والتطوير المستمر ، والتراجع ، وبوابات الميزات.
حالات الاستخدام: اختبر الميزات أو التجارب الجديدة قبل نشر رمز جديد في الإنتاج.
16. شبه التجارب
أخيرًا ، فئة التجارب الأكثر تعقيدًا واتساعًا وأصعب تعريفًا: التجارب شبه.
غالبًا ما تُستخدم شبه التجارب عندما لا يكون من الممكن تعيين المستخدمين عشوائيًا لمجموعات الاختبار.
على سبيل المثال ، إذا كنت تختبر ميزة جديدة على موقع الويب الخاص بك ، فيمكنك تشغيل اختبار A / B أو علامة الميزة أو حتى ذراع التخصيص.
ولكن ماذا لو كنت تريد اختبار مجموعة من تغييرات تحسين محركات البحث وترى تأثيرها على حركة المرور؟ أو أبعد من ذلك ، تأثيرها على تحويلات المدونة؟ ماذا لو كنت ترغب في اختبار فعالية إعلانات اللوحات الإعلانية الخارجية؟
في عدد كبير بشكل مدهش من الحالات ، من الصعب إن لم يكن من المستحيل إعداد تجربة منظمة بإحكام وخاضعة للرقابة حقًا.
في هذه الحالات ، نصمم شبه تجارب لتتوافق مع ما لدينا.
في حالة تغييرات تحسين محركات البحث ، يمكننا استخدام أدوات مثل التأثير السببي لتحديد التغييرات في سلسلة زمنية. خاصة إذا تحكمنا في تجربتنا استنادًا إلى الصفحات أو بعض الأبعاد الأخرى التي يمكن تحديدها ، فسيمنحنا هذا فكرة جيدة حول ما إذا كان تدخلنا ناجحًا أم لا.
في حالة إعلانات الراديو أو اللوحات الإعلانية ، يمكننا محاولة تحديد مواقع جغرافية تمثيلية وتحديد التأثير بمرور الوقت باستخدام إحصائيات بايزية مماثلة.
هذا موضوع معقد ، لذا سأربط مصدرين رائعين:
- كيف تدير Netflix شبه التجارب
- كيف Shopify يدير تجارب شبه
حالات الاستخدام: قياس التأثير عندما تكون التجربة العشوائية غير ممكنة أو مجدية.
استنتاج
آمل أن يكون هذا قد أقنعك بأن اختبار A / B يتجاوز تغيير العنوان أو زر CTA لتحسين معدلات التحويل.
عندما توسع فتحة العدسة الخاصة بك لما يمكن أن تحققه التجربة ، فإنك تدرك أنها أداة تعليمية رائعة.
يمكننا تحديد العناصر المؤثرة على صفحة مقصودة ، وتحديد المجموعة المثلى من العناصر ، واكتشاف مسار صفحة مستخدم جديد ومحسّن ، وتطوير ميزات وتجارب جديدة دون المخاطرة بالديون التقنية أو تجربة مستخدم سيئة ، وحتى اختبار قنوات تسويقية جديدة والتدخلات خارج موقعنا أو خارج منتجاتنا.