A/B Test İstatistikleri: Deneylerde İstatistik Neden Önemlidir?

Yayınlanan: 2020-11-16

Deneyimleri Dönüştür A/B testi istatistikleri

İstatistikler ve A/B Testi İçin Hızlı Bir Kılavuz: Bilmeniz Gereken Terimler

İstatistiklere hakim olmadan makul bir A/B testi deneyi yapmak neredeyse imkansızdır.

Deneyimleri Dönüştür gibi bir platform sizin için tüm istatistiksel ölçüm, akıl yürütme ve analizleri halledebilirken, bazı istatistiksel terimler hakkında temel bir anlayışa sahip olmak kesinlikle size yardımcı olacaktır.

Temel bilgilerle başlayalım.

Örnek ve Popülasyon

A/B testi için web sitenizin tüm trafiğini kullanmak, teoride size popülasyonunuz hakkında genel bir fikir verecektir. Bununla birlikte, nüfusun tamamının yakalanması imkansız olduğundan, bu kaynakların optimal olmayan bir kullanımı olabilir. Örneklerin kullanışlı olduğu yer burasıdır. Farklı örnekleme yöntemleri olsa da, rastgele örnekleme yaklaşımının kullanılması, örnek seçiminde doğal bir yanlılık olmamasını sağlamaya yardımcı olur. Bu yaklaşım, Randomize Kontrollü Denemelerin eczane-tıbbi uygulamasından esinlenmiştir.

Ortalama, Medyan ve Mod

En basit ifadeyle, ortalama ortalamayı, medyan tüm sayılar doğrusal olarak hizalandığında (dağılımdaki ^50. yüzdelik dilim) ortada yer alan değerleri temsil eder ve mod en çok tekrarlanan değerdir. Bu üç terim, bir A/B testinin özet istatistiklerini incelerken kullanışlıdır.

Varyans ve Standart Sapma

Bunlar veri noktalarındaki dağılımı ölçen çok önemli kavramlardır. Başka bir deyişle, verilerin ortalamadan ne kadar uzak olduğu. Standart Sapma, Varyansın kare köküdür. Bu nedenle Standart Sapma, ortalama ile aynı ölçü birimine sahip olduğu için dağılım konusunda daha iyi bir yargıçtır. Örneğin, ABD'deki yetişkin erkeklerin ortalama yüksekliği, 3 inçlik bir Standart Sapma ile 70 inçtir. Bu örnekte Varyans kullanacak olsaydık, değer 9 inç kare olurdu, bu nedenle daha az sezgiseldir. Standart Sapmayı, verilerin “olağan” sapması olarak düşünün.

Boş ve Alternatif Hipotez

A Boş Hipotezi statükoya hitap eder. Boş Hipoteziniz, örneğin artış gibi verilerde gözlemlediğiniz herhangi bir değişikliğin tamamen rastgelelikten kaynaklandığını belirtir. Alternatif Bir Hipotez, değişikliğin rastgele olmadığı, ancak nedensel bir etki gösterdiği, yani değişikliklerinizin kullanıcılarınız üzerinde bir etkisi olduğu anlamına gelir.

Örneğin, açılış sayfanız için en iyi başlığı belirlemeye çalıştığınızı varsayalım. Bir kontrol varyantınız ve bir alternatif varyantınız var. Bir A/B testi çalıştırırsınız ve her ikisi için de farklı dönüşüm oranları elde edersiniz, dolayısıyla bir artış (olumlu veya olumsuz) olur. Buradaki Boş Hipotezi, farkın rastgelelikten kaynaklandığı olacaktır. Alternatif Hipotez, değişikliğin belirli bir değişkene atfedilebileceğini belirtir.

Bir A/B testi çalıştırırken aşağıdaki dört sonuçtan birini elde edersiniz:

Boş Hipotezi reddediyorsunuz.
Boş Hipotezi reddedemezsiniz.
Boş Hipotezi yanlış bir şekilde reddediyorsunuz.
Boş Hipotezini yanlış bir şekilde reddetmekte başarısız oluyorsunuz.

İdeal olarak, a ve b sonuçları, bir şeyler öğrenebileceğiniz senaryolar olduğundan, hedeflenenler olmalıdır. Ürününüzü bu şekilde daha iyi hale getirebilir ve sonuç olarak kârlılığınızı artırabilirsiniz. Sonuçlar c ve d aşağıdaki hatalara karşılık gelir.

Tip I ve Tip II Hatalar

A/B testinizin olası sonuçlarındaki son iki seçenek, Tip I ve Tip II hatalar, yani yanlış pozitifler ve yanlış negatiflerdir.

Tip I hata, gerçek bir Boş Hipotezi yanlış bir şekilde reddetmenizdir. Yani, gözlemlediğiniz değişiklik şans eseriydi ama siz aksini yaptınız, yani yanlış bir pozitif. Çoğu durumda, yanlış pozitifleri azaltmak için gereken tek şey, istatistiksel anlamlılığa ulaşmak için gereken güven düzeyini artırmaktır. Bu genellikle %95'e ayarlanır, ancak görev açısından kritik deneyler için %99 güven düzeyine ayarlamak isteyebilirsiniz; bu, böyle bir hata yapma olasılığını yalnızca %1'e düşürür.

Tip II hatalar tam tersidir. Burada, yanlış bir Boş Hipotezi reddetmezsiniz. Bu, dönüşüm oranı üzerinde olumlu veya olumsuz gerçek bir etki olduğu, ancak istatistiksel olarak anlamlı görünmediği ve bunun rastgele şanstan kaynaklandığını yanlış beyan ettiğiniz anlamına gelir. Çoğu zaman, bunun nedeni istatistiksel güç eksikliğidir.

İstatistiksel güç dilinde, Yunanca harf α, Tip I hataları temsil eder ve β, Tip II hataları temsil eder. İstatistiksel güç ile istatistiksel anlamlılık arasında kafa karıştırmak kolaydır.

Bu tablo şunu netleştiriyor:

Deneyimleri Dönüştür tip I hata tip II hata A/B test istatistikleri

İstatistiksel Güven

Testiniz ne kadar çok ziyaretçi alırsa, yeterince uzun süre çalışmasına izin verirseniz, İstatistiksel Güveniniz %99'a ulaşana kadar o kadar artar. Ancak genellikle, görev açısından kritik olmadıkça, çoğu A/B testi için %95'lik bir güven düzeyi yeterince iyi kabul edilir (yanlış pozitif, yani Tip I hata yapma şansının en fazla %5 olmasını sağlar).

İstatistiksel güç

İstatistiksel güç, bir etki olduğu zaman bir etkiyi tespit etme olasılığı ile ilgilidir.

İstatistiksel Güç ve İstatistiksel Güven, bir A/B testinin gelişimini ölçmek için birlikte çalışan ilgili kavramlardır. İdeal olarak, her ikisi de testi bitirmeden önce eşik değerlerini geçmelidir (bununla ilgili daha fazla bilgi aşağıdadır).

Güven Aralığı ve Hata Marjı

Genel olarak, A/B testi denemenizin çıktısı 'Dönüşüm oranı %3 +/- %1' gibi bir şey olacaktır. Bu açıklamada, '%1' hata payınızı temsil eder. Kısacası, bu, test sonuçlarını kabul edilebilir tutmak için makul olan dönüşüm sonuçlarındaki sapmadır. Hata payı ne kadar küçük olursa, test sonuçlarınız o kadar güvenilir olur. Örneklem büyüklüğünüzü artırdıkça, hata payının azaldığını fark edeceksiniz.

Deneyimleri Dönüştür ile A/B testleri çalıştırırsanız , farklı aylık ziyaretçilere göre varyasyon, dönüşüm oranı, iyileştirme, güven ve dönüşümleri ayrıntılandıran Deneyim Raporuna erişebilirsiniz. Kazanan ilan etmek için en az %97 güven elde etmelisiniz. Varsayılan olarak, Convert platformu, yalnızca beş dönüşüm elde edildikten sonra denemenin analitiğini raporlamaya başlayacak şekilde optimize edilmiştir. Testlerin güvenilirliğini sağlamak için Convert, iki kuyruklu Z-Testleri kullanır.

Denemenizin başında, varyantlardan biri önemli ölçüde daha iyi performans gösteriyorsa, yine de öngörülen test süresine devam etmelisiniz. Erken sonuçlara gürültü veya rastgelelik neden olabilir.

Minimum Tespit Edilebilir Etkiler

MDE, üzerinde değişikliğin uygulamaya değer hale geldiği, ulaşılması gereken minimum artıştır. Düşük bir MDE seçerek bir teste hazırlanmak, denemenizin daha ayrıntılı değişiklikleri yakalamasına olanak tanır. Daha yüksek bir MDE ayarlamak, denemenizin yalnızca büyük değişiklikleri algılayabileceği ve dolayısıyla daha küçük örnek boyutlarıyla bile çalışabileceği anlamına gelir. Buradaki yakalama, yeterince büyük bir artış oluşturmak için büyük bir değişiklik yapmanın, çoğu durumda, web siteniz daha önce hiç optimize edilmedikçe mümkün olmayacağıdır.

MDE hakkında düşünmenin en iyi yolu, örnek boyutu hesaplayıcımızı kullanmaktır. Haftalık trafiğinizi ve dönüşümlerinizi girerek başlayın ve belirli bir süre içinde nelerin elde edilebileceğini görün.

Deneyimleri Dönüştür örnek boyutu hesaplayıcısı A/B testi istatistikleri

P-Değeri

Google'ın Baş Karar Bilimcisi Cassie Kozyrkov, P-Değerini açıklamak için çok basit bir tanım yaptı: “P-değeri ne kadar düşükse, sıfır hipotezi o kadar gülünç görünüyor!”

A/B testinde P değeri nedir?

P-değeri, sıfır hipotezinin doğru olduğunu varsayarak, gözlemlenenden aşırı veya daha aşırı bir sonucu gözlemleme olasılığı olarak tanımlanır. Bu nedenle, p değeri, boş hipotezin geçerliliğini kontrol etmek için matematiksel bir cihazdır. p değeri ne kadar küçükse, sıfır hipotezini reddetmemiz gerektiğinden o kadar emin oluruz.

Bunu kullanma şeklimiz, onu anlamlılık düzeyiyle karşılaştırmaktır. Diyelim ki %5 anlamlılık düzeyimiz var, bu doğrudan %95 güven düzeyine tekabül ediyor, o zaman p-değeri 5/100 = 0.05'in altına düşer düşmez, testimizin istatistiksel anlamlılığa ulaştığını söyleyebiliriz ve biz sıfır hipotezini reddedebilir.

Daha da emin olmak istiyorsak, anlamlılık düzeyimizi %1'e ayarlıyoruz ve ardından p-değerinin 0,01'in altına düşmesini bekliyoruz. Bu, sonuçlarımızda %99 güvene eşittir.

A/B testinde P değeri nedir? — Görüntü Kaynağı: John Quatro

Trafik Dağılımı

Trafik Dağılımı, belirli bir trafik yüzdesinin denemeye ayrılmasına yardımcı olur. Web sitenizi her ay 100 ziyaretçiniz olduğunu varsayalım. Bundan, trafiğin %30'unu denemeye ayırmayı seçebilirsiniz. Varsayılan olarak, A/B testinizdeki her değişken trafikten eşit pay alır. Dolayısıyla, iki varyantınız varsa, her biri trafiğin %15'ini alacaktır.

Dönüştürme Deneyimlerini kullanmak, bu trafik tahsisini birkaç tıklamayla yapılandırmanıza yardımcı olur. Deneme süreciniz geliştikçe daha fazla değişken oluşturabilir ve ayırmayı ihtiyaçlarınıza göre optimize edebilirsiniz.

İstatistikler A/B Testinde Nasıl Yardımcı Olabilir?

Neden Varyant A ve B'nin Performansını Karşılaştıramıyorsunuz?

Deneyimleri Dönüştür gibi uygun bir platform kullanarak bile bir A/B testi denemesi yürütmek, zaman ve enerji açısından bazı kaynaklar gerektirir. O halde, yalnızca iki değişken oluşturmak, ilgili dönüşüm oranlarını ölçmek ve daha iyi performansa sahip olanı seçmek mantıklı olmaz mı?

Pragmatik ve becerikli gibi görünse de, veriler üzerinde hiçbir istatistiksel test yapılmadığından yanlış sonuçlara ve hatta yanlış yorumlanmış sonuçlara yol açabilir. Yani bir değişikliği gözlemlemek yeterli değil, o değişiklikten emin olmak için ne kadar bekleyeceğini bilmeli ve bunun için Z-testi, T-testi veya G-testi gibi istatistiksel bir test yapmak gerekiyor.

Tek başına kaldırma veya etki boyutuna bakmak size yardımcı olmaz:

a. Bir Varyantın Kazanılmasıyla İlişkili Olası Nedensel Faktörleri Belirleyin

Tasarım gereği bir A/B testi, yalnızca bazı maddi farklılıkları olan iki değişken seçmenizi sağlar. Daha büyük bir fark kümesi için, genellikle daha kapsamlı bir çok değişkenli teste gidersiniz.

A/B testi, en başından itibaren, deneydeki bağımlı ve bağımsız değişkenleri bildiğiniz kuralına göre çalışır. Örneğin, aynı düzene yerleştirilmiş farklı CTA'lara sahip iki küme oluşturursanız, hipotezi çürütebilir ve dönüşümlerde bir değişiklik görebilirseniz, CTA'lardaki farkın nedensel faktör olduğunu bilirsiniz.

Tamamen farklı iki varyant çalıştırırsanız, birinde nispeten daha iyi çekiş elde etseniz bile, bu, hedef kitleniz hakkında bilgi edinmenize veya neden işe yaradığını belirlemenize yardımcı olmaz.

b. Rastgelelik ve Nedensellik Arasındaki Farkı Ayırın

Bir A/B testinin yapısı bir Boş Hipotez ve bir Alternatif Hipotez gerektirir. Boş Hipotezi genellikle, dönüşüm oranlarını belirlemede, değişkenlerinizden birinin etkinliğini değil, nedensel faktör olan rastgeleliği araştırır. Boş bir Hipotez, zaman içinde istatistiksel anlamlılığa ulaşılmadığında reddedilmez ve sonraki herhangi bir değişkenliğin rastgeleliğin sonucu olduğu varsayılır. Öte yandan, Sıfır Hipotezi'ni reddedebilirseniz, pozitif veya negatif etkisi olan nedensel bir faktör keşfetmiş olmanızın yüksek bir olasılığı (belirlenen güven düzeyinde, örneğin %95 veya %99) olduğu anlamına gelir. dönüşümler.

c. Maliyetleri Yalnızca İyileştirilmiş Dönüşüm Olasılığı Yüksek Olan Değişikliklere Tahsis Edin

Yürütülen A/B testleri ayrıca anlamlılık seviyeleri, güven aralıkları ve hata payları gibi istatistiksel ölçümlerle birlikte gelir. Bu tür analitik kavramlar çoğu geçici analizde mevcut değildir.

Örneğin, bilgi düzeni ve gösteriminde bazı maddi farklılıklar bulunan iki form gönderme sayfası arasında bir karşılaştırma yapın. Biri diğerinden nispeten daha iyi performans gösteriyor. Şimdi, sonuçları tekrarlayabileceğinize nasıl karar vereceksiniz? Deney sonuçlarının ne kadar önemli olduğunu gösteren herhangi bir veriye sahip olmadığınız için, deneyin sonuçlarının tekrarlanıp tekrarlanamayacağına karar vermenin bir yolu yoktur.

A/B Testi için Tip I ve Tip II Hatalarına Maruz Kalmanızı Değerlendirme ve Ortadan Kaldırma

Tip I hatalar (gerçek bir Boş Hipotez reddedilir veya yanlış bir pozitif olur) ve Tip II hatalar (yanlış bir Boş Hipotez reddedilmez veya yanlış bir negatif), A/B testi ile optimize ettiğiniz piyasa varlıkları üzerinde ciddi sonuçlar doğurabilir.

Hiçbir araç size Tip I veya Tip II hatayı açıkça gösteremez, ancak örneğin %95 veya daha fazla bir güven düzeyine ulaşıldığından ve istatistiksel gücün en az %80'e ulaştığından emin olarak bunları en aza indirmenize yardımcı olabilir.

Satın alma döngünüzde son sayfanın iki çeşidini yaptığınızı, 10 gün boyunca yaklaşık 10.000 ziyaretçiye gösterdiğinizi ve sonuçları aldığınızı varsayalım. Bir değişken için daha iyi performans görürsünüz ve bu nedenle bunu E-ticaret web sitenize uygularsınız.

Buradaki sorun, denemenizin sonuçlarını gerçekte tekrarlayamadığınızda A/B testi denemenizde bir Tip I veya Tip II hata hakkında bilgi sahibi olmanızdır. A/B testinizde Tip I ve Tip II hataları olmadığından emin olmanın daha iyi yolları vardır.

İlk olarak, örneklem büyüklüğünüzün sağlam istatistiksel deneyler yapmaya yetecek kadar büyük olduğundan emin olun. Doğru örnek boyutunu elde etmek için Convert'in hesap makinesini kullanabilirsiniz.

Ardından en az %95 anlamlılık düzeyine sahip olduğunuzdan emin olun ve gücünüz %80'e ulaşana kadar testi durdurmayın. Hesaplayıcı tarafından verilen doğru MDE ve deney uzunluğu ile, Tip I veya Tip II hataları kontrol ettiğinizden neredeyse emin olabilirsiniz. İlki, belirlediğiniz önem düzeyinden doğrudan etkilenir ve ikincisi, birlikte yaşamak istediğiniz istatistiksel güçten etkilenir. İdeal olarak, güven seviyeniz %95'e eşit veya daha üstün olmalı ve istatistiksel gücünüz en az %80'de birikmiş olmalıdır. Her iki durumda da, ne kadar çok olursa o kadar iyi. Her iki parametre de %99'a ulaşırsa, Tip I veya II hata riskinin iyi kontrol edilmesini ve %1'in altında olmasını sağlar.

Bu tür sorunların hem keşfi hem de ortadan kaldırılması, yalnızca A/B testinin üzerinde çalıştığı istatistiksel düşünce sayesinde mümkündür.

A/B Testi Denemenizin Ölçeklenebilir Olup Olmadığını Belirleme

Yukarıdaki örnekte, bir varyantın bir ay içinde alternatifini kazandığını görseniz bile, denemenizi kolayca ölçeklendiremezsiniz. Bunun nedeni, 10.000 ziyaretçinin örneklem büyüklüğünün oldukça küçük olmasıdır.

A/B testi istatistikleri, testinizin ve sonuçlarının ölçeklenebilir olmasını sağlamak için size birçok buluşsal kılavuz sağlar. Her A/B testi deneyinin çıktıları, gelecekte daha fazla testin önünü açacaktır.

İlk olarak, platformunuzun UI veya UX öğelerinin herhangi bir değişkenini test etmek için her ay yeterli trafiğinizin olduğundan emin olmakla başlayın. Convert uzmanları, istatistiksel olarak sağlam sonuçlar elde etmek için en az 10.000 ziyaretçi trafiğini ve her bir varyantta 1.000 dönüşüm önermektedir. Bunlara sahip olduğunuzda, birkaç öğeyi aynı anda test etmediğinizden, testin önemli bir süre boyunca çalışmasına izin verdiğinizden ve makul bir önem düzeyine ulaşabildiğinizden emin olun.

Küçük bir ziyaretçi grubunuz varsa, yine de e-posta kampanyaları, sosyal medya kampanyaları ve hatta Google Reklam Grupları üzerinde A/B testi yapabilirsiniz. Veya hedef kitleniz hakkında bazı geniş içgörüler elde etmek için yüksek bir MDE'yi seçebilirsiniz.

Deneyleri Uygun Maliyetli Yapmak

A/B testi için trafiğinizin herhangi bir yüzdesini ayırmak bir maliyettir. Kitlenize muhtemelen yetersiz bir sayfa veya UX öğesi gösteriyorsunuz ve bu nedenle bazı potansiyel gelirleri kaybediyor olabilirsiniz. A/B testi, bu kayıp olası gelirleri telafi edebilecek daha optimize edilmiş bir öğeyi veya sayfayı ölçeklendirmek için size kesin bir fikir verirken, bu maliyet, test sürecinizi optimize etmek için bir kısıtlama olarak kullanılabilir.

Bir A/B testi gerçekleştirdikten sonra, test edilecek birkaç varyantın daha olacağı bir A/B/n testine geçebilirsiniz.

Çevrimiçi olarak sunulan birçok ücretsiz hesap makinesi, bu testten doğru sonuçlar almak için ihtiyacınız olan örnek boyutunu size gösterecektir. Bu hesap makineleri basit bir varsayımla çalışır - bir A/B testi için örnek boyutunu hesaplayın ve ardından bunu deneydeki değişken sayısıyla çarpın. Bu, ilerlemek için verimsiz bir yoldur. Hesaplayıcımız, Šidak gibi verimli çoklu karşılaştırma düzeltme seçenekleri sunar; bu nedenle, yanlış hesaplamalardan kaynaklanan fazladan para harcamadan gerekli sonuçları aldığınızdan emin olmak için denemenizin her adımında daima doğru araçları kullanın.

Convert'in A/B Test Hesaplayıcısı ile testlerinizi planlamaya başlayın

Örneğinizdeki Rastgeleliği Tahmin Etme ve Kontrol Etme

Rastgeleliğin birkaç karmaşık matematiksel ilkesi olsa da, çoğu aynı özelliği gösterir - tahmin edilemezlik.

Rastgelelik, açıkça tanımlanmış nedenselliğin tersi olarak algılanabilir. Daha yüksek dönüşümden hangi unsurların sorumlu olduğunu bilmek yerine, sonuçlar için olası nedensel faktörler olarak bazı tanımlanmamış dış faktörlere güvenmeniz gerekir. Bu dış faktörleri kontrol etmediğiniz için test sonuçlarınızı geniş ölçekte tekrarlayamazsınız.

İstatistiksel olarak sağlam bir A/B test süreci kullanmıyorsanız, rastgeleliğin etkisini inceleme zahmetine girmezsiniz. Ancak, rastgelelik hala var olacak. Sonunda, test sırasında dönüşen ancak geniş ölçekte çalışmayan bir pazarlama varlığına sermaye dağıtabilirsiniz. Daha da kötüsü, mevcut dönüşüm huninizin etkisini azaltabilirsiniz.

A/B testi istatistikleri bu sorunu çözmenize yardımcı olabilir. Bir hipotez formüle ettiğinizde, değişen sonuçların nedeninin rastgelelik olabileceği bir senaryo yaratıyorsunuz. Bu senaryoyu çürütebilirseniz, özünde daha iyi dönüşümlerin nedeni olarak rastgeleliği reddetmiş olursunuz. Dönüşüm hunisindeki diğer alanlara odaklanan süreçte daha fazla test yaparak, dönüşüm optimizasyon sürecinde rastgelelik alanını daha da ortadan kaldırabilirsiniz.

İdeal olan, bir ana metrik ve diğer korkuluk metrikleri ile bir Genel Değerlendirme Kriterini (OEC) tanımlamak ve ilkini optimize etmek için deneyler yapmak ve sonrakilerin bozulmadığından emin olmaktır. Örneğin, dönüşüm oranlarını (birincil metrik) artırmak istiyorsunuz, ancak müşteri katılımının azalmasını istemiyorsunuz, çünkü bu, müşterilerin memnun olmadığını gösterir.

Harika bir kitap, muhtemelen bugüne kadarki deneyler üzerine en önemli kitap, Ron Kohavi, Diane Tang, Ya Xu tarafından yazılan Trustworthy Online Controlled Experiments: A Practical Guide to A/B Testing'dir.

Daha Kapsamlı Bir Çok Değişkenli Teste İhtiyacınız Olmamasını Sağlamak

Deneyimleri Dönüştür gibi kapsamlı araçlar, birden çok A/B testi çalıştırmanıza yardımcı olabilir. Bu önemsiz bir işlev gibi görünse de, daha kapsamlı bir çok değişkenli teste ihtiyacınız olup olmadığını veya A/B testinizin sonuçlarının yeterince tatmin edici olup olmadığını anlamanıza yardımcı olabilir.

Bütün bunlar, testin sonuçlarını anladıktan hemen sonra ne yaptığınıza bağlıdır. Kazanan sayfayı veya öğeyi dağıtmaya mı başlıyorsunuz yoksa daha fazla teste mi gidiyorsunuz? Örnek boyutunuz, önem düzeyiniz ve MDE yeterliyse, genellikle kazanan alternatifi kullanabilirsiniz. Diğer taraftaysanız, farklı dönüşüm oranlarının nedenini bulmak için daha fazla test yapabilirsiniz.

Örneğin, açılış sayfanızda belirli bir CTA'nın daha iyi dönüşümlere yardımcı olup olmadığını test ettiğinizi varsayalım. A/B testinizi yaptınız ve net bir kazananınız oldu. Ancak, anlamlılık düzeyi gibi bazı istatistiksel ölçüler tatmin edici değildir. Böylece, kazanan varyantı alır ve başka bir A/B testi yapmak için başka bir varyant oluşturursunuz.

Sonuçlar tekrarlanırsa, kazanan varyanta daha fazla güvenebilirsiniz. İlk testin dönüşüm düzeylerini tekrarlayamıyorsanız, dönüşümlerdeki artıştan sorumlu öğeyi bulmak için çok değişkenli bir teste ihtiyacınız olabilir.

A/B Testi Kendinden Bildirilen Verilere Bağımlılıktan Kaçınmanıza Yardımcı Olabilir

En küçük değişkenler bile algılanan kullanıcı davranışı üzerinde büyük bir etkiye sahip olabilir. Örneğin, titreme etkisinin dönüşüm oranları üzerinde önemli bir etkisi vardır. Titreme, bir ziyaretçi A/B testi için kullanılan örnek trafiğinizin bir parçası olduğunda, varsayılan açılış sayfanızın varyant sayfanızdan önce gösterildiği durumdur. Bu, analitik olarak tutarlı bir süreç yürütüyor olsanız bile kirli sonuçlara yol açabilir.

A/B testi gibi istatistiksel ve analitik süreçlerle ilgili olası sorunlar olduğunda, kendi kendine bildirilen bir süreci çalıştırmak yalnızca daha düşük ve hatta yanlış sonuçlara yol açabilir. Tercihleri hatırlama ve raporlama sorumluluğu dürüst olmak için herhangi bir teşviği olmayan kullanıcıya bırakıldığından, öz-raporlama süreçleri genellikle çeşitli önyargılar ve gürültülü verilerle kirlenir. Ayrıca, hatalı verilere yol açabilecek sıralama yanlılıkları ve diğer dış faktörler vardır.

A/B testi sizi gözlemci koltuğuna oturtur ve her türlü kullanıcı raporlaması ihtiyacını ortadan kaldırır. Dönüştür gibi araçlarla, titreme konusunda endişelenmenize bile gerek yok.

Kurumsal Karar Verme Verilerine Dayalı Yapmak

Bir A/B testi deneyi, süreçte tahminde bulunmaya yer bırakmaz. Her adımda, test platformunuz gözlemleri topluyor, verileri kaydediyor ve analiz yapıyor. Bu şekilde üstlerinizin, yatırımcılarınızın veya acentelerinizin tercihleri ne olursa olsun, elde edeceğiniz sonuçlar veriye dayalı olacaktır.

Sürece dahil olan birkaç paydaş olduğunda, nihai sonucun yetersiz olması kolaydır. A/B testi, bu tür hiyerarşik karar verme veya önyargılı düşünme alanını ortadan kaldıran analitik bir süreçtir.

Örneğin, ajansınız, açılış sayfanız için bir kullanıcı arayüzü revizyonu önerebilir, çünkü bu, ay için faturalandırılabilirlerine eklenecektir ve doğru şekilde yapılırsa, dönüşümlerinizi bile engellemeyebilir. Ancak, bir A/B testi ile, Sıfır Hipoteziniz güçlü kalırsa, şu an için böyle bir değişikliğin gerekli olmadığını bilirsiniz. Akıl yürütmenizi destekleyecek verilere sahip olduğunuz için, firmanızda liderlik pozisyonuna bile yenik düşmeniz gerekmez. Bu aynı zamanda HiPPO (En Yüksek Ücretli Kişinin Görüşü) ile savaşmanıza da yardımcı olabilir. Veriler yalan söylemez ve elinizdeki en iyi kanıt A/B testidir.

Şeffaf Hesaplamalarla Deney Sonuçlarını Anlama

A/B testinizin sonuçlarını anlamak, neredeyse istatistiksel olarak titiz bir test yapmak kadar önemlidir. Herhangi bir araç testi çalıştırabilir, alternatifleri karşılaştırabilir ve size bir kazanan verebilir. İhtiyacın olan şey nedensel bir ilişkinin göstergesi. İstatistiksel önlemler bunu vurgulayabilirken, Deneyimleri Dönüştür, hesaplamalarda şeffaflık için tasarlanmıştır.

Platform %99,99 çalışma süresine sahiptir, 90'dan fazla üçüncü taraf entegrasyonuna izin verir, üçüncü taraf hedef takibine izin verir ve kod ve hata kontrollerini destekler. Bu şekilde, test sürecinin sonunda, hangi öğenin kazanan olduğu, neden daha fazla tercih edildiği ve ölçekleme konusunda daha emin olmak için daha fazla teste ihtiyacınız olup olmadığı konusunda net bir fikre sahip olacaksınız.

CRO Olgunluğuna Doğru İlerlemek için A/B İstatistiklerini Kullanmak

CRO Olgunluğu Nedir ve İstatistiksel Olarak Sesli A/B Testi Hedefe Ulaşmanıza Nasıl Yardımcı Olabilir?

Dönüşüm Oranı Optimizasyonu izole bir düşünce şekli gibi görünse de, dönüşümlere daha fazla odaklanmaya çalışan şirket genelinde süreç tabanlı değişiklikler gerektirir. Buradaki zorluk, CRO'nun nispeten yeni bir alan olmasıdır. 2018'de yapılan bir ankette, pazarlamacıların yaklaşık %62'si 4 yıldan daha kısa bir süredir CRO'da çalışıyordu.

Shopify'dan bir CRO uzmanı, firmaların CRO olgunluğuna nasıl geçme eğiliminde olduğuna dair bir hiyerarşi oluşturdu. Bu hiyerarşiyi incelerken, kurumsal süreçlerinizi geliştirmek için sağlam istatistiksel deneylerin ne kadar kritik olduğunu keşfedeceksiniz:

1. Optimal Olmayan Temas Noktalarını Belirlemek için Niteliksel ve Niceliksel Araştırma Yürütme

Google Analytics gösterge tablonuz genellikle tüketici deneyiminde hemen ilgilenilmesi gereken sayfaları veya temas noktalarını keşfetmenize yardımcı olur. Ana sayfada yüksek hemen çıkma oranları, terk edilen sepetler, eksik form doldurma ve e-posta aboneliklerini atlama gibi belirli bir sorunu çözmek, dönüşüm hunisini optimize etmek için başlangıç noktası olarak kullanılabilir.

2. Daha Önce Gerçekleştirilen Araştırmalara Dayalı Test Etme ve Deneme Fikirleri Oluşturma

A/B testi istatistikleri, web sitenizin karşılaştırmalı performansını ve hatta rekabeti anlamanıza yardımcı olabilir. Bunu, hangi öğelerin geciktiğini anlamak ve daha iyi performans gösterebilecek A/B testi türevlerini başlatmak için kullanabilirsiniz.

3. En Yüksek Önceliklerle Test Etme ve Deneme Fikirleri Çalıştırma

Deneyimleri Dönüştür'de A/B testi fikirlerinizi ayarlarken, MDE gibi metrikler belirleyeceksiniz. Bu tür metrikler, denemeyi çalıştırmak için gerekli kaynak tahsisiyle ilgili olarak işiniz üzerinde maksimum etkiye sahip olacak testlere öncelik vermenize yardımcı olacaktır.

4. Test Sonuçlarının Analiz Edilmesi ve Kaydedilmesi

Testi gerçekleştirdikten sonra, gördüğünüz sonuçları neden aldığınızı anlamak kritik hale gelir. Bu, Deneyimleri Dönüştür gibi platformların rastgelelik ve yüksek olasılıklı nedensellik arasında filtreleme yapmanıza yardımcı olabileceği yerdir. Şeffaf hesaplamaları ile Deneyimleri Dönüştür, kazanan varyantınızın neden daha iyi performans gösterdiğini anlamanıza yardımcı olacaktır.

5. Takip Testleri Oluşturma

A/B testlerini yaptıktan ve sonuçları elde ettikten sonra, daha kapsamlı çok değişkenli testlere geçebilir veya başka bir değişkenle A/B testi yapabilirsiniz. Dönüştürme, kazanan varyantı destekleme konusundaki güveninizi artırmanıza yardımcı olabilecek çeşitli istatistiksel testler gerçekleştirmeyi kolaylaştırır.

CRO Olgunluk Modeli, bir firmanın Stratejisi ve Kültürü, Araçlar ve Teknolojisi, İnsanları ve Becerileri ve Süreç ve Metodolojisi genelinde bütünsel bir sürece odaklanır ve burada işletmenin ilerlemesi, Başlangıç, İstekli, İlerici, Stratejik, ve Dönüştürücü.

Deneyimleri Dönüştür, A/B test sürecinize titiz veri analizi getirir, testleri yürütmek için kodlama gerektirmez, görsel ve analitik olarak erişilebilir sonuçlar sağlar ve test sonuçları konusunda şeffaftır. A/B testi planlarınızın merkezinde yer alan platform sayesinde, kurumsal CRO Maturity'niz Dönüşüm aşamalarına daha kolay bir şekilde geçebilir.

Eylemde A/B Testi: Karşılaştırmalı Örnek Olay Çalışmaları

1. Hipotez Oluşturma için Google Analytics ve Dönüştürme Deneyimlerini Kullanma

Google Analytics, web sitenizdeki potansiyel iyileştirme alanlarını anlamak için harika bir başlangıç noktası olabilir. Trafikte ani düşüş, sayfa sürelerine kıyasla yüksek hemen çıkma oranları vb. olası sorunların güçlü göstergeleri olabilir.

Google Analytics raporlarınızda gördüğünüz tüm zorlukların haritasını çıkarın. Buna paralel olarak, web sitenizde, sosyal medya hesaplarınızda ve hedef kitlenize ne aradıklarını soran e-posta kampanyalarında niteliksel bir anket yapın. Buna ek olarak, ziyaretçilerin her sayfadaki öğelerde nasıl gezindiğini anlamak için Hotjar'ı kullanabilirsiniz.

Tüm bu verilere dayanarak, daha sonra anlayışlı varyantlar oluşturabilir ve A/B testleri çalıştırabilirsiniz. Deneyimleri Dönüştür'ü zaten kullanıyorsanız, süreci daha da hızlandırmak için Pusulayı Dönüştür hipotez oluşturma aracını da kullanabilirsiniz.

2. A/B Testi ile Terk Edilmiş Sepetlerden Dönüşümleri Artırma

Terk edilmiş sepetler web siteniz için pahalıdır ve ikiniz de bu noktaya gelmek için önemli miktarda zaman ve kaynak yatırdığınız için, ancak dönüşüm işe yaramadığı için ziyaretçileriniz için oldukça elverişsizdir.

Diğer platformlarla entegre Deneyimleri Dönüştür'ü kullanarak, bu zorluğun üstesinden gelmek için yapılandırılmış bir yaklaşım formüle edebilirsiniz.

İlk olarak, Deneyimleri Dönüştür'ü Shopify, WooCommerce, PrestaShop, BigCommerce veya kullandığınız diğer herhangi bir e-ticaret platformuna entegre ederek başlayın.
Ardından, platformlarınızda hedefler belirlemek için Google Analytics'i kullanın ve olası sorunu değerlendirmek için Hotjar veya Crazy Egg gibi araçları kullanın.
Deneyimleri Dönüştür ile bu verileri kullanabilir, hipotezler oluşturabilir ve A/B testlerini düzenli bir şekilde çalıştırabilirsiniz. Müşteriler, benzer bir yaklaşım kullanarak %26'nın üzerinde bir gelir artışı gözlemlediler.

Deneyimleri Dönüştür, 100'den fazla araçla entegre olur. Mevcut teknoloji yığınınızdaki araçlarla entegre olup olmadığımızı öğrenmek için veritabanımıza göz atın. Eğer yapmazsak, bize bir mesaj bırakın ve biz inşa edelim!

3. Açılış Sayfası Optimizasyonu

Açılış sayfaları, tüm dönüşüm sürecinin merkezinde yer alır. Açılış sayfalarınızdan maksimum değeri elde etmek için Google Analytics, Adobe Analytics, Kissmetrics, Baidu Analytics gibi çeşitli araçları veya kullanım durumu için diğer önde gelen araçlar kullanabilirsiniz. Deneyimleri Dönüştür, düşük dönüşümlü açılış sayfalarını filtrelemenize yardımcı olmak için bu platformlarla sorunsuz bir şekilde entegre olur.

Ardından, sayfanızın hangi öğelerinin çalışmadığını anlamak için Hotjar ve Convert entegrasyonunu kullanabilirsiniz. Isı haritaları gibi gelişmiş araçlarla, ziyaretçilerin sayfanızdaki farklı öğelere nasıl eriştiğini görsel olarak anlayabilirsiniz. Bunu geçtikten sonra, hipotezler oluşturmak için Dönüştürme Pusulası'nı kullanabilir ve ardından platformda testler çalıştırabilirsiniz.

Testinizi gerçekleştirdikten sonra, Convert ve LanderApp, Instapage veya Hubspot CMS gibi önde gelen açılış sayfası oluşturma platformları arasındaki entegrasyonu kullanabilirsiniz. Bu entegrasyonlar, açılış sayfalarınızda kolay A/B testi denemeleri yapmanıza yardımcı olacaktır.

Aynı iş akışını kullanan CRO uzmanları, sepete ekleme oranlarının %13 artmasıyla %27'lik dönüşüm artışları buldu.

'Hijyenik' A/B Testi ile Daha Yüksek Yatırım Getirisi Elde Etme

Web Sitesi Trafik Eşiği : Dönüştür, test edilen her değişken için en az 10.000 ziyaretçi trafiğiniz ve 1.000'in üzerinde dönüşüm elde etmenizi önerir.

A/B Testi için Doğru Aracı Kullanma : Doğru test platformuna sahip olmamak size kirli sonuçlar verebilir, yetersiz testler çalıştırmanıza veya kaynaklarınız üzerinde ciddi kısıtlamalara neden olabilir. Deneyimleri Dönüştür, test sürecinin erişilebilir, şeffaf ve sorunsuz olmasını sağlarken bu temel parametreleri ortadan kaldırmak için tasarlanmıştır.

Artık Deneyimleri Dönüştürme'de 15 güne kadar ücretsiz testler yapabilirsiniz. Diğer dönüşüm analizi araçlarınızla entegre olan sorunsuz, titreşimsiz ve şeffaf bir platformun nasıl hissettirdiği hakkında net bir fikir edineceksiniz.

Test Hedeflerini Tanımlama : Bir işletme olarak hedefleriniz uyumlu olmalıdır. Örneğin, maksimum kayıt için optimizasyon yaparken, ekibinizdeki diğer bazı birimler maksimum satış için takip eden süreçleri optimize etmemelidir. Tutarsız UX, optimal olmayan bir UX'den daha fazla zarar verebilir.

Bu nedenle, tüm ekip üyeleri kümesi arasında hedeflerin tekdüzeliğini koruyun. Test düzeyinde, A/B testinizi çalıştırmadan önce, çalıştırma sırasında ve sonrasında örnek boyutunu, süreyi, istatistiksel önemi, hipotezi ve MDE'yi net bir şekilde tanımladığınızdan emin olun.

Dahili Trafik Hariç: Bir A/B testi çalıştırırken, ekip üyelerinizin çoğu, sayfayı objektif olarak değerlendirmek için müşteri yolculuğundaki sayfaları veya noktaları ziyaret eder. Bu, test sonuçlarınıza gürültü getirebilir.

Deneyimleri Dönüştürme, bu tür trafiği filtrelemek ve yalnızca A/B test sürecinde verileri kaydetmek, toplamak ve analiz etmek için tanımladığınız hedef kitle segmentlerine odaklanmak üzere tasarlanmıştır.

A/B Test İstatistikleri Üzerine Son Düşünceler

A/B testi, yalnızca istatistiksel titizlikle yürütülebilen titiz bir analitik alıştırmadır. Süreçte yerleşik istatistikler olmadan, A/B testi tamamen tahmine dayalıdır.

Deneyimleri Dönüştürme, basitleştirilmiş, erişilebilir, güvenilir ve kaynak açısından verimli A/B testi deneyleri yapmanızı mümkün kılar. While the process of A/B testing can seem a little overwhelming at first, it certainly unlocks value in the form of the right insight and analytical proven ideas it gives you. Make sure you never run an A/B test in isolation – it has to be followed up with more tests, and even multivariate tests.
With consistent optimization and unlimited tests made available by Convert Experiences, you can expect your enterprise to become a more analytical and data-driven operation in no time.

Ücretsiz Deneme Değiştiricilerini Başlatın