A/B 測試統計:為什麼統計在實驗中很重要
已發表: 2020-11-16統計和 A/B 測試快速指南:您需要知道的術語
如果不掌握統計數據,幾乎不可能進行合理的 A/B 測試實驗。
雖然像 Convert Experiences 這樣的平台可以為您處理所有的統計測量、推理和分析,但對一些統計術語有基本的了解肯定會對您有所幫助。
讓我們從基礎開始。
樣本和總體
從理論上講,使用您網站的所有流量進行 A/B 測試可以讓您大致了解您的人口。 然而,這可能是對資源的次優利用,因為不可能捕獲全部人口。 這是樣本派上用場的地方。 雖然有不同的抽樣方法,但使用隨機抽樣方法有助於確保在樣本選擇中沒有固有的偏差。 這種方法的靈感來自於隨機對照試驗的藥學醫學實踐。
平均值、中位數和眾數
用最簡單的術語來說,均值代表平均值,中位數代表當所有數字線性對齊時位於中間的值(分佈中的第 50個百分位數),眾數是重複次數最多的值。 當您瀏覽 A/B 測試的摘要統計信息時,這三個術語會派上用場。
方差和標準差
這些是衡量數據點離散度的非常重要的概念。 換句話說,數據離平均值有多遠。 標準差是方差的平方根。 這就是為什麼標準偏差可以更好地判斷離散度的原因,因為它與平均值具有相同的測量單位。 例如,美國成年男性的平均身高為 70 英寸,標準偏差為 3 英寸。 如果我們在此示例中使用方差,則該值將是 9 平方英寸,因此不太直觀。 將標準偏差視為數據的“通常”偏差。
零假設和替代假設
一個 零假設訴諸現狀。 您的零假設會指出,您在數據中觀察到的任何變化(例如提升)都是由於純粹的隨機性。 另一種假設是更改不是隨機的,但它表明因果關係,這意味著您的更改確實對您的用戶產生了影響。
例如,假設您正在嘗試為您的目標網頁充實最佳標題。 您有一個控制變量和一個替代變量。 您運行 A/B 測試並獲得不同的轉化率,因此會有提升(正面或負面)。 這裡的零假設是差異是由於隨機性造成的。 替代假設將指出該變化可歸因於某個變體。
運行 A/B 測試時,您將獲得以下四種結果之一:
- 你拒絕零假設。
- 你沒有拒絕零假設。
- 你錯誤地拒絕了零假設。
- 你錯誤地沒有拒絕零假設。
理想情況下,結果 a 和 b 應該是目標,因為這些是您可以從中學習的場景。 這就是您如何使您的產品更好並最終增加您的底線的方法。 結果 c 和 d 對應於以下錯誤。
I 型和 II 型錯誤
A/B 測試可能結果中的最後兩個選項是 I 型和 II 型錯誤,也就是誤報和誤報。
I 型錯誤是您錯誤地拒絕了真正的空假設。 意思是,您觀察到的變化是偶然的,但您得出的結論並非如此,因此這是誤報。 在大多數情況下,減少誤報所需要做的就是提高達到統計顯著性所需的置信水平。 這通常設置為 95%,但對於關鍵任務實驗,您可能希望將其設置為 99% 的置信度,這樣可以將出現此類錯誤的機率降低到只有 1%。
II 型錯誤正好相反。 在這裡,您無法拒絕錯誤的零假設。 這意味著對轉化率有真正的影響,無論是正面的還是負面的,但它似乎沒有統計學意義,並且您錯誤地宣稱這是由於隨機機會造成的。 大多數情況下,這是由於缺乏統計能力。
用統計能力的說法,希臘字母 α 代表 I 類錯誤,β 代表 II 類錯誤。 很容易混淆統計功效和統計顯著性。
這張表清楚地表明:
統計置信度
您的測試獲得的訪問者越多,您的統計置信度就越高,如果您讓它運行足夠長的時間,它就會達到 99%。 但通常情況下,除非是關鍵任務,否則 95% 的置信水平對於大多數 A/B 測試來說已經足夠好(它確保了產生誤報的機會,即類型 I 錯誤最多為 5%)。
統計能力
統計功效與在存在效應時檢測到效應的概率有關。
Statistical Power 和 Statistical Confidence 是相關的概念,它們共同作用以衡量 A/B 測試的演變。 理想情況下,兩者都應該在結束測試之前通過閾值(更多內容見下文)。
置信區間和誤差幅度
通常,您的 A/B 測試實驗的輸出類似於“轉化率為 3% +/- 1%”。 在本聲明中,“1%”代表您的誤差幅度。 簡而言之,這是使測試結果保持可接受的合理轉換結果偏差。 誤差範圍越小,您的測試結果就越可靠。 隨著樣本量的增加,您會注意到誤差幅度在下降。
如果您使用 Convert Experiences 運行 A/B 測試,您可以訪問體驗報告,其中詳細說明了每月唯一訪問者的變化、轉化率、改進、信心和轉化。 您應該獲得至少 97% 的信心來宣布獲勝者。 默認情況下,Convert 平台已經過優化,僅在獲得五次轉化後才開始報告實驗分析。 為確保測試的可靠性,Convert 使用雙尾 Z 測試。
在您的實驗開始時,如果其中一個變體的表現明顯更好,您仍應繼續規定的測試持續時間。 早期結果可能是由噪聲或隨機性引起的。
最小可檢測效果
MDE 是要實現的最小提升,高於此更改變得值得實施。 通過選擇低 MDE 來準備測試可以讓您的實驗捕獲更細粒度的變化。 設置較高的 MDE 意味著您的實驗只能檢測到重大變化,因此即使樣本量較小也可以工作。 這裡的問題是,在大多數情況下,除非您的網站從未進行過優化,否則不可能進行大刀闊斧的改變以產生足夠大的提升。
考慮 MDE 的最佳方式是使用我們的樣本量計算器。 首先輸入您的每周流量和轉化次數,然後查看一段時間內可實現的目標。
P值
谷歌首席決策科學家 Cassie Kozyrkov 創造了一個非常簡單的定義來解釋 P 值:“p 值越低,零假設看起來越荒謬!”
A/B 測試中的 P 值是什麼?
P 值定義為假設零假設為真,觀察到的結果比觀察到的結果極端或更極端的概率。 因此,p 值是檢查零假設有效性的數學工具。 p 值越小,我們就越確定應該拒絕原假設。
我們使用它的方式是將其與顯著性水平進行比較。 假設我們有一個 5% 的顯著性水平,它直接對應於 95% 的置信水平,那麼一旦 p 值變得低於 5/100 = 0.05,我們可以說我們的檢驗達到了統計顯著性並且我們可以拒絕原假設。
如果我們想更加確定,我們將顯著性水平設置為 1%,然後等待 p 值降至 0.01 以下。 這相當於對我們的結果有 99% 的信心。
流量分佈
流量分配有助於將一定比例的流量分配給實驗。 假設您每個月有 100 位訪問者訪問您的網站。 由此,您可以選擇將 30% 的流量分配給實驗。 默認情況下,A/B 測試中的每個變體都將獲得同等份額的流量。 因此,如果您有兩個變體,每個變體將獲得 15% 的流量。
使用轉換體驗可幫助您通過幾次單擊配置此流量分配。 隨著實驗過程的發展,您可以創建更多變體並優化分配以滿足您的需求。
統計數據如何幫助 A/B 測試?
為什麼不能只比較變體 A 和 B 的性能?
即使使用像 Convert Experiences 這樣方便的平台來運行 A/B 測試實驗,也需要一些時間和精力方面的資源。 那麼,僅僅創建兩個變體,衡量它們各自的轉化率,然後選擇一個性能更好的變體不是有意義嗎?
雖然這聽起來務實且足智多謀,但它可能導致錯誤的結論,甚至曲解結果,因為沒有對數據進行統計測試。 因此,觀察變化是不夠的,必須知道要等待多長時間才能確定變化,為此,必須執行 Z 檢驗、T 檢驗或 G 檢驗等統計檢驗。
僅查看提升或效果大小不會幫助您:
一個。 確定與贏得一個變體相關的可能的因果因素
根據設計,A/B 測試會限制您選擇只有一些實質性差異的兩種變體。 對於更大的差異集,您通常會進行更廣泛的多變量測試。
A/B 測試的運行規則是,從一開始,您就知道實驗中的因變量和自變量。 例如,如果您創建兩個具有不同 CTA 的集合併放置在相同的佈局中,那麼如果您可以反駁假設並看到轉化率的變化,您就會知道 CTA 的差異是因果因素。
如果您只是運行兩種完全不同的變體,即使您在其中一種上獲得了相對更好的牽引力,它也無助於您深入了解您的受眾或確定它為什麼起作用。
灣。 區分隨機性和因果性
A/B 測試的結構需要一個零假設和一個替代假設。 在確定轉化率時,零假設通常會圍繞隨機性作為因果因素而不是您的變體之一的功效進行研究。 當沒有及時達到統計顯著性時,不會反駁零假設,並且任何後續的可變性都被假定為隨機性的結果。 另一方面,如果你能拒絕零假設,這意味著你發現了一個對假設有正面或負面影響的因果因素的可能性很高(在設定的置信水平上,例如 95% 或 99%)。轉換。
C。 僅將成本分配給提高轉化率的更改
進行的 A/B 測試還將附帶統計量度,例如顯著性水平、置信區間和誤差幅度。 大多數臨時分析中不存在此類分析概念。
例如,比較兩個在信息佈局和顯示方面存在重大差異的表單提交頁面。 一個比另一個表現相對更好。 現在,您如何確定您將能夠複製結果? 由於您沒有任何數據表明實驗結果的重要性,因此無法判斷實驗結果是否可以復制。
評估和消除 A/B 測試中 I 類和 II 類錯誤的風險
I 類錯誤(真正的空假設被拒絕或誤報)和 II 類錯誤(錯誤的空假設未被拒絕或誤報)可能會對您通過 A/B 測試優化的市場資產產生嚴重後果。
沒有工具可以明確向您顯示 I 型或 II 型錯誤,但它可以幫助您將它們最小化,例如,確保達到 95% 或更高的置信水平,並且統計功效至少達到 80%
假設您在購買週期中製作了最終頁面的兩個變體,在 10 天內將其展示給大約 10,000 名訪問者,並獲得結果。 您會看到一種變體的性能更好,因此將其應用於您的電子商務網站。
這裡的問題是,在您無法在現實中復制實驗結果後,您將了解 A/B 測試實驗中的 I 類或 II 類錯誤。 有更好的方法可以確保您的 A/B 測試中沒有 I 型和 II 型錯誤。
首先,確保您的樣本量足夠大,以確保進行合理的統計實驗。 您可以使用 Convert 的計算器來獲得正確的樣本量。
然後,確保您的顯著性水平至少為 95%,並且在您的功效達到 80% 之前不要停止測試。 通過計算器給出的正確 MDE 和實驗長度,您幾乎可以確保控制 I 類或 II 類錯誤。 前者直接受您設置的顯著性水平的影響,而後者受您願意接受的統計能力的影響。 理想情況下,您的置信水平應高於或等於 95%,並且您的統計功效應累積到至少 80%。 在這兩種情況下,越多越好。 如果兩個參數都達到 99%,則可以確保 I 類或 II 類錯誤的風險得到很好的控制,低於 1%。
僅由於 A/B 測試所依據的統計思維,才能發現和消除此類問題。
確定您的 A/B 測試實驗是否可擴展
在上面的示例中,即使您看到一個變體在一個月內戰勝了其替代方案,您也無法輕鬆擴展您的實驗。 這是因為 10,000 名訪問者的樣本量非常小。
A/B 測試統計數據為您提供了許多啟發式指南,以確保您的測試具有可擴展性,其結果也是如此。 每個 A/B 測試實驗的輸出都將為未來的更多測試鋪平道路。
首先,首先確保您每個月都有足夠的流量來測試您平台的 UI 或 UX 元素的任何變體。 Convert 的專家建議每個變體至少有 10,000 名訪問者的流量和 1,000 次轉化,以獲得統計上合理的結果。 一旦你有了這些,請確保你沒有同時測試多個元素,允許測試運行相當長的時間,並且可以達到合理的顯著性水平。
如果您有一小部分訪問者,您仍然可以對電子郵件活動、社交媒體活動甚至 Google 廣告組進行 A/B 測試。 或者,您可以選擇高 MDE 以獲得有關您的受眾的廣泛見解。
使實驗具有成本效益
為 A/B 測試分配任何百分比的流量都是有成本的。 您正在向您的觀眾展示一個可能不是最佳的頁面或 UX 元素,因此可能會失去一些潛在的收入。 雖然 A/B 測試會給你一個明確的想法來擴展一個更優化的元素或頁面,這可以彌補這些損失的可能收入,但這個成本可以用作優化測試過程的約束。
進行 A/B 測試後,您可以繼續進行 A/B/n 測試,在該測試中您將有更多的變體要測試。
許多在線提供的免費計算器會向您顯示此測試獲得準確結果所需的樣本量。 這些計算器基於一個簡單的假設運行——計算 A/B 測試的樣本量,然後將其與實驗中的變體數量相乘。 這是一種低效的進行方式。 我們的計算器提供高效的多重比較校正選項,例如 Šidak,因此請始終在實驗的每一步使用正確的工具,以確保您獲得必要的結果,而不會因計算錯誤而損失額外的資金。
使用 Convert 的 A/B 測試計算器開始計劃您的測試
估計和控製樣本中的隨機性
雖然隨機性有幾個複雜的數學原理,但它們中的大多數都表明了相同的特徵——不可預測性。
隨機性可以被視為與明確定義的因果關係相反。 您不必知道哪些因素導致了更高的轉化率,而不得不依賴一些未定義的外部因素作為結果的可能因果因素。 由於您無法控制這些外部因素,因此您無法大規模複製您的測試結果。
如果您沒有使用統計上合理的 A/B 測試過程,您就不會費心檢查隨機性的影響。 但是,隨機性仍然存在。 您最終可能會在測試期間轉換但無法大規模運作的營銷資產上部署資金。 更糟糕的是,您最終可能會削弱現有轉化渠道的影響。
A/B 測試統計可以幫助您解決這個問題。 當您制定假設時,您正在創建一個場景,其中隨機性可能是導致結果更改的原因。 如果您可以反駁這種情況,那麼您實質上已經駁斥了隨機性作為更好轉換的原因。 隨著流程中更多的測試集中在轉化漏斗中的其他區域,您可以進一步消除轉化優化過程中的隨機空間。
理想的情況是定義一個包含一個主要指標和其他護欄指標的總體評估標準 (OEC),並運行實驗以優化前者,同時確保後者不會降級。 例如,您希望提高轉化率(主要指標),但不希望用戶參與度下降,因為這表明客戶不滿意。
一本很棒的書,可能是迄今為止關於實驗的最重要的書,是可信賴的在線控制實驗:A/B 測試的實用指南,作者:Ron Kohavi、Diane Tang、Ya Xu。
確保您不需要更全面的多變量測試
Convert Experiences 等綜合工具可以幫助您運行多個 A/B 測試。 雖然這聽起來像是一個微不足道的功能,但它可以幫助您了解您是否需要更全面的多變量測試,或者您的 A/B 測試結果是否足夠令人滿意。
所有這些都取決於您在了解測試結果後立即執行的操作。 您是開始部署獲勝的頁面或元素,還是進行進一步的測試? 如果您的樣本量、顯著性水平和 MDE 都令人滿意,您通常可以部署獲勝的替代方案。 如果您在另一邊,您可以使用進一步的測試來找出不同轉換率的原因。
例如,假設您正在測試著陸頁上的某個 CTA 是否有助於提高轉化率。 你運行你的 A/B 測試並有一個明顯的贏家。 但是,一些統計指標,如顯著性水平,並不滿足。 因此,您採用獲勝的變體並創建另一個變體來進行另一個 A/B 測試。
如果結果被複製,您可以對獲勝的變體有更高的信心。 如果您無法複製第一個測試的轉化水平,您可能需要進行多變量測試來找到導致轉化提升的元素。
A/B 測試可以幫助您避免依賴自我報告的數據
即使是最小的變量也會對檢測到的用戶行為產生重大影響。 例如,閃爍效果對轉化率有相當大的影響。 閃爍是當訪問者是用於 A/B 測試的示例流量的一部分時,默認登錄頁面顯示在變體頁面之前的情況。 這可能會導致結果受到污染——即使您正在運行分析一致的流程。
當 A/B 測試等統計和分析過程可能存在問題時,運行自我報告的過程只會導致更多次優甚至錯誤的結果。 自我報告過程經常受到一些偏見和嘈雜數據的污染,因為記住偏好和報告偏好的全部責任都留給了用戶,他們沒有任何誠實的動機。 此外,還有可能導致數據錯誤的排序偏差和其他外部因素。
A/B 測試讓您坐在觀察椅上,無需任何形式的用戶報告。 使用 Convert 等工具,您甚至不必擔心閃爍。
使組織決策數據驅動
A/B 測試實驗在此過程中不留任何猜測空間。 在每一步,您的測試平台都在收集觀察結果、記錄數據並執行分析。 這樣,無論您的上級或投資者或機構的偏好如何,您獲得的結果都將是數據驅動的。
當過程中涉及多個利益相關者時,最終結果很容易出現次優。 A/B 測試是一個分析過程,它消除了任何此類分層決策或偏見思維的空間。
例如,您的代理機構可能會建議對您的著陸頁進行 UI 大修,因為這會增加他們當月的帳單,如果做得好,甚至可能不會妨礙您的轉化。 但是,通過 A/B 測試,如果您的 Null Hypothesis 保持強大,您就會知道暫時不需要進行此類更改。 既然你有數據來支持你的推理,你就不必屈服於你公司的領導地位。 這也可以幫助您對抗 HiPPO(最高薪人士的意見)。 數據不會說謊,A/B 測試是您可以使用的最佳證明。
通過透明計算了解實驗結果
了解 A/B 測試的結果幾乎與運行統計嚴格的測試一樣重要。 任何工具都可以運行測試、比較備選方案並為您贏得勝利。 您需要的是因果關係的指示。 雖然統計措施可以突出這一點,但轉換體驗的設計旨在提高計算的透明度。
該平台有 99.99% 的正常運行時間,允許 90 多個第三方集成,允許第三方目標跟踪,並支持代碼和錯誤檢查。 這樣,在測試過程結束時,您將清楚地知道哪個元素是贏家,為什麼它更可取,以及是否需要更多測試才能更有信心擴展它。
使用 A/B 統計數據走向 CRO 成熟度
什麼是 CRO 成熟度?統計上合理的 A/B 測試如何幫助您實現目標?
雖然轉化率優化似乎是一種孤立的思維方式,但它需要整個公司進行基於流程的變革,以更加專注於轉化。 挑戰在於 CRO 是一個相對較新的領域。 在 2018 年的一項調查中,接近 62% 的營銷人員在 CRO 工作的時間不到 4 年。
Shopify 的 CRO 專家創建了公司如何傾向於超越 CRO 成熟度的層次結構。 當您深入研究此層次結構時,您會發現合理的統計實驗對於發展您的組織流程至關重要:
1. 進行定性和定量研究以識別次優接觸點
您的 Google Analytics(分析)儀表板通常會幫助您探索消費者體驗中需要立即關注的頁面或接觸點。 解決主頁跳出率高、購物車廢棄、表單填寫不完整和跳過電子郵件訂閱等特定問題可以作為優化轉化漏斗的起點。
2. 在前期研究的基礎上製定測試和實驗思路
A/B 測試統計數據可以幫助您了解您的網站甚至競爭的基準性能。 您可以使用它來了解哪些元素是滯後的,並開始執行更好的 A/B 測試變體。
3. 以最高優先級運行測試和試驗想法
在轉換體驗中設置 A/B 測試想法時,您將設置 MDE 等指標。 這些指標將幫助您優先考慮對您的業務產生最大影響的測試,涉及運行實驗所需的資源分配。
4. 分析和記錄測試結果
進行測試後,了解為什麼會得到您所看到的結果變得至關重要。 這就是轉換體驗等平台可以幫助您在隨機性和高概率因果關係之間進行過濾的地方。 憑藉其透明的計算,Convert Experiences 將幫助您了解為什麼您的獲勝變體表現更好。
5. 創建後續測試
進行 A/B 測試並獲得結果後,您可以繼續進行更全面的多變量測試或使用另一個變體進行 A/B 測試。 Convert 可以輕鬆進行各種統計測試,幫助您增強支持獲勝變體的信心。
CRO 成熟度模型側重於跨公司戰略與文化、工具與技術、人員與技能以及流程與方法論的整體流程,其中跨成熟度級別跟踪企業的進展,如初學者、有抱負、進步、戰略、和變革。
Convert Experiences 為您的 A/B 測試過程帶來了嚴格的數據分析,不需要編碼來進行測試,提供可視化和分析可訪問的結果,並且測試結果是透明的。 將平台作為 A/B 測試計劃的核心,您的企業 CRO 成熟度可以更輕鬆地進入轉型階段。
A/B 測試在行動:基準案例研究
1. 使用谷歌分析和轉換經驗來生成假設
谷歌分析可以成為了解整個網站潛在改進領域的一個很好的起點。 與頁面時間相比,流量突然下降、跳出率高等可能是潛在問題的有力指標。
列出您在 Google Analytics(分析)報告中看到的所有挑戰。 與此同時,對您的網站、社交媒體句柄和電子郵件活動進行定性調查,詢問您的受眾他們在尋找什麼。 除此之外,您還可以使用 Hotjar 來了解訪問者如何瀏覽每個頁面上的元素。
然後,您可以根據所有這些數據創建有洞察力的變體並運行 A/B 測試。 如果您已經在使用 Convert Experiences,您還可以使用 Convert Compass 假設生成工具來進一步加快流程。
2. 通過 A/B 測試增加廢棄購物車的轉化率
廢棄的購物車對您的網站來說很昂貴,對您的訪問者來說也很不方便,因為你們倆都投入了大量的時間和資源來實現這一點,但轉換沒有成功。
使用與其他平台集成的轉換體驗,您可以製定結構化的方法來應對這一挑戰。
- 首先,首先將 Convert Experiences 集成到您的 Shopify、WooCommerce、PrestaShop、BigCommerce 或您正在使用的任何其他電子商務平台。
- 然後,使用 Google Analytics 在您的平台上設置目標,並使用 Hotjar 或 Crazy Egg 等工具來評估可能的問題。
- 借助轉換體驗,您可以使用這些數據、制定假設並以有組織的方式運行 A/B 測試。 使用類似方法,客戶觀察到收入增長超過 26%。
Convert Experiences 與 100 多種工具集成。 查看我們的數據庫,了解我們是否與您當前技術堆棧中的工具集成。 如果我們不這樣做,請給我們留言,我們將構建它!
3.登陸頁面優化
登陸頁面是整個轉換過程的核心。 要從您的登錄頁面中獲取最大價值,您可以使用各種工具,例如 Google Analytics、Adobe Analytics、Kissmetrics、百度分析或其他用於該用例的領先工具。 Convert Experiences 與這些平台無縫集成,可幫助您過濾低轉化率的登錄頁面。
接下來,您可以使用 Hotjar 和 Convert 集成來了解頁面的哪些元素不起作用。 借助熱圖等高級工具,您可以直觀地了解訪問者如何訪問您頁面上的不同元素。 除此之外,您可以使用 Convert Compass 生成假設,然後在平台上運行測試。
進行測試後,您可以使用 Convert 與領先的登陸頁面構建平台(如 LanderApp、Instapage 或 Hubspot CMS)之間的集成。 這些集成將幫助您在登錄頁面上運行簡單的 A/B 測試實驗。
使用相同的工作流程,CRO 專家發現轉化率增加了 27%,添加到購物車的比率上升了 13%。
通過“衛生”A/B 測試實現更高的投資回報率
- 網站流量閾值:Convert 建議您擁有至少 10,000 名訪問者的流量和超過 1,000 的轉化率,可用於每個被測試的變體。
- 使用正確的 A/B 測試工具:沒有正確的測試平台會給你帶來污染的結果,讓你運行次優的測試,或者對你的資源造成嚴重的限制。 Convert Experiences 旨在消除這些關鍵參數,同時確保測試過程可訪問、透明和無縫。
您現在可以在 Convert Experiences 中免費運行測試長達 15 天。 您將清楚地了解與您的其他轉化分析工具集成的無縫、無閃爍和透明平台的感覺。
- 定義測試目標:您作為企業的目標必須保持一致。 例如,當您優化最大註冊量時,您團隊中的其他一些單位不應該優化後續流程以獲得最大銷售額。 不連貫的用戶體驗比次優用戶體驗造成的損害更大。
因此,在整個團隊成員中保持目標的一致性。 在測試級別,確保在運行 A/B 測試之前、期間和之後清楚地定義樣本量、持續時間、統計顯著性、假設和 MDE。
- 排除內部流量:當您運行 A/B 測試時,您的許多團隊成員會訪問客戶旅程中的頁面或點以客觀地評估頁面。 這會給您的測試結果帶來噪音。
Convert Experiences 旨在過濾此類流量並僅關注您定義的細分受眾群,以便在 A/B 測試過程中記錄、匯總和分析數據。
關於 A/B 測試統計的最終想法
A/B 測試是一項嚴格的分析工作,只能在統計嚴謹的情況下運行。 如果沒有構建過程中的統計數據,A/B 測試純屬猜測。
Convert Experiences 使您能夠進行簡化、可訪問、可靠且資源高效的 A/B 測試實驗。 While the process of A/B testing can seem a little overwhelming at first, it certainly unlocks value in the form of the right insight and analytical proven ideas it gives you. Make sure you never run an A/B test in isolation – it has to be followed up with more tests, and even multivariate tests.
With consistent optimization and unlimited tests made available by Convert Experiences, you can expect your enterprise to become a more analytical and data-driven operation in no time.