多變量測試:如何運行最佳測試以獲得最佳結果

已發表: 2017-02-09

A/B 測試是為您的點擊後著陸頁尋找優化想法的最簡單方法之一,但它並不總是最有效的方法。

在您開始一次測試兩個、三個或四個頁面之前,了解如何測試更多,並發現元素的最佳組合來轉換您的訪問者。

A/B 測試是優化點擊後登錄頁面的最簡單方法之一,但它並不總是最有效的。

點擊鳴叫

什麼是 A/B 測試?

A/B 測試,也稱為拆分測試,可讓您比較網頁的兩個不同版本,以確定哪個版本能更好地轉化訪問者。

這兩個頁面可以是:

  • 稍微不一樣

如果你有一個高轉化率的設計並且你想弄清楚如何改進單個元素,你可以測試兩個不同的頁面,只有一個不同。 如果你想看看是好奇心標題還是以新聞為中心的標題表現更好,你可以測試標題與標題。 如果您想查看視頻或 gif 對轉化的影響更大,您可以在每個頁面上測試一個。

在為每個人帶來相同的流量後,產生最多轉化的人就是贏家。 一個產生更多轉化的原因很明顯,因為兩個頁面之間只有一個區別。

  • 截然不同

您還可以測試以多種方式不同的兩個頁面。 您的原始頁面可以具有與變體不同的標題、特色圖片和號召性用語按鈕。 測試它可能看起來像這樣:

此圖向營銷人員展示了多變量測試如何與點擊後登錄頁面佈局以及版本 A 和版本 B 配合使用。

在為原始頁面(A 或“控制”)和變體頁面 (B) 帶來相同的流量後,轉化率更高的頁面成為贏家。 但與每次測試僅更改一個元素不同,當您測試截然不同的頁面時,無法確定特定頁面獲勝的原因。

以上述示例的結果為例,我們只能知道版本“b”優於版本“a”,但不知道它更好的原因,因為它可以歸因於多種原因。 轉化可能來自導航欄從左到右的調整,或者來自註冊表單從上到下的調整。 當你對截然不同的設計進行 A/B 測試時,你所能確定的就是一頁比另一頁好。

但是,您可以運行一種不同類型的測試來確定多個元素的更改如何相互影響。 這稱為多變量測試。

什麼是多變量測試?

多變量測試是優化器用來比較兩個不同網頁的過程。 該方法側重於比較多個元素之間的細微變化,然後測量這些元素如何相互作用,目標是找​​到表現最好的元素。

A/B測試和多變量測試的區別

您可能已經閱讀了很多 A/B 測試案例研究,這些案例研究通過將一個標題與另一個標題進行比較,或者將特色圖片與視頻進行比較,或者將一個號召性用語與一個略有不同的號召性用語進行比較,從而找到一個成功的頁面。 雖然它們可以用來準確地做到這一點,但根據 Widemile 的優化人員的說法,還有一種使用 A/B 測試的更理想的方法:

此圖向營銷人員展示了多元測試和 A/B 測試的最大區別以及何時使用每種方法。

他們說,A/B 測試的理想用途是“測試兩個或更多完全不同的頁面”。 在測試方面,最好進行 A/B 測試以找到所謂的“全局最大值”,然後進行多變量測試以優化“局部最大值”。

全局最大值和局部最大值

儘管這很難做到,但請想像一下,您一生中從未吃過一勺冰淇淋,而您正站在一家冰淇淋店裡,試圖決定要購買 30 種不同口味中的哪一種.

有 10 種不同的巧克力、10 種不同的香草和 10 種不同的草莓。 在決定要一勺之前,您是否打算嘗試所有 30 種口味?

可能不會。 您可能會嘗試每種截然不同的口味中的一種——一種巧克力、一種草莓和一種香草——以縮小您最喜歡的品種範圍。 如果您發現自己喜歡巧克力勝過香草和草莓,您將開始嘗試“巧克力曲奇麵團”、“巧克力花生醬”和“巧克力軟糖”等口味,以決定您最喜歡哪種巧克力。

在統計術語中,我們將您最喜歡的品種(巧克力、香草或草莓)稱為全球最大。 這是三種截然不同的類型中最適合您的口味。 該品種的特定風味(巧克力軟糖、巧克力曲奇麵團、巧克力花生醬)將是當地的最大風味。 這是您選擇的品種的最佳版本。

作為優化器,您希望以類似的方式進行測試。 您想要找到最能轉化訪問者的頁面(全局最大值),然後調整該頁面上的特定元素以將其改進為轉化率最高的頁面(局部最大值)。 您正在尋找的內容將決定您使用哪種測試。

何時使用 A/B 測試以及何時使用多變量測試

A/B 測試最適合測試全局最大值。 他們最擅長發現訪問者想要在哪個頁面上進行轉換。 以 MarketingExperiments 的這個例子為例,該公司使用 A/B 測試幫助 Investopedia 提高其時事通訊 Investopedia Advisor 的轉化率。

報價很簡單——一份帶有股票提示的免費時事通訊——所以原始頁面反映了這一點。 它不長,不復雜,也不雜亂無章。 它具有一個單一字段的潛在客戶捕獲表格、帶項目符號的副本和一個信息圖:

這張圖片向營銷人員展示了 Investopedia 如何在其簡短的點擊後登錄頁面上使用多變量測試來提高其轉化率。

但是,儘管提供了有價值的免費優惠,但它的轉化率僅為 1.33%。 MarketingExperiments 的團隊決定徹底修改頁面。 他們更改了標題、佈局、CTA 按鈕,並添加了一些徽章等。 然後他們對新頁面與原始頁面進行了 A/B 測試,發現新頁面的轉化率高出 89.4%。 這是它的樣子:

這張圖片向營銷人員展示了 Investopedia 如何在其較長的點擊後登錄頁面上使用多變量測試來提高其轉化率。

重要的是要記住,在這個 A/B 測試中,實驗者並沒有弄清楚為什麼新頁面的轉化率比舊頁面高,但他們確實找到了一個更高的轉化率。 換句話說,他們發現了一個新的全局最大值。 屆時,如果他們願意,他們可以通過多變量測試來優化此頁面,以確定哪種元素組合可以轉化最多的訪問者。

例如,這正是來自 Optimizely 的這個假設示例中的測試人員想要做的。 他們想弄清楚標題和圖片的哪種組合可以轉化最多的訪問者。

這張圖片向營銷人員展示瞭如何使用標題和圖片進行多變量測試。

因此,他們創建了多個包含不同標題和圖片組合的頁面,以查看效果最佳的頁面。

這張圖片向營銷人員展示瞭如何使用多變量測試來測試圖像和標題組合,以確定獲勝的變體。

測試中出現的這四個版本中轉換率最高的版本就是贏家。 如果帶燈泡的兩個版本比帶齒輪的兩個版本表現更好,您可能會得出結論,燈泡圖像對轉化率的影響最大。 從那裡,您會看到哪個附帶的標題產生了更多的轉化,並使用該頁面。

如何進行多變量測試

幾年前,當 VWO 創始人帕拉斯·喬普拉 (Paras Chopra) 想要提高他網頁上的下載量時,他使用多變量測試來弄清楚如何做。 如果您熟悉執行 A/B 測試的步驟,就會認出此多變量測試示例中的大部分步驟。

1. 確定問題

在開始改進您的網頁之前,最好深入研究數據並找出訪問者如何與之交互。 他發現人們點擊他的“下載”按鈕的次數沒有他預期的那麼多,因此他調查了頁面以找出原因。

2. 提出假設

仔細檢查後,他發現下載鏈接很不引人注意。 所以他創建了一個改進頁面的假設:

讓訪問者註意到下載鏈接的一個明顯解決方案是使下載部分成為頁面最突出的部分。 在頁面設計中,“下載”標題的大小和顏色很好地融入了頁面的其餘部分,導致人們錯過了下載鏈接。

通過使“下載”鏈接更加引人注目,他相信他能夠提高轉化率。 以下是他決定這樣做的方式。

3.創造變化

現在是時候為測試創建變體頁面了。 根據帕拉斯:

對於多變量測試,我在頁面上選擇了兩個因素來創建變體:側邊欄中的“下載”標題及其下方的“PDFProducer”下載鏈接。 測試的重點是觀察“免費”一詞的效果以及突出下載部分的效果。

以下是他決定如何讓下載部分更加引人注目和更具吸引力。

對於最初的“下載”鏈接,他測試了三種不同的變體:

  • 紅色的“下載”
  • 紅色的“免費下載”
  • 默認顏色的“下載”,但字體更大

對於原始的“PDFProducer”鏈接,他測試了兩種不同的變體:

  • 默認顏色的“PDFProducer”,但字體更大
  • 紅色的“PDFProducer”

這是所有組合的樣子:

這張圖片向營銷人員展示了不同的“下載”和副標題文本組合如何幫助確定獲勝的變體。

使用四個版本的下載鏈接(包括原始版本)和三個版本的“PDFProducer”文本(同樣,包括原始版本),形成了 12 個不同的變體以進行全因子測試。 完全析因測試所有組合,而不是僅測試最有影響力的部分析因。

CXL 的 Alex Birkett 聲稱,雖然有多種多變量分析方法——全析因、部分析因和田口分析——但大多數優化人員建議運行全析因以提高準確性。

4. 確定樣本量

在開始為您的頁面增加流量之前,您需要確定您的樣本大小——在您對測試結果做出結論之前每個頁面需要產生的訪問者數量。

VWO 的這個計算器將幫助您計算出有多少訪問者,以及您需要根據您的網站流量、您有多少變化以及您的統計顯著性運行測試多長時間。

要了解有關達到統計顯著性的更多信息,以及您需要輸入計算器的所有內容,請查看此博客文章。

5. 測試你的工具

在開始運行流量之前測試所有內容。 您的點擊後登錄頁面在每個瀏覽器中看起來都一樣嗎? 您的 CTA 按鈕是否有效? 您廣告中的所有鏈接都正確嗎?

在開始投放任何內容之前,務必對廣告系列的各個方面進行質量檢查,以確保不會影響您的結果。

6.開始增加流量

現在您已經創建了您的變體並且知道您需要為每個變體產生多少流量,開始為它們吸引流量是安全的。 多變量測試的最大缺點是在得出結論之前需要大量的流量,因此您需要耐心等待。

當您進行 A/B 測試時,只有兩個頁面需要吸引大量流量。 但在多變量測試中,例如 Paras 的測試,有 12 個不同的頁面必須收集大量樣本,然後才能調用測試。

Leonid Pekelis 說,請留意對您有效性的威脅,並且不要忘記考慮假陽性結果率的增加:

“您實際上是在為每個交互運行單獨的 A/B 測試。 如果您有 20 個交互要測量,並且您的測試程序有 5% 的概率為每個交互發現誤報,那麼您突然期望一個交互被完全偶然地檢測到。 有一些方法可以解決這個問題,它們通常被稱為多次測試更正,但同樣,代價是您往往需要更多的訪問者才能看到最終結果。”

7. 分析你的結果

在運行了四個星期的測試後,Paras 發現:

這張圖向營銷人員展示瞭如何根據數據分析多變量測試的結果並進一步優化點擊後登陸頁面。

你可以看到,紅色標題“免費下載”將下載轉化率從 39% 推高至 63%,增幅高達 60%。 使用大字體的“下載”(結合紅色的鏈接顏色)也比默認設置有積極的 (43%) 改進。 在所有結果中,前三項在 95% 或更高的置信水平下具有統計顯著性。

Paras 可能已經實現了他的新頁面而忘記了這個測試,但相反,他強調了重要的最後一步:

8. 從結果中學習

您的每個測試都應該用於了解您的網頁及其訪問者的一些信息,您可以使用這些信息為將來的測試提供信息。

他在他的網頁上了解到:

  • “免費”一詞引起了他的網站訪問者的共鳴。
  • 優惠的免費性質最好在號召性用語上或附近做廣告。
  • 紅色吸引了來訪者的注意。
  • 更大的號召性用語吸引了更多訪客的眼球。

但請記住,這些是他的測試結果。 雖然“免費”一詞在任何宣傳免費優惠的網頁上總是很好用,但 CTA 的最佳位置、大小和顏色在您的網頁上可能會有所不同。 唯一確定的方法是測試。

您是否嘗試過多變量測試?

您是否因為認為它太複雜而偏離了多變量測試? 立即註冊 Instapage Enterprise 演示。