Testy wielowymiarowe: jak przeprowadzać najlepsze testy, aby uzyskać najlepsze wyniki

Opublikowany: 2017-02-09

Testy A/B to jeden z najłatwiejszych sposobów znajdowania pomysłów na optymalizację stron docelowych po kliknięciu, ale nie zawsze jest to najskuteczniejszy sposób.

Zanim zaczniesz testować dwie, trzy lub cztery strony na raz, dowiedz się, jak przetestować jeszcze więcej i odkryj najlepszą kombinację elementów, aby przekonwertować odwiedzających.

Testy A/B to jeden z najłatwiejszych sposobów optymalizacji stron docelowych po kliknięciu, ale nie zawsze jest to najbardziej wydajne.

Kliknij, aby tweetować

Co to są testy A/B?

Testy A/B, znane również jako testy podziału, umożliwiają porównanie dwóch różnych wersji strony internetowej w celu określenia, która z nich lepiej konwertuje odwiedzających.

Te dwie strony mogą być:

  • Trochę inny

Jeśli masz projekt o wysokim współczynniku konwersji i chcesz dowiedzieć się, jak ulepszyć pojedynczy element, możesz przetestować dwie różne strony z tylko jedną różnicą. Jeśli chcesz sprawdzić, czy nagłówek dotyczący ciekawostek lub wiadomości jest lepszy, możesz porównać nagłówek z nagłówkiem. Jeśli chcesz sprawdzić, czy wideo lub gif mają większy wpływ na konwersje, możesz przetestować po jednym na każdej stronie.

Po uzyskaniu równego ruchu dla każdego z nich, wygrywa ten, który generuje najwięcej konwersji. A powód, dla którego jedna wygenerowała więcej konwersji, jest jasny, ponieważ istnieje tylko jedna różnica między tymi dwiema stronami.

  • Drastycznie różne

Możesz także przetestować dwie strony, które różnią się na wiele sposobów. Oryginalna strona może mieć inny nagłówek, wyróżniony obraz i przycisk wezwania do działania niż Twoja odmiana. Testowanie może wyglądać mniej więcej tak:

Ten diagram pokazuje marketerom, jak działa testowanie wielowymiarowe z układami stron docelowych po kliknięciu oraz wersja A i wersja B.

Po uzyskaniu równego ruchu zarówno na stronie oryginalnej (A lub „kontrolnej”), jak i na stronie z odmianą (B), zwycięża ta, która zapewnia lepszą konwersję. Ale w przeciwieństwie do sytuacji, gdy zmieniasz tylko jeden element na test, podczas testowania drastycznie różnych stron nie ma możliwości określenia powodu, dla którego dana strona wygrała.

Biorąc pod uwagę wyniki z powyższego przykładu, wiedzielibyśmy tylko, że wersja „b” jest lepsza niż wersja „a”, ale nie wiedzielibyśmy, dlaczego jest lepsza, ponieważ istnieje wiele przyczyn, którym można to przypisać. Konwersje mogły pochodzić z dostosowania paska nawigacyjnego od lewej do prawej lub z formularza rejestracyjnego od góry do dołu. Wszystko, co możesz stwierdzić na pewno podczas testów A/B drastycznie różnych projektów, to to, że jedna strona jest lepsza od drugiej.

Istnieje jednak inny rodzaj testu, który można przeprowadzić, aby określić, w jaki sposób zmiany w wielu elementach wchodzą ze sobą w interakcję. Nazywa się to testem wielowymiarowym.

Co to jest testowanie wielowymiarowe?

Testy wielowymiarowe to proces używany przez optymalizatory do porównywania dwóch różnych stron internetowych. Metoda koncentruje się na porównywaniu subtelnych zmian między wieloma elementami, a następnie mierzeniu, w jaki sposób te elementy wchodzą ze sobą w interakcje, w celu znalezienia najlepszego wykonawcy.

Różnica między testami A/B a testami wielowymiarowymi

Prawdopodobnie czytałeś wiele przypadków testów A/B, które znajdują zwycięską stronę, porównując jeden nagłówek z innym, polecany obraz z filmem lub jedno wezwanie do działania z nieco innym. Chociaż można ich użyć do zrobienia tego z dokładnością, według optymalizatorów w Widemile, istnieje bardziej idealny sposób na wykorzystanie testów A/B:

Ten diagram pokazuje marketerom największe różnice w testach wielowymiarowych i testach A/B oraz kiedy stosować każdą z metod.

Mówią, że idealnym zastosowaniem testów A/B jest „testowanie dwóch lub więcej radykalnie różnych stron”. Jeśli chodzi o testowanie, lepiej jest przeprowadzić test A/B, aby znaleźć tak zwane „maksimum globalne”, a test wielowymiarowy, aby uściślić w kierunku „maksimum lokalnego”.

Maksimum globalne i maksimum lokalne

Choć to trudne, wyobraź sobie przez chwilę, że nigdy w życiu nie jadłeś gałki lodów i stoisz w lodziarni, próbując zdecydować, który z 30 różnych smaków chcesz kupić .

Istnieje 10 różnych rodzajów czekolady, 10 różnych odmian wanilii i 10 różnych odmian truskawek. Czy zamierzasz wypróbować wszystkie 30 smaków, zanim zdecydujesz, który z nich chcesz mieć?

Prawdopodobnie nie. Prawdopodobnie wypróbujesz jeden z drastycznie różnych smaków – jedną czekoladę, jedną truskawkę i jedną wanilię – aby zawęzić, która odmiana najbardziej Ci się spodoba. Jeśli odkryjesz, że wolisz czekoladę od wanilii i truskawek, zaczniesz próbować smaków, takich jak „ciasto z kawałkami czekolady”, „czekolada z masłem orzechowym” i „czekoladowa krówka”, aby zdecydować, którą z czekoladek lubisz najbardziej.

W ujęciu statystycznym odmianę, którą lubisz najbardziej (czekoladową, waniliową lub truskawkową) nazwalibyśmy globalnym maksimum. To jest smak, który smakuje ci najlepiej spośród trzech drastycznie różnych rodzajów. Specyficzny smak tej odmiany (czekoladowo-krówka, ciasto z kawałkami czekolady, czekoladowe masło orzechowe) byłby lokalnym maksimum. To najlepsza wersja odmiany, którą wybrałeś.

Jako optymalizator chcesz podejść do testowania w podobny sposób. Chcesz znaleźć stronę, która najlepiej konwertuje odwiedzających (maksimum globalne), a następnie dostosować określone elementy na tej stronie, aby ulepszyć ją do strony o najwyższej możliwej konwersji (maksimum lokalne). To, czego szukasz, określi, którego testu użyjesz.

Kiedy używać testów A/B, a kiedy testów wielowymiarowych

Testy A/B najlepiej nadają się do testowania globalnego maksimum. Są najlepsi w wykrywaniu strony, na której odwiedzający chcą dokonać konwersji. Weźmy na przykład firmę MarketingExperiments, która wykorzystała test A/B, aby pomóc firmie Investopedia zwiększyć liczbę konwersji swojego biuletynu Investopedia Advisor.

Oferta była prosta — bezpłatny biuletyn z poradami giełdowymi — więc pierwotna strona to odzwierciedlała. Nie był długi, skomplikowany ani zagracony wieloma elementami. Zawierał formularz przechwytywania potencjalnych klientów w jednym polu, wypunktowaną kopię i infografikę:

To zdjęcie pokazuje marketerom, jak firma Investopedia wykorzystała testy wielowymiarowe na swojej krótkiej stronie docelowej po kliknięciu, aby zwiększyć współczynnik konwersji.

Ale pomimo cennej bezpłatnej oferty konwersja wynosiła tylko 1,33%. Zespół MarketingExperiments postanowił całkowicie przebudować stronę. Zmienili nagłówek, układ, przycisk wezwania do działania i dodali między innymi kilka odznak. Następnie przetestowali A/B nową stronę w porównaniu z oryginałem i stwierdzili, że nowa strona uzyskała konwersję wyższą o 89,4%. Oto jak to wyglądało:

To zdjęcie pokazuje marketerom, jak firma Investopedia wykorzystała testy wielowymiarowe na swojej stronie docelowej po długim kliknięciu, aby zwiększyć współczynnik konwersji.

Należy pamiętać, że w tym teście A/B eksperymentatorzy nie ustalili dokładnie, dlaczego nowa strona konwertowała lepiej niż stara, ale znaleźli nową, wyższą konwersję. Innymi słowy, znaleźli nowe globalne maksimum. W tym momencie, jeśli chcą, mogą udoskonalić tę stronę za pomocą testów na wielu odmianach, aby określić, która kombinacja elementów generuje najwięcej konwersji.

Na przykład dokładnie to chcą zrobić testerzy w tym hipotetycznym przykładzie z Optimizely. Chcą dowiedzieć się, która kombinacja nagłówka i obrazu generuje najwięcej konwersji.

To zdjęcie pokazuje marketerom, jak przeprowadzać testy wielowymiarowe za pomocą nagłówków i obrazów.

Tworzą więc wiele stron z różnymi kombinacjami nagłówków i obrazów, aby sprawdzić, która z nich jest najskuteczniejsza.

To zdjęcie pokazuje marketerom, jak można testować kombinacje obrazów i nagłówków za pomocą testów wielowymiarowych, aby określić zwycięską odmianę.

Którakolwiek z tych czterech wersji wyjdzie z testu z najwyższym współczynnikiem konwersji, wygrywa. Jeśli dwie wersje z żarówką działają lepiej niż dwie z przekładnią, można dojść do wniosku, że obraz żarówki ma największy wpływ na konwersje. Stamtąd zobaczysz, który towarzyszący nagłówek wygenerował więcej konwersji, i skorzystaj z tej strony.

Jak przeprowadzić test wielowymiarowy

Kilka lat temu, gdy założyciel VWO, Paras Chopra, chciał zwiększyć liczbę pobrań na swojej stronie internetowej, wykorzystał testy wielowymiarowe, aby dowiedzieć się, jak to zrobić. Jeśli znasz kroki przeprowadzania testu A/B, rozpoznasz większość kroków w tym przykładzie testu wielowymiarowego.

1. Zidentyfikuj problem

Zanim zaczniesz ulepszać swoją stronę internetową, najlepiej zagłębić się w dane i dowiedzieć się, w jaki sposób odwiedzający wchodzą z nią w interakcję. Odkrył, że ludzie nie klikali jego przycisku „pobierz” tak często, jak się spodziewał, więc przejrzał stronę, aby dowiedzieć się, dlaczego.

2. Sformułuj hipotezę

Po dokładnym zbadaniu zdał sobie sprawę, że link do pobrania był dość niezauważalny. Stworzył więc hipotezę dotyczącą ulepszenia strony:

Oczywistym rozwiązaniem, aby odwiedzający zauważyli link do pobrania, jest uczynienie sekcji pobierania najbardziej widoczną częścią strony. W projekcie strony rozmiar i kolor nagłówka „Pobierz” dobrze wtapiały się w pozostałą część strony, co spowodowało, że ludzie nie widzieli linku do pobrania.

Uważał, że zwiększając widoczność linku „Pobierz”, wierzył, że zwiększy liczbę konwersji. Oto jak postanowił to zrobić.

3. Twórz wariacje

Teraz nadszedł czas na utworzenie stron z odmianami do testu. Według Parasa:

Do testu wielowymiarowego wybrałem dwa czynniki na stronie do tworzenia odmian: nagłówek „Pobierz” na pasku bocznym i link do pobrania „Producent PDF” pod nim. Celem testu była obserwacja efektu słowa „bezpłatny” oraz efektu podświetlenia sekcji pobierania.

Oto jak postanowił uczynić sekcję pobierania bardziej zauważalną i kuszącą.

W przypadku oryginalnego łącza „Pobierz” przetestował trzy różne warianty:

  • „Pobierz” na czerwono
  • „Pobierz za darmo” na czerwono
  • „Pobierz” w domyślnym kolorze, ale z większym rozmiarem czcionki

W przypadku oryginalnego łącza „PDFProducer” przetestował dwie różne odmiany:

  • „PDFProducer” w domyślnym kolorze, ale z większym rozmiarem czcionki
  • „Producent PDF” na czerwono

Tak wyglądały wszystkie kombinacje:

To zdjęcie pokazuje marketerom, jak różne kombinacje tekstu „pobierz” i tekstu podtytułu mogą pomóc w określeniu zwycięskiej odmiany.

Z czterema wersjami łącza do pobrania (w tym oryginałem) i trzema wersjami tekstu „PDFProducer” (ponownie, w tym oryginał), utworzono 12 różnych odmian w celu przeprowadzenia pełnego testu czynnikowego. Pełna silnia testuje wszystkie kombinacje, w przeciwieństwie do silni ułamkowej, która sprawdza tylko najbardziej wpływowe.

Chociaż istnieje wiele metod analizy wielowymiarowej — pełna czynnikowa, ułamkowa czynnikowa i Taguchi — większość optymalizatorów zaleca przeprowadzenie pełnej analizy czynnikowej ze względu na jej dokładność, twierdzi Alex Birkett z CXL.

4. Określ rozmiar próbki

Zanim zaczniesz kierować ruch na swoje strony, musisz określić wielkość próby — liczbę odwiedzających, jaką każda strona musi wygenerować, zanim będziesz mógł wyciągnąć wnioski na temat wyników testu.

Ten kalkulator od VWO pomoże Ci dowiedzieć się, ilu odwiedzających i jak długo potrzebujesz przeprowadzić test w oparciu o ruch w witrynie, liczbę posiadanych odmian i znaczenie statystyczne.

Aby dowiedzieć się więcej o osiąganiu istotności statystycznej i wszystkich rzeczach, które musisz wprowadzić do kalkulatora, sprawdź ten wpis na blogu.

5. Przetestuj swoje narzędzia

Przetestuj wszystko, zanim zaczniesz uruchamiać ruch. Czy Twój landing page po kliknięciu wygląda tak samo w każdej przeglądarce? Czy przycisk CTA działa? Czy wszystkie linki w Twoich reklamach są prawidłowe?

Zanim zaczniesz cokolwiek prowadzić, ważne jest, aby przeprowadzić kontrolę jakości każdego aspektu kampanii, aby upewnić się, że nic nie zatruwa Twoich wyników.

6. Zacznij kierować ruchem

Teraz, gdy masz już utworzone odmiany i wiesz, ile ruchu musisz wygenerować dla każdej z nich, możesz bezpiecznie zacząć kierować do nich ruch. Największą wadą testów wielowymiarowych jest kolosalna ilość ruchu, której potrzebujesz, zanim będziesz mógł je zakończyć, więc musisz uzbroić się w cierpliwość.

Gdy przeprowadzasz testy A/B, są tylko dwie strony, na które musisz skierować znaczny ruch. Ale w teście wielowymiarowym, takim jak na przykład Paras, istnieje 12 różnych stron, które muszą zebrać dużą próbkę, zanim będzie można wywołać test.

Uważaj na zagrożenia dla swojej ważności i nie zapomnij wziąć pod uwagę zwiększonego wskaźnika wyników fałszywie dodatnich, mówi Leonid Pekelis:

„Zasadniczo przeprowadzasz osobny test A/B dla każdej interakcji. Jeśli masz 20 interakcji do zmierzenia, a twoja procedura testowa ma 5% wskaźnik znajdowania fałszywych alarmów dla każdej z nich, nagle spodziewasz się, że jedna interakcja zostanie wykryta całkowicie przez przypadek. Istnieją sposoby, aby to wyjaśnić, ogólnie nazywa się to wielokrotnymi poprawkami testowymi, ale znowu koszt jest taki, że zwykle potrzebujesz więcej odwiedzających, aby zobaczyć rozstrzygające wyniki.

7. Przeanalizuj swoje wyniki

Po przeprowadzeniu testu przez cztery tygodnie, oto, co znalazł Paras:

Ten obraz pokazuje marketerom, jak analizować wyniki testów wielowymiarowych i jeszcze bardziej optymalizować strony docelowe po kliknięciu na podstawie danych.

Możesz zauważyć, że nagłówek „Pobierz za darmo” w kolorze czerwonym spowodował wzrost współczynnika konwersji pobierania z 39% do 63%, co stanowi ogromny wzrost o 60%. Posiadanie opcji „Pobierz” w dużym rozmiarze czcionki (w połączeniu z kolorem linku jako czerwonym) również przyniosło pozytywną (43%) poprawę w stosunku do wartości domyślnej. Spośród wszystkich wyników trzy najlepsze są statystycznie istotne na poziomie ufności 95% lub wyższym.

Paras mógł zaimplementować swoją nową stronę i zapomnieć o tym teście, ale zamiast tego podkreśla ważny krok końcowy:

8. Ucz się na swoich wynikach

Każdy z twoich testów powinien być wykorzystany, aby dowiedzieć się czegoś o twoich stronach internetowych i ich użytkownikach, co możesz wykorzystać w przyszłych testach.

Dowiedział się, że na swojej stronie internetowej:

  • Słowo „bezpłatny” odbiło się echem wśród odwiedzających jego witrynę.
  • Brak kosztów oferty najlepiej reklamować w wezwaniu do działania lub w jego pobliżu.
  • Uwagę gości zwracał kolor czerwony.
  • Większe wezwanie do działania przyciągnęło więcej gałek ocznych odwiedzających.

Ale pamiętaj, to są wyniki jego testu. Chociaż słowo „bezpłatny” jest zawsze dobre do użycia na każdej stronie internetowej, która reklamuje bezpłatną ofertę, najlepsza lokalizacja, rozmiar i kolor wezwania do działania mogą być inne na twoich stronach internetowych. Jedynym sposobem, aby wiedzieć na pewno, jest test.

Czy próbowałeś testów wielowymiarowych?

Czy odszedłeś od testów wielowymiarowych, ponieważ uważałeś je za zbyt skomplikowane? Zarejestruj się już dziś, aby skorzystać z wersji demonstracyjnej Instapage Enterprise.