Cuándo buscar el máximo local y global con tus pruebas A/B

Publicado: 2017-03-06

Imagina que estás escalando el Monte Everest en medio de una espesa niebla con amnesia. Solo puedes ver hasta tu mano extendida. No sabes dónde estás ni en qué dirección dirigirte, solo que necesitas llegar a la cima. ¿Cuáles son las probabilidades de que hagas?

Probablemente tan bajo como alta la montaña.

Por más dramática que sea esta analogía, se ha hecho en referencia a la base de un popular método de prueba A/B. Ese pico es la mejor versión de su página de destino posterior al clic, y está confundido, casi ciego y perdido en la ladera de la montaña de su página actual.

Lo que es peor, es probable que sus bloggers de marketing favoritos le hayan entregado un mapa incorrecto. Puede pensar que está realizando pruebas A/B de la manera correcta, que se dirige en la dirección de ese pico. Sin embargo, es probable que pronto llegue a un callejón sin salida y que nunca encuentre la variación de mayor rendimiento de su página de destino posterior al clic.

Probablemente sus blogueros de marketing favoritos le hayan entregado un mapa de prueba A/B incorrecto.

Haz clic para twittear

El mito de las pruebas A/B que confunde a los principiantes

Algunos de los blogs de marketing más populares en Internet continúan perpetuando el mito de las pruebas A/B que condena a los principiantes desde el principio. También me victimizó cuando empecé.

“No cambies más de un elemento de página por prueba A/B” seguí leyendo una y otra vez. No lo cuestioné porque las fuentes eran confiables y porque, en general, tenía sentido.

El objetivo de las pruebas A/B es recopilar datos que puede usar para optimizar una página, un correo electrónico, un anuncio o lo que sea que esté probando. ¿Cómo iba a saber qué causó el cambio en la tasa de conversión al finalizar la prueba si realicé más de un ajuste entre las versiones "A" y "B"? ¿Qué tipo de datos serían esos?

Por lo tanto, probé los elementos uno a la vez: título de la página de destino posterior al clic "A" frente al título de la página de destino posterior al clic "B". A continuación, fue el botón azul en la página de destino posterior al clic "A" frente al botón verde en la página de destino posterior al clic "B". Así fue como lo hicieron los profesionales, Amazon y Google. Si fue lo suficientemente bueno para empresas multimillonarias, fue lo suficientemente bueno para mí.

El problema que pasé por alto, del que me di cuenta dolorosamente meses después, es que yo no era Amazon ni Google. Sus sitios web generan mucho tráfico, lo que significa que los pequeños aumentos obtenidos por estas frívolas pruebas de color de botones pueden traducirse en millones de dólares en ingresos.

Sin embargo, para la mayoría de las personas, son una pérdida de tiempo y recursos. Para la mayoría de las personas, usar este método de prueba A/B es como escalar el Monte Everest en medio de una espesa niebla con amnesia.

La heurística del montañismo

En nuestra vida cotidiana, hay problemas que encontramos para los cuales la solución es clara. Pero, ¿qué sucede cuando te enfrentas a un obstáculo desconocido y en gran medida único? Tome este laberinto, por ejemplo:

Esta imagen muestra a los especialistas en marketing cómo decidir rápidamente cuál es la mejor manera de probar las páginas de destino posteriores al clic para alcanzar el máximo local y el máximo global.

No hay publicaciones de blog escritas sobre la mejor manera de navegar por este laberinto en particular. Tu amigo (lo más probable) no puede guiarte a través de él. No tienes mapa. Entonces, ¿cómo se llega de A a B?

La respuesta se puede encontrar en un programa de computadora llamado "The General Problem Solver", creado en 1963 por Newell, Simon y Shaw para estudiar la inteligencia artificial. Su investigación también se ha aplicado a la resolución de problemas humanos. El Dr. Russ Dewey explica:

Newell y Simon definieron cada problema como un espacio. En un extremo del espacio está el punto de partida, en el otro lado está la meta. El procedimiento de resolución de problemas en sí se concibe como un conjunto de operaciones para cruzar ese espacio, para llegar desde el punto de partida al estado final, paso a paso.

En el Solucionador de problemas generales, el programa prueba varias acciones (que Newell y Simon llamaron operadores) para ver cuál lo llevará más cerca del estado objetivo. Un operador es cualquier actividad que cambia el estado del sistema. El Solucionador de Problemas Generales siempre elige la operación que aparece para acercarlo a su objetivo. Esta táctica se llama escalar colinas, porque se asemeja a la táctica de dar siempre un paso hacia la cima de una colina o montaña.

En el laberinto anterior, cada callejón sin salida es un "espacio", un problema que debe superar con "operaciones", que son acciones que lo acercan a su objetivo (ir de "A" a "B").

Entonces, comienza en "A" y sigue el camino que crees que te llevará a "B" más rápido. Cuando llegas a un callejón sin salida, regresas e intentas una ruta alternativa. Repites el proceso hasta que hayas alcanzado tu objetivo.

Esto es lo que haces cuando pruebas A/B con elementos pequeños. Identifica un problema, como un botón imperceptible, por ejemplo. Luego, se acerca cada vez más a su objetivo de crear la mejor versión de su página de destino posterior al clic (o eso cree) probando lo que cree que es mejor. Si eso no funciona, prueba con otro.

Sin embargo, en algún momento llegará a un punto de rendimientos decrecientes llamado "máximo local".

El máximo local y el máximo global

La razón por la que el método anterior se llama heurística de "escalada de colinas" es porque tiene una limitación importante que puede dejarlo rascándose la cabeza en una colina mirando hacia la cima de la montaña, donde está su mejor página de destino posterior al clic. El Dr. Dewey explica:

La escalada es una estrategia simple, pero no siempre funciona. Una trampa potencial es el "problema de las estribaciones". Si está seleccionando cualquier paso que lo lleve cuesta arriba (o en una dirección particular), podría terminar subiendo una colina que se encuentra entre usted y la montaña, ignorando el procedimiento mucho más eficiente de rodearla. En otras palabras, si va directamente hacia una meta sin flexibilidad, puede pagar un alto precio, desperdiciar mucha energía o causar más trabajo sin contribuir a la meta.

En términos de optimización, esta “pie de la colina” se denomina “máximo local”. Es la mejor versión de su página actual, que cuando se realicen más pruebas A/B, producirá rendimientos decrecientes. El pico de la montaña se llama el "máximo global". Esa es la mejor versión de su página de destino posterior al clic. Aquí hay un gráfico útil para ilustrar:

Esta imagen muestra a los especialistas en marketing cómo determinar el máximo local y el máximo global con pruebas A/B y pruebas multivariadas.

Al comenzar con una única página de destino posterior al clic y realizar pruebas A/B de elementos pequeños uno a la vez para mejorarla, se está acercando a ese máximo local, pero este método nunca lo llevará a la cima de esa montaña. Entonces, ¿cómo navegas hasta allí?

Pruebas A/B para alcanzar el máximo global

En una publicación de blog titulada "No caigas en la trampa de las minucias de las pruebas A/B", Rand Fishkin de Moz explica un escenario frustrante que podría golpear demasiado cerca de casa:

Digamos que encuentra una página/concepto con el que está relativamente satisfecho y comienza a probar las pequeñas cosas, optimizando alrededor del mínimo local. Puede ejecutar pruebas durante 4 a 6 meses, obtener una mejora del 5% en su tasa de conversión general y sentirse bastante bien. Hasta que...

Ejecuta otra gran idea nueva en una prueba y mejora aún más. Ahora sabe que ha estado perdiendo el tiempo optimizando y perfeccionando una página cuyo concepto general no es tan bueno como el de la página nueva, tosca y sin optimizar que acaba de probar por primera vez.

Esta imagen muestra a los especialistas en marketing el camino típico para que las pruebas A/B alcancen el máximo global.

En cambio, Fishkin, al igual que otros influencers de marketing, recomienda primero realizar pruebas A/B de "revisiones" y "grandes ideas", o, en otras palabras, probar páginas radicalmente diferentes. De esas páginas radicalmente diferentes, la que tiene mejor desempeño es la que más se acerca al máximo global. Ese es el que debe ajustar con pruebas multivariadas: botón contra botón, título contra título, etc. Varios estudios de casos respaldan este método.

Pruebas A/B para el máximo global

1.Facebook

Esta imagen muestra a los especialistas en marketing cómo Facebook A/B probó el máximo global con su página de inicio.

En 2008, Facebook probó un diseño de navegación completamente nuevo. Su equipo lo movió de la izquierda de la página a un menú desplegable a la derecha. Sin embargo, al hacerlo, hicieron que las aplicaciones dentro de la navegación fueran menos visibles para los usuarios, lo que resultó en mucho menos tráfico a esas aplicaciones. Dado que eran una valiosa fuente de ingresos para Facebook, eso era un problema.

Después de intentar salvar el nuevo diseño con algunos trucos de compromiso, el equipo de optimización se dio cuenta de que habían alcanzado el máximo local y lo desecharon por completo. Del desarrollador de productos de Facebook, Adam Mosseri:

Lo que estábamos haciendo aquí es optimizar para un máximo local. Dentro de este marco, solo había una cantidad limitada de tráfico que podíamos canalizar a las aplicaciones. Y lo que necesitábamos era un cambio estructural. Nuestra premisa estaba fuera de lugar. Nuestros intereses nos estaban llevando por el camino equivocado. No nos dimos cuenta […] estábamos optimizando para algo localmente, y necesitábamos ser algo disruptivos para salir de eso.

2. Moz

Esta imagen muestra a los especialistas en marketing cómo Moz A/B probó el máximo global en su página de producto.

Esta página de variación, creada por Conversion Rate Experts para Moz, era seis veces más larga que la original. Presentaba más infografías, un titular diferente y un video, entre otros elementos que no estaban en la página original. Superó al control en un 52%.

Si el equipo solo hubiera trabajado para mejorar los elementos de la página original, nunca habrían agregado el contenido que impulsó las conversiones a la mitad. De los probadores:

En nuestro análisis de la efectiva presentación cara a cara de Rand, notamos que necesitaba al menos cinco minutos para defender el producto pago de Moz. La página existente era más como un resumen de un minuto. Una vez que agregamos los elementos clave de la presentación de Rand, la página se volvió mucho más larga.

3. Densidad del servidor

La mayoría de los estudios de casos de pruebas A/B que encontrará en línea tienen que ver con la apariencia de las páginas web. Son color de botón versus color de botón o imagen versus imagen, y el número de ellos crece cada día. Como resultado, la mayoría de las personas que se sumergen en las pruebas A/B asumen que solo se pueden usar para el diseño web.

Sin embargo, el concepto de prueba A/B se puede aplicar a cualquier cosa, incluido el diseño del producto o incluso la estructura de precios, como verá con este ejemplo de Sever Density.

La empresa, un servicio de monitoreo de servidores y sitios web, permitió que su cliente pagara en función de la cantidad de servidores y sitios web que necesitaban monitorear:

Esta imagen muestra a los especialistas en marketing cómo Server Density A/B probó su página de precios empaquetados para alcanzar el máximo global.

La estructura tenía la intención de ampliar la base de clientes, y lo hizo, pero ahora la mira del equipo estaba en mayores ingresos. Entonces, probaron A/B una revisión completa de sus precios, con un modelo empaquetado:

Esta imagen muestra a los especialistas en marketing cómo Server Density A/B probó su página de precios para alcanzar el máximo global.

La nueva estructura en realidad produjo menos conversiones, pero el valor de cada una se disparó. Estos fueron los resultados:

Esta imagen muestra a los especialistas en marketing cómo la Densidad del servidor más que duplicó sus ingresos mediante pruebas A/B para el máximo global.

El valor promedio del pedido ahora superaba los $55 en comparación con el anterior: $19,70. Los puntos recuerdan a los evaluadores dos cosas cruciales:

Las pruebas A/B se pueden usar para más que cambios de diseño superficiales.
Las conversiones no son el principio de todo. A veces, menos conversiones le brindan mejores resultados.

¿Cómo encuentras el máximo global y local?

Recuerde: la fuerza de las pruebas A/B es acercarse lo más posible al máximo global con grandes cambios. Para encontrar el máximo local, es mejor que utilice pruebas multivariadas en su lugar.

¿Ha caído en la trampa de probar estrictamente un elemento de página a la vez? ¿Realiza múltiples cambios por prueba para encontrar el máximo global?

Aprenda cómo proporcionar una personalización de anuncios 1:1 para cada público que tenga con una demostración de Instapage Enterprise hoy.