Experimentation-Driven Product Development

Rate this content
Bookmark

Como desarrolladores, constantemente lanzamos nuevas funciones a producción, pero ¿cómo sabemos su impacto? En esta charla, discutiremos por qué es importante adoptar el desarrollo impulsado por la experimentación, cómo obtener el apoyo del liderazgo y las formas en que esto puede salir mal.

This talk has been presented at JSNation US 2024, check out the latest edition of this JavaScript Conference.

Graham McNicoll
Graham McNicoll
10 min
21 Nov, 2024

Comments

Sign in or register to post your comment.
Video Summary and Transcription
Hola, soy Graham, cofundador de GrowthBook, y en esta charla relámpago, cubriré el desarrollo impulsado por la experimentación. Exploraremos cómo construimos productos hoy, el problema de saber si nuestros productos lanzados realmente funcionan, y la solución: el desarrollo impulsado por la experimentación. Las pruebas A-B son una forma controlada de medir el impacto de los cambios en usuarios reales. Implica comenzar con una hipótesis, asignar usuarios a diferentes grupos, exponerlos a diferentes variantes y rastrear su comportamiento. Ejemplos de Airbnb y Netflix muestran las tasas de éxito variables de las pruebas A-B. En promedio, solo un tercio de las pruebas tienen éxito en mover las métricas deseadas. Sin pruebas, solo estás adivinando. Las objeciones comunes incluyen confiar en datos de antes y después sin experimentos controlados. Las pruebas A-B ayudan a controlar las variantes y el ruido en los datos, permitiéndote determinar la causalidad. Las pruebas de usuario con tamaños de muestra pequeños pueden no proporcionar información precisa. Integrar las pruebas A-B en el proceso de desarrollo ayuda a definir hipótesis, rastrear métricas e iterar rápidamente. Usa feature flags para probar y lanzar cambios fácilmente. Los feature flags añaden seguridad al separar el despliegue de código de la liberación de funciones. Las pruebas A-B permiten la liberación condicional de funciones y proporcionan resultados estadísticos. Las pruebas A-B reemplazan las diferencias de opinión y celebran el aprendizaje de los fracasos. Las pruebas de hipótesis son cruciales para determinar el éxito de un proyecto. El desarrollo impulsado por la experimentación es fácil y debería hacerse en cada proyecto.

1. Introducción al Desarrollo Impulsado por la Experimentación

Short description:

Hola, soy Graham, cofundador de GrowthBook, y en esta charla relámpago, cubriré el desarrollo impulsado por la experimentación. Exploraremos cómo construimos productos hoy en día, el problema de saber si nuestros productos enviados realmente funcionan, y la solución: el desarrollo impulsado por la experimentación.

Hola a todos. Soy Graham, y estoy muy emocionado de darles esta charla relámpago hoy sobre el desarrollo impulsado por la experimentación.

Así que, soy Graham McNicol, soy el cofundador de GrowthBook. GrowthBook es la plataforma de código abierto más popular para feature flagging y pruebas A-B. Y el objetivo de la charla de hoy es ayudarles a entender los fundamentos de lo que llamamos desarrollo impulsado por la experimentación.

Así que, vamos a echar un vistazo a cómo desarrollamos productos hoy en día, y luego vamos a echar un vistazo a las pruebas A-B y luego algunas formas en que podemos combinarlas para hacer mejores productos. Esta es una presentación basada en animales. Ese es mi perro Nellie, y así que si no les gusta de lo que estoy hablando, al menos obtendrán algunas fotos de animales bonitos.

Así que, echemos un vistazo a cómo construimos productos actualmente. Así que, si son como yo, usan algún tipo de sistema ágil. Esto es Scrum. Si tienen mala suerte, les toca usar algún proceso como este. Me siento muy apenado por ustedes si lo hacen. Pero si miran todo el panorama de diferentes procesos ágiles, todos están perdiendo una cosa, que es, ¿qué significa hecho?, ¿verdad? Así que, para algunos procesos, podrían tener algo como, ya saben, hecho significa que está libre de defectos, o aceptamos las historias de usuario, o ¿le gusta al propietario del producto? Y así, típicamente, lo que queremos decir con hecho es, como, enviado, ¿verdad? Lo enviamos a producción, y hemos terminado. Pero, ¿cómo sabemos que lo que enviamos realmente funcionó, verdad? O en un panorama más amplio, como, ¿y si estábamos equivocados al construirlo en primer lugar? Como, ¿y si el producto que enviamos realmente perjudicó nuestro negocio?

2. Understanding A-B Testing and Common Objections

Short description:

Las pruebas A-B son una forma controlada de medir el impacto de los cambios en usuarios reales. Implica comenzar con una hipótesis, asignar usuarios a diferentes grupos, exponerlos a diferentes variantes y rastrear su comportamiento. Ejemplos de Airbnb y Netflix muestran las tasas de éxito variables de las pruebas A-B. En promedio, solo un tercio de las pruebas tienen éxito en mover las métricas deseadas. Sin pruebas, solo estás adivinando. Las objeciones comunes incluyen confiar en datos de antes y después sin experimentos controlados.

Bien, con eso en mente, echemos un vistazo a las pruebas A-B. Entonces, la definición de pruebas A-B que realmente me gusta es una forma controlada de medir el impacto de los cambios en usuarios reales. Y así, desde un nivel alto, lo que eso parece es, primero, comienzas con una hipótesis, alguna idea que deseas probar. Y luego, asignas, generalmente al azar, a los usuarios en diferentes grupos. Luego expones esos grupos a las diferentes variantes. Luego, rastreas cómo se comportaron en tu aplicación o producto. Y luego, usas estadísticas para averiguar si ese cambio que detectamos fue estadísticamente significativo o no.

Así que, con eso en mente, echemos un vistazo a algunos ejemplos de pruebas A-B en el mundo real. Ahora, estos son basados en la web, pero puedes hacer pruebas A-B en cualquier producto que sea digital. Así que, esto es de Airbnb, y querían aumentar las tasas de conversión y disminuir las tasas de cancelación siendo más claros sobre las políticas de cancelación mostrando esta línea de tiempo. Así que, tómate un momento para pensar si crees que este cambio fue exitoso o no en mejorar esas métricas. Bueno, resulta que esta prueba falló. Así que, echemos otro vistazo a otro ejemplo. Así que, esto es de Netflix, y la versión de control tiene solo un botón que dice probar ahora, y luego prueban una nueva variante que tiene una dirección de correo electrónico y luego el botón. Así que, ve a una página de registro después de eso. Así que, tómate un momento para pensar si eso ganó, y ese realmente lo hizo. Y eso va un poco en contra de algunos de los principios de la UI donde pensamos que no deberías mostrar campos de formulario siempre que sea posible.

Bien. Así que, con eso en mente, ¿con qué frecuencia creemos que las pruebas A-B ganan? Como, en promedio, en toda la industria. Así que, lo que quiero decir con ganar es como con qué frecuencia una prueba A-B que lanzamos, con qué frecuencia tiene éxito en mover las métricas que fue diseñada para mejorar. Y resulta que en realidad solo un tercio de las pruebas que realizamos tienen éxito en mover una métrica que queríamos que moviera. Eso significa que dos tercios del tiempo en realidad no tiene éxito o perjudica nuestro producto, ¿verdad? Y es un poco peor que eso porque ese tercio es en realidad una estimación alta. Resulta que en toda la industria, generalmente es un poco más bajo, y dependiendo de cuán optimizado esté tu producto, se vuelve cada vez más difícil mejorarlo. Una cosa interesante para llevar de esto es que nadie lanza un producto o construye un producto que no cree que ganará, ¿verdad? Así que, esa tasa de éxito de un tercio es nuestro mejor esfuerzo. Estamos construyendo cosas que creemos que funcionarán y aún así no tenemos éxito dos tercios del tiempo. Simplemente resulta que realmente no somos buenos prediciendo lo que nuestros usuarios quieren.

Y la otra conclusión de aquí es que sin pruebas, estás adivinando, porque realmente no hay una manera causal de averiguar el impacto de lo que estás haciendo sin realizar un experimento controlado. Ahora, escucho algunas objeciones comunes todo el tiempo sobre por qué las empresas no realizan experimentos. Así que, echemos un vistazo rápido a algunas de ellas ahora. La primera es, ¿qué hacemos? Miramos los datos de antes y después y simplemente los entrecerramos. Así que, demos un hipotético de cómo podría verse esto.