Versión en EspañolES

Curso Intensivo de Agentes de Voz

Stepan Suvorov

Roadsoft

This ad is not shown to multipass and full ticket holders

React Advanced 2026

October 23 - 26, 2026

London, UK & Online

We will be diving deep

Learn More

Bookmark

Sentry

Promoted

Code breaks, fix it faster

Crashes, slowdowns, regressions in prod. Seer by Sentry unifies traces, replays, errors, profiles to find root causes fast.

Get started

Un curso intensivo práctico para desarrolladores que quieren evitar semanas de investigación y pasar directamente a la construcción. Cubriremos la terminología esencial, las tendencias actuales de la industria y el panorama real de servicios y bibliotecas. Aprenderás cuándo usar qué, y por qué algunas elecciones importan más que otras. Compartiré lecciones aprendidas al construir un agente de voz en producción para más de 10,000 conductores de camiones holandeses, incluidos los problemas de los que nadie habla. Al final, tendrás todo lo que necesitas para construir tu primer Agente de Voz funcional.

This talk has been presented at AI Coding Summit 2026, check out the latest edition of this Tech Conference.

case study

Stepan Suvorov

26 min

26 Feb, 2026

Comments

Video Summary and Transcription

Stepan Suvorov, CTO en Roadsoft, discute el auge de los Agentes de Voz, destacando el crecimiento del mercado, modelos mejorados para la conversión de voz a texto y generación de voz, reducción de latencia y rentabilidad. Los componentes clave incluyen conversión de voz a texto, análisis LLM, conversión de texto a voz, orquestación y abordaje de la latencia. Profundizando en aspectos esenciales como la detección de actividad de voz, manejo de interrupciones y criterios de selección de modelos para Agentes de Voz. Explorando parámetros como latencia, calidad, precios, soporte de idiomas y opciones de clonación de voz. Comparando soluciones DIY y gestionadas para Agentes de Voz, enfatizando la flexibilidad y rentabilidad. Discutiendo las implicaciones de costos entre soluciones gestionadas y autoalojadas, considerando volúmenes de uso y escala. Abordando desafíos de infraestructura, enfoques de prueba, límites de WAPI, selección de modelos y planes futuros para agentes de voz.

Available in English: Voice Agents Crash Course

1. Analizando el Auge de los Agentes de Voz

Short description:

Stepan Suvorov, CTO en Roadsoft, discute el auge de los Agentes de Voz, destacando el crecimiento del mercado, modelos mejorados para conversión de voz a texto y generación de voz, reducción de latencia y rentabilidad.

Hola a todos, estoy feliz de estar en el AI Coding Summit presentando un tema tan agradable como el Agente de Voz. Unas pocas palabras sobre mí. Soy Stepan Suvorov, CTO en Roadsoft. Soy un gran fan de JNI y todas las posibilidades que nos ofrece. Por eso comencé un canal de YouTube específicamente para ayudar a las personas a utilizar JNI tanto como sea posible. También siéntanse libres de conectarse conmigo a través de mi página de LinkedIn para hacer cualquier pregunta relacionada con JNI o específicamente con el Agente de Voz.

Así que, Agentes de Voz. Quiero destacar que esto es exactamente un curso intensivo. Hice una investigación durante varios meses porque también estamos construyendo nuestra propia función de negocio basada en Agente de Voz. Y ese es el resultado de esta investigación. Es una charla que tal vez te ayude a ahorrar algo de tiempo si estás a punto de comenzar. Entonces, ¿qué pasa con el Agente de Voz? ¿Por qué es tan interesante ahora? En primer lugar, si miras todos los números, vemos que mucha inversión está creciendo y casi duplicándose cada año. Solo si revisas la empresa 11Labs, el año pasado recaudaron $180 millones.

Y a principios de este año son $500, $500 millones. Eso es una locura. Y también la evaluación ya era de $11 mil millones. Así que esa es la empresa que proporciona Agentes de Voz. ¿También por qué ahora? ¿Por qué ahora el mercado está tan activo? La respuesta es muy simple. Los modelos mejoran. ¿Qué específicamente? La conversión de voz a texto ahora funciona mucho mejor. En términos de que comete muchos menos errores. Es más confiable. También la generación de voz ha mejorado mucho más de lo que era incluso hace cinco años.

A veces ni siquiera podemos darnos cuenta de que estábamos hablando con un Agente de Voz y no con un humano real. Además, debido a que los modelos mejoran cada vez más, la latencia disminuye significativamente. Por eso ahora podemos tener una conversación en tiempo real y no solo generar una voz a partir de texto. Y también eso se conecta con el costo. Si tener un Agente de Voz te costará mucho dinero, probablemente no optarás por ello. Pero si es razonable, si tu retorno de inversión es bueno, ¿por qué no construir una función así? Y ya hay muchos casos de uso en producción para el Agente de Voz.

2. Key Components and Challenges of Voice Agents

Short description:

Discutiendo la importancia de la voz como interfaz para personas ocupadas, los componentes clave del Agente de Voz incluyen conversión de voz a texto, análisis LLM, conversión de texto a voz, orquestación y abordaje de la latencia para conversaciones en tiempo real.

El más conocido es el soporte al cliente, pero hay muchos más. Y el en el que estamos trabajando lo llamé manos ocupadas. Porque solo imagina que muchas personas, trabajan no cerca de una computadora. Y a veces sus manos están ocupadas, eso significa que es un conductor o un trabajador de la construcción. Incluso si tienen un teléfono móvil donde podemos instalar una aplicación móvil, no pueden hacer clic en el móvil. Y la voz es la única interfaz para que interactúen con esta aplicación. Por eso realmente me gusta esta frase de Olivia Moore sobre la voz. Así que considera ser una voz, no un producto en sí, sino como una interfaz para tu producto. Así que es como una nueva forma de interactuar con el software. Antes era la IU, a veces la IU móvil. Pero ahora, viene una nueva ola. Será cada vez más.

Así que ahora veamos qué hay dentro del Agente de Voz. Primero, comenzamos con que obviamente el usuario necesita hablar y escuchar alguna respuesta. Pero ¿qué hay en el medio? En el medio, tenemos la primera parte que es el modelo de voz a texto o STT. ¿Y qué hace? Bueno, convierte la voz en texto. Cuando el usuario dice algo, como resultado, obtenemos no una transmisión de audio, sino un texto. Este texto va a los conocidos LLMs, modelo LLM que analiza el texto y también da una respuesta, respuesta en texto. Y el punto final, qué hacer con este texto, lo enviamos a otro modelo, texto a voz o modelo TTS que lo convierte en una transmisión de audio que podemos enviar de vuelta a nuestro usuario. Y para combinar todo esto de manera agradable, necesitamos una especie de orquestación que no solo combine sino que haga algunas características adicionales para nosotros. Y también, si quieres que el Agente de Voz se conecte a alguna línea de comunicación como un teléfono, también necesitamos pensar en el transporte. Así que esas son las partes principales que necesitas considerar al construir un Agente de Voz.

Además, lo que necesitas tener en cuenta es la latencia. Si quieres una conversación en tiempo real, pero no solo mensajes de voz, para que el agente pueda responder, necesitas apuntar a que no sea más de 500 milisegundos. Y eso es todo un desafío, diría yo, porque si miras todos los modelos, primero tienes que hacer voz a texto, luego LLM, luego texto a voz, no olvides también alguna latencia de red y terminas con un número que es significativamente, como, más de dos veces más alto que nuestro objetivo inicial. Así que aquí tendrás que pensar en diferentes tipos de optimizaciones para lograr esto. También algunos conceptos clave más que es mejor conocer al construir Agentes de Voz. En primer lugar, todo va en la transmisión. No quieres que tu modelo de texto a voz comience a generar transmisión de audio mientras LLM está listo con la respuesta. Quieres hacerlo inmediatamente.

3. Optimizing Components Selection for Voice Agents

Short description:

Explorando aspectos esenciales como la detección de actividad de voz, manejo de interrupciones, ejecución especulativa y criterios de selección de componentes para Agentes de Voz, con un enfoque en el servicio DeepGram y sus modelos.

Por eso el flujo va desde el canal de transporte, va a texto a voz, luego a LLM, y LLM proporciona el resultado. También, una definición más importante que escucharás mucho en el ámbito de los Agentes de Voz, es la detección de actividad de voz. Esa es una parte súper desafiante, porque solo enviar audio a voz a texto, no resuelve el problema de que a veces no hay texto, a veces es solo un ruido, a veces la persona hace una pausa en el discurso. Así que esta cosa de VAD va incluso antes de voz a texto. Y conectado también a VAD, tenemos la detección de turno semántico.

¿Qué significa eso? Es exactamente para entender el momento en que el usuario detiene la oración, detiene la frase para hacer este turno y dejar que el agente responda. También es importante el manejo de interrupciones. Y para algunos Agentes de Voz antiguos, podrías notar, si tuviste experiencia, que si el Agente de Voz está diciendo la frase, no puedes interrumpir, hasta que la frase esté completa y solo después puedes hablar. Pero no es muy conveniente, eso no es humano.

Y quieres que el agente se detenga automáticamente y responda a tu siguiente frase. Esto también va a la orquestación. Además, hay un término como ejecución especulativa, que a veces comienzas a generar respuesta desde LLM incluso cuando la frase no está completa, pero alguna parte de la frase está ahí y puedes comenzar a generar respuesta. Eso es una optimización para LLM para obtener respuesta más rápido.

4. Selecting Parameters for Voice Agent Components

Short description:

Explorando la importancia de parámetros como latencia, calidad, precios y soporte de idiomas en la selección de componentes, con un enfoque en el servicio DeepGram y sus modelos. Consideraciones para la selección de modelos y el equilibrio entre velocidad e inteligencia en las respuestas, junto con parámetros clave para texto a voz como TTFA, precio, idiomas, voces y opciones de clonación de voz.

Pero eso no es específico para Voice Agent, pero diría que es un concepto súper importante para cualquier agente en general. Ahora pasamos al siguiente bloque, cuando entendemos todas las partes, queremos elegir esas partes para nuestro Voice Agent. Vamos uno por uno. Speech to text. Y en speech to text lo que necesitamos comparar, qué parámetros son importantes para nosotros. Obviamente, latencia, el primero, qué tan rápido es. El segundo, queremos preocuparnos por la calidad, por eso buscaremos el parámetro de tasa de error de palabras. Y a veces los números de marketing y los benchmarks reales son diferentes, significativamente diferentes. Así que por favor ten esto en cuenta.

También obviamente el precio, porque incluso a pequeña escala, el precio es asequible. Necesitas pensar en la escala futura. También los idiomas. Si podemos decir al 100% que el inglés es bueno para todos los modelos, pero otros idiomas podrían no ser tan buenos. Y basado en tu caso de negocio, ten esto en consideración. Y como un ganador definitivo para nosotros por ahora, encontramos el servicio DeepGram y dos modelos de este servicio. También para cada bloque, para cada modelo, he proporcionado aquí un enlace. Así que las diapositivas se compartirán después de la charla y puedes ir a través de este enlace. Y he construido una tabla bastante completa comparando todos los modelos que también puedes verificar qué hay allí.

Hablando de LLM, probablemente ya sabes mucho sobre LLM. La única cosa que necesitas tener en cuenta es que en la mayoría de los casos para los agentes de voz, no es la decisión más inteligente tomar el modelo más avanzado, porque es lento. Es lento y a veces necesitas tomar un modelo comparativamente tonto, pero será rápido. Así que estás equilibrando aquí la velocidad y la inteligencia de las respuestas que necesitas. Ahora vamos a texto a voz. ¿Qué parámetros de texto a voz son importantes para nosotros? Tenemos un parámetro que se llama TTFA o tiempo hasta el primer audio. Eso es algo similar a la latencia, donde convertimos texto a audio y qué tan rápido será el primer flujo de audio. Obviamente también el precio, también los idiomas.

Y aquí también tenemos una opción, voces. ¿Cuántas voces hay? ¿Hay diferentes acentos para diferentes idiomas? Y conectado a este punto, también opciones de clonación de voz. Algunos servicios te proporcionan la posibilidad de clonar la voz. Puedes clonar tu propia voz, tu voz personal si quieres, o alguna voz específica y usarla para tu agente de voz.

5. Explorando Soluciones de Orquestación para Agentes de Voz

Short description:

Explorando 11Labs y Cartesia como las mejores opciones, enfatizando la calidad, variedad de voces y clonación de voz. Profundizando en opciones de orquestación como WAPI, Retail AI, Lifekit y Pipecat, destacando el aspecto de hacerlo tú mismo y la personalización.

Y aquí, por ahora, dos líderes definitivos son 11Labs y el servicio Cartesia. Proporcionan una calidad bastante buena, muchas voces, posibilidad de tener tu propio clon. Así que definitivamente a considerar.

Ahora pasando a la orquestación. Cuando seleccionamos todas las partes, necesitamos ensamblarlas juntas. Y aquí, para la orquestación, ya tenemos varios jugadores bastante serios en el mercado. Uno que estamos usando actualmente, es WAPI o servicio Voice API. Te da la posibilidad de usar todos sus modelos. Todo está integrado. Solo necesitas conectar el número.

También, un fuerte competidor, Retail AI. También, todo desde la caja. Dos más, como Lifekit y Pipecat. Estos, a pesar de que también tienen la posibilidad de alojar en su sitio, es más una solución de hacerlo tú mismo. Aquí, también presenté 11Labs. Es generación de voz, pero también tienen orquestación parcial. Y puedes construir completamente personalizado. Así que, si comparas alguna orquestación de servicio lista, orquestación de servicio gestionado y hacerlo tú mismo, lo que necesitas tener en cuenta.

6. Comparando Soluciones de Agentes de Voz DIY y Gestionadas

Short description:

Comparando las implicaciones de tiempo y costo entre soluciones de agentes de voz listas para usar y DIY. Destacando la flexibilidad y rentabilidad de los enfoques DIY en comparación con las soluciones gestionadas. Considerando las capacidades de depuración, factores de costo y los posibles efectos de bloqueo de las soluciones gestionadas.

Obviamente, algún servicio en el que solo necesitas crear una cuenta y puedes comenzar te tomará probablemente minutos y puedes hacer tu primera llamada. Pero aún así, hacerlo tú mismo con la biblioteca y servicios existentes como Lifekit y Pipecat, es... Para mí, lo probé yo mismo, te lleva, bueno, tal vez horas, pero no días o semanas.

Vi en muchas publicaciones de blog, la comparación se hace de tal manera que la solución de hacerlo tú mismo con Pipecat podría llevarte semanas y semanas, como tres semanas, pero en realidad no es el caso para construir el primer prototipo. Además, puedes comparar el costo, y el costo, podemos comparar en dos parámetros. Cuando es bajo volumen, básicamente, pagas mucho por la solución de hacerlo tú mismo y solo pagas por uso para la solución gestionada. Y al contrario, cuando escalas y tienes muchos minutos, el precio escalará rápidamente con la solución gestionada y obtendrás una solución mucho más barata con hacerlo tú mismo.

Hablando de depuración, estás bastante limitado en términos de depuración con la solución gestionada que podrías tener algún panel de control y registros, pero si quieres profundizar, no hay tantas posibilidades. Para la solución de hacerlo tú mismo, puedes volverte loco con la observabilidad, pero aún así tienes que construirlo. Y también, necesitas tener en cuenta que todas esas soluciones intentan gestionar soluciones, soluciones listas para usar, intentan mantenerte dentro, te proporcionan algunas características específicas que dentro de estas características, será difícil para ti migrar y hacerlo tú mismo. También podemos comparar el costo en números exactos.

7. Cost Implications and Building Voice Agents

Short description:

Discutiendo las implicaciones de costo basadas en volúmenes de uso entre soluciones gestionadas y autoalojadas. Mencionando la importancia de entender la escala con números reales para una comparación clara de costos. Explorando proveedores de telefonía maduros como Telnyx y Trilio, con consideraciones para el cumplimiento de GDPR y servicios confiables. Introduciendo la simplicidad de construir agentes de voz con ejemplos como Vapi y destacando el proceso sencillo de hacer llamadas a través del desarrollo de código.

Y si haces una estimación aproximada, todavía parece que no es mucho, como 10 centavos, 10 centavos por minuto, comparado con 1 o 2 centavos por minuto. Pero si intentas evaluar con números reales, como, supongamos que tienes alguna startup promedio con 20,000 usuarios activos, quieres llamarlos cada día, quieres que tu agente de voz hable con ellos, cada día con una llamada promedio de 5 minutos, terminas con 3 millones de minutos y eso significa 300k para la solución gestionada y solo 36k para la autoalojada. Obviamente, pagarás por soporte, pagarás por infraestructura, pero es solo para que entiendas la escala.

También encontré en internet, también encontré una buena calculadora, también puse el enlace, puedes jugar con ella con más parámetros y tu caso de negocio específico. Hablando de telefonía, qué proveedor conectar, encontré dos bastante maduros, esos son Telnyx, que es europeo, si piensas en la ley de datos GDPR, probablemente sea bueno para ir, están basados en Francia. Y también tienes Trilio, ambos bastante confiables, puedes tener una gama de números allí, y también Retail, también es orquestación, pero se asocian con telefonía, por lo que podrías tener telefonía incorporada.

Ahora, hablando de construir, construir y código real, quería comparar, no quiero profundizar demasiado, considero firmemente tener una masterclass separada en construir un agente de voz desde cero, usando diferentes bibliotecas, comparándolas, pero por ahora quiero centrarme solo en dos y mostrarte que no hay nada complejo aquí. Tomé un ejemplo, Vapi, que es un servicio listo que puedes simplemente registrar, y después puedes usar el SDK, y proporcionando un conjunto de parámetros puedes hacer tu primera llamada. Así que aquí tenemos unas 20 líneas de código y ya puedes hacer tu llamada. Puedes hacer tu llamada a través de la interfaz, obviamente, pero desde el punto de vista del desarrollo todavía tienes que escribir algo de código.

8. Configuración de Parámetros y Consideraciones de Idioma

Short description:

Discutiendo la configuración de parámetros para agentes de voz, incluyendo la selección de modelos para LLM, voces para texto a voz, y servicios para voz a texto. Explorando la biblioteca Pipecat como una opción DIY para configurar componentes de voz y pipelines. Destacando la importancia de las consideraciones de idioma y ajustes de infraestructura para agentes de voz.

Y aquí, a partir de los parámetros, vemos el número que usas, dónde quieres llamar, y descripción de las partes que acabamos de discutir. Para LLM seleccionamos el modelo, y especificamos el prompt, lo que debería hacer. Para texto a voz seleccionamos la voz, y uso un ID de voz específico de Cartesian. Y voz a texto, servicio DeepGram con modelo NOVA2. Y eso es todo. Quizás algunos parámetros más, pero tan simple como es. Podemos compararlo con Pipecat. Pipecat es una biblioteca de hazlo tú mismo, y normalmente tienes que configurar mucho más aquí. Pero vamos a ver el ejemplo.

Simplifiqué un poco el código, pero quería resaltar los conceptos principales aquí. Necesitas tu transporte, necesitas configurar tus modelos como voz a texto, texto a voz, y LLM con esos servicios. Tendrás que registrarte en esos servicios por separado, comparado con WAPI. Luego proporcionas tu contexto a LLM, y creas el pipeline de Pipecat. Pipecat trabaja con pipelines y tareas. Y en el pipeline establecemos, bien, esos serán los inputs, luego lo ponemos en voz a texto, luego proporcionamos toda la información del usuario, y lo combinamos en LLM. Luego tenemos una respuesta, la respuesta la convertimos de nuevo a voz, la enviamos de vuelta al transporte, y guardamos de nuevo en el Asistente lo que fue.

Donde creamos nuestro pipeline, basado en el pipeline podemos crear una tarea y ejecutar esta tarea. Eso es todo, de nuevo, lo que necesitas para tener una llamada en un vecino específico con tu agente de voz. Es bastante simple. Preparé para ti todo el repositorio con ejemplos donde puedes revisar el código de diferentes herramientas, diferentes modelos, y puedes jugar tú mismo. También se proporciona tu enlace. Una cosa más que quería compartir, algunos hallazgos cuando comenzamos a construir el Agente de Voz con la función de Producción de Unreal. En primer lugar, lo que ya mencioné, todo fue perfecto cuando comenzamos a probarlo con inglés. Pero nuestra audiencia es holandesa, personas holandesas, y aquí enfrentamos algunos desafíos. Y eso es algo que necesitas considerar. ¿Qué idiomas necesitas usar para tu sistema?

Y no pienses que si funciona para inglés, funcionará bien para todos los demás. Porque tendrás que ajustar tu voz a texto, tendrás que ajustar el texto a voz y a veces no tendrás ya optimizado para este idioma específico. Así que tal vez haya una idea de ir con un conjunto limitado, asegurarte de que tu idea funcione y luego extender esos idiomas, buscas modelos específicos para el idioma. También para infraestructura. Para infraestructura, bueno, lo primero que noté, incluso a pesar de que usamos el servicio WAPI, servicio listo, no tiene el concepto de entornos.

9. Infrastructure Challenges and Future Plans

Short description:

Discutiendo la necesidad de múltiples entornos y enfoques de prueba. Destacando los desafíos de infraestructura con los límites de WAPI y consideraciones de selección de modelos para agentes de voz. Abordando desafíos de texto a voz con la lectura de números y anunciando futuras masterclasses e iniciativas comunitarias.

Así que para tener diferentes entornos como staging, producción y entorno de desarrollo, tuvimos que crear diferentes cuentas. Bueno, eso probablemente está bien. Después tuvimos que pensar en todas las pruebas que necesitamos. Y no se trata solo de pruebas unitarias. Quieres probar tus prompts para LLM por separado. Quieres probar el audio por separado. Quieres asegurarte de que tu transporte funcione. Y también hay una posibilidad interesante de probar tu agente de voz con otro agente de voz.

Y una cosa más para la infraestructura que, desafortunadamente, la infraestructura, el código para el agente de voz es bastante verde, diría yo. Intenté configurarlo con WAPI y creé algunos scripts de utilidad yo mismo usando la API de WAPI. Pero el problema aquí es que te proporcionan límites bastante estrictos. Así que cuando intenté desplegar cinco agentes, ya alcancé el límite de la API de WAPI. Eso no fue muy conveniente. También algunos trucos que consideramos.

Tienes dos situaciones diferentes. Tienes interacción de usuario en tiempo real y también tienes procesamiento en segundo plano. Y para la interacción de usuario real, es bueno usar un modelo súper rápido. Sí, confiable, pero súper rápido. Pero después de que la conversación haya terminado, solo para asegurarte de que no haya muchos errores o si necesitas generar algún tipo de informe.

Available in other languages:

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Depuración de JS

React Summit 2023

24 min

Depuración de JS

Top Content

Mark Erikson

Replay.io

Debugging JavaScript is a crucial skill that is often overlooked in the industry. It is important to understand the problem, reproduce the issue, and identify the root cause. Having a variety of debugging tools and techniques, such as console methods and graphical debuggers, is beneficial. Replay is a time-traveling debugger for JavaScript that allows users to record and inspect bugs. It works with Redux, plain React, and even minified code with the help of source maps.

javascript web development case study best practices debug

Construyendo un Asistente AI Activado por Voz con Javascript

JSNation 2023

21 min

Construyendo un Asistente AI Activado por Voz con Javascript

Top Content

Tejas Kumar

Author of the "Fluent React" bestselling book, software engineer with 23 years of experience, and host of the developer-loved ConTejas Code podcast.

This Talk discusses building a voice-activated AI assistant using web APIs and JavaScript. It covers using the Web Speech API for speech recognition and the speech synthesis API for text to speech. The speaker demonstrates how to communicate with the Open AI API and handle the response. The Talk also explores enabling speech recognition and addressing the user. The speaker concludes by mentioning the possibility of creating a product out of the project and using Tauri for native desktop-like experiences.

artificial intelligence case study

Un Marco para Gestionar la Deuda Técnica

TechLead Conference 2023

35 min

Un Marco para Gestionar la Deuda Técnica

Top Content

Fredrik Höglund

ephem.dev

React query version five is live and we'll be discussing the migration process to server components using Next.js and React Query. The process involves planning, preparing, and setting up server components, migrating pages, adding layouts, and moving components to the server. We'll also explore the benefits of server components such as reducing JavaScript shipping, enabling powerful caching, and leveraging the features of the app router. Additionally, we'll cover topics like handling authentication, rendering in server components, and the impact on server load and costs.

react react query react 18 react server components next.js case study

De Monolito a Micro-Frontends

React Advanced 2022

22 min

De Monolito a Micro-Frontends

Top Content

Ruben Casas

Postman

Microfrontends are considered as a solution to the problems of exponential growth, code duplication, and unclear ownership in older applications. Transitioning from a monolith to microfrontends involves decoupling the system and exploring options like a modular monolith. Microfrontends enable independent deployments and runtime composition, but there is a discussion about the alternative of keeping an integrated application composed at runtime. Choosing a composition model and a router are crucial decisions in the technical plan. The Strangler pattern and the reverse Strangler pattern are used to gradually replace parts of the monolith with the new application.

micro-frontends developer challenges micro frontends react case study

Solucionando Problemas de Rendimiento en React

React Advanced 2023

22 min

Solucionando Problemas de Rendimiento en React

Top Content

Josh Goldberg

Open Source enthusiast, TypeScript contributor, writing a book on Typescript

This Talk discusses various strategies to improve React performance, including lazy loading iframes, analyzing and optimizing bundles, fixing barrel exports and tree shaking, removing dead code, and caching expensive computations. The speaker shares their experience in identifying and addressing performance issues in a real-world application. They also highlight the importance of regularly auditing webpack and bundle analyzers, using tools like Knip to find unused code, and contributing improvements to open source libraries.

react performance case study

Workshops on related topic

Construyendo una Aplicación de Shopify con React & Node

React Summit Remote Edition 2021

87 min

Construyendo una Aplicación de Shopify con React & Node

Top Content

Workshop

2 authors

Los comerciantes de Shopify tienen un conjunto diverso de necesidades, y los desarrolladores tienen una oportunidad única para satisfacer esas necesidades construyendo aplicaciones. Construir una aplicación puede ser un trabajo duro, pero Shopify ha creado un conjunto de herramientas y recursos para ayudarte a construir una experiencia de aplicación sin problemas lo más rápido posible. Obtén experiencia práctica construyendo una aplicación integrada de Shopify utilizando el CLI de la aplicación Shopify, Polaris y Shopify App Bridge.Te mostraremos cómo crear una aplicación que acceda a la información de una tienda de desarrollo y pueda ejecutarse en tu entorno local.

e-commerce shopify with react shopify case study

Construye una sala de chat con Appwrite y React

JSNation 2022

41 min

Construye una sala de chat con Appwrite y React

Workshop

Wess Cope

Las API/Backends son difíciles y necesitamos websockets. Utilizarás VS Code como tu editor, Parcel.js, Chakra-ui, React, React Icons y Appwrite. Al final de este masterclass, tendrás los conocimientos para construir una aplicación en tiempo real utilizando Appwrite y sin necesidad de desarrollar una API. ¡Sigue los pasos y tendrás una increíble aplicación de chat para presumir!

web development react chat app case study realtime

Problemas difíciles de GraphQL en Shopify

GraphQL Galaxy 2021

164 min

Problemas difíciles de GraphQL en Shopify

Workshop

5 authors

En Shopify a gran escala, resolvemos algunos problemas bastante difíciles. En este masterclass, cinco oradores diferentes describirán algunos de los desafíos que hemos enfrentado y cómo los hemos superado.

Tabla de contenidos:
1 - El infame problema "N+1": Jonathan Baker - Vamos a hablar sobre qué es, por qué es un problema y cómo Shopify lo maneja a gran escala en varios APIs de GraphQL.
2 - Contextualizando APIs de GraphQL: Alex Ackerman - Cómo y por qué decidimos usar directivas. Compartiré qué son las directivas, qué directivas están disponibles de forma predeterminada y cómo crear directivas personalizadas.
3 - Consultas de GraphQL más rápidas para clientes móviles: Theo Ben Hassen - A medida que tu aplicación móvil crece, también lo harán tus consultas de GraphQL. En esta charla, repasaré diversas estrategias para hacer que tus consultas sean más rápidas y efectivas.
4 - Construyendo el producto del futuro hoy: Greg MacWilliam - Cómo Shopify adopta las características futuras en el código actual.
5 - Gestión efectiva de APIs grandes: Rebecca Friedman - Tenemos miles de desarrolladores en Shopify. Veamos cómo estamos asegurando la calidad y consistencia de nuestras APIs de GraphQL con tantos colaboradores.

graphql scalability case study

Construye Aplicaciones Modernas Utilizando GraphQL y Javascript

Node Congress 2024

152 min

Construye Aplicaciones Modernas Utilizando GraphQL y Javascript

Workshop

2 authors

Ven y aprende cómo puedes potenciar tus aplicaciones modernas y seguras utilizando GraphQL y Javascript. En este masterclass construiremos una API de GraphQL y demostraremos los beneficios del lenguaje de consulta para APIs y los casos de uso para los que es adecuado. Se requiere conocimiento básico de Javascript.

graphql web development case study

Crear una base de conocimientos con Gatsby, Contentful y AWS

React Summit 2022

152 min

Crear una base de conocimientos con Gatsby, Contentful y AWS

Workshop

Abdelrhman Adel

En este masterclass, veremos cómo crear una base de conocimientos utilizando Gatsby, un Framework generador de sitios estáticos que utiliza React y GraphQL, Contentful, un CMS sin cabeza para gestionar el contenido y desplegarlo en AWS S3.

graphql aws gatsby case study

De 0 a Autenticación en una Hora para tu Aplicación JavaScript

JSNation 2023

57 min

De 0 a Autenticación en una Hora para tu Aplicación JavaScript

WorkshopFree

Asaf Shen

La autenticación sin contraseña puede parecer compleja, pero es fácil de agregar a cualquier aplicación utilizando la herramienta adecuada.
Mejoraremos una aplicación JS de pila completa (backend Node.js + frontend Vanilla JS) para autenticar usuarios con contraseñas de un solo uso (correo electrónico) y OAuth, incluyendo:
- Autenticación de usuario: Gestión de interacciones de usuario, devolución de JWT de sesión / actualización- Gestión y validación de sesiones: Almacenamiento seguro de la sesión para solicitudes posteriores del cliente, validación / actualización de sesiones
Al final del masterclass, también abordaremos otro enfoque para la autenticación de código utilizando Flujos de Descope en el frontend (flujos de arrastrar y soltar), manteniendo solo la validación de sesión en el backend. Con esto, también mostraremos lo fácil que es habilitar la biometría y otros métodos de autenticación sin contraseña.

authentication case study