Versión en EspañolES

Desconstruyendo el Rastreo Distribuido

El rastreo distribuido es una técnica poderosa que te permite seguir el flujo y el tiempo de las solicitudes a medida que navegan a través de un sistema. Al vincular operaciones y solicitudes entre múltiples servicios, el rastreo distribuido proporciona valiosos conocimientos sobre el rendimiento de la aplicación y ayuda a identificar cuellos de botella. En esta charla, Lazar explicará el concepto de Rastreo Distribuido guiándote a través de cómo las herramientas de monitoreo construyen soluciones de rastreo.

This talk has been presented at React Day Berlin 2023, check out the latest edition of this React Conference.

FAQ

La trazabilidad distribuida es una técnica que permite rastrear el flujo y el tiempo de las solicitudes y operaciones a través de un sistema, especialmente útil en aplicaciones de microservicios y pilas completas para entender el rendimiento del sistema e identificar cuellos de botella.

Es importante porque ayuda a comprender el rendimiento del sistema y a identificar problemas complejos y cuellos de botella, facilitando la depuración de errores inusuales y condiciones de carrera que no se podrían identificar fácilmente con métodos de depuración más simples.

Inicialmente, se utilizaban registros simples en servidores como Apache. Con el tiempo, la concurrencia y la asincronía en las aplicaciones requirieron métodos más complejos, como el uso de IDs únicos para solicitudes y, finalmente, la implementación de microservicios y contenedores intensificó la necesidad de herramientas más avanzadas como la trazabilidad distribuida.

Un 'span' es la unidad más pequeña de trabajo en la trazabilidad distribuida, como una solicitud HTTP o una llamada a función, que puede iniciar otros 'spans' hijos, creando una jerarquía que refleja la estructura del software y ayuda a identificar el flujo y rendimiento de operaciones específicas dentro del sistema.

Se utiliza un contexto de traza que concatena el ID de la traza y el ID del último 'span' en una cadena. Esta cadena se transfiere entre clientes, microservicios y otras unidades de procesamiento, permitiendo que el sistema continúe la traza a partir del último 'span' donde se quedó.

Además de mejorar la depuración y el rendimiento del sistema, la trazabilidad distribuida permite mantener etiquetas y un estado en cada 'span', lo que facilita la búsqueda, agrupación y análisis detallado de datos para optimizar aún más las operaciones y detectar ineficiencias.

performance opentelemetry react

Lazar Nikolov

8 min

12 Dec, 2023

Comments

Video Summary and Transcription

El rastreo distribuido es una técnica poderosa para rastrear solicitudes y operaciones en un sistema, especialmente en aplicaciones de pila completa y microservicios. La reinvención del rastreo distribuido introduce el concepto de un rastro y abarca para capturar datos de depuración. Las mejoras incluyen etiquetas y un campo de estado para un mejor análisis, y la distribución de rastros utilizando un contexto de rastro para un rastreo continuo.

Available in English: Deconstructing Distributed Tracing

1. Introducción a la Trazabilidad Distribuida

Short description:

La trazabilidad distribuida es una técnica poderosa que ayuda a rastrear el flujo y el tiempo de las solicitudes y operaciones en un sistema. Es especialmente útil para aplicaciones de pila completa y microservicios, permitiendo una mejor comprensión del rendimiento del sistema e identificación de cuellos de botella. La técnica ha estado presente desde principios de los años 2000 pero ganó popularidad en la década de 2010. A medida que las bibliotecas y los marcos evolucionaron, también lo hicieron las herramientas de depuración, desde los registros en Apache Server hasta el manejo de múltiples solicitudes en un solo proceso con hilos separados. Con la concurrencia avanzada, marcos como Node.js permiten que las solicitudes comiencen y terminen en diferentes hilos.

♪ ♪ Reconstruyendo la trazabilidad distribuida. Hola a todos. Mi nombre es Laza Nikolov, y soy un defensor del desarrollo en Sentry. Hoy en mi charla, vamos a hablar sobre la trazabilidad distribuida. Primero explicaré qué es. Luego vamos a entrar un poco en la historia de las herramientas de depuración para descubrir por qué existía la trazabilidad distribuida en primer lugar. Y luego, para entenderlo mejor, vamos a reconstruir la trazabilidad distribuida desde cero o al menos solo el concepto de ella.

Muy bien, entonces, sumerjámonos. La trazabilidad distribuida es una técnica poderosa que te permite rastrear el flujo y el tiempo de las solicitudes y operaciones a medida que fluyen a través de tu sistema. Esto es especialmente útil para la pila completa y para las aplicaciones de microservicios. La trazabilidad distribuida te ayuda a entender el rendimiento del sistema e identificar cualquier cuello de botella. Es especialmente útil para depurar errores complejos y extraños como los errores de condición de carrera que requieren mucho más que solo un bloqueo de consola y un rastreo de pila. No es nuevo por ningún medio. Hay documentos técnicos que mencionan la trazabilidad desde principios de los años 2000, pero se popularizó durante la década de 2010. Entonces, para entender por qué existe, necesitamos retroceder en el tiempo.

A medida que nuestras bibliotecas y marcos evolucionaron, también lo hicieron nuestras herramientas de depuración. Por ejemplo, en los primeros días de Apache Server, los registros eran uno de los pocos métodos para depurar. A medida que llegaban las solicitudes, Apache generaba un proceso hijo y manejaba las solicitudes. Si querías depurar lo que sucedió durante esa solicitud específica, podrías simplemente extraer los registros del proceso y verás todo el flujo de operación. Y eso funcionó. Estábamos contentos. Luego obtuvimos concurrencia básica. Piensa en IIS en ASP.NET. En lugar de generar un proceso para cada solicitud, comenzamos a manejar múltiples solicitudes en un solo proceso, pero en un hilo separado. Los registros siguen siendo un buen método de depuración, pero para aislar los registros de la solicitud, necesitamos prefijarlos con el nombre del hilo y luego filtrar los mensajes de registro basándonos en él. No es gran cosa, pero lo hicimos funcionar. Luego obtuvimos concurrencia avanzada. Nuestros marcos evolucionaron a ser asíncronos, multihilos, futuros y promesas, marcos basados en bucles de eventos. Esto es Node.js. Así que ahora nuestra solicitud puede comenzar en un hilo, pero terminar en uno diferente, pasando por muchos otros hilos en el camino.

2. Reinventando la Trazabilidad Distribuida

Short description:

El prefijo de los registros con un ID único para cada solicitud ya no resuelve el problema en un sistema distribuido. Con el auge de los servicios contenerizados, los backends se distribuyen en varias máquinas, lo que dificulta el seguimiento de las operaciones. Para abordar esto, reinventamos la trazabilidad distribuida desde cero. Introdujimos el concepto de una traza, que sigue una solicitud y captura datos de depuración. Dentro de la traza, tenemos spans que representan la unidad más pequeña de trabajo, como una solicitud HTTP o una llamada a una función. Los spans pueden crear spans hijos, lo que nos permite reflejar la estructura de nuestro software. Cada span tiene un ID único y contiene datos como su ID padre.

Prefijarlos con el nombre del hilo realmente no resuelve nuestro problema ahora. Necesitamos prefijarlos con algo único para la solicitud en sí, y eso es lo que hicimos. Generamos un ID único para cada solicitud y lo prefijamos, nuestros registros.

Pero nuestros frameworks no dejaron de evolucionar. Hace unos 10 años, Docker y AWS dieron paso a los servicios contenerizados. Y ahora nuestros backends ni siquiera viven en una sola máquina. Cada contenedor y microservicio manejaba múltiples solicitudes y producía sus propios registros. Nuestros registros están por todas partes ahora. Era muy difícil entender el flujo de operaciones, por lo que necesitábamos una mejor herramienta de depuración que pudiera rastrear las operaciones a medida que saltan entre containers y servicios. Ahí es cuando la trazabilidad distribuida se convirtió en una herramienta necesaria para la depuración.

Para entender cómo funciona, vamos a reinventarlo desde cero. Dado que nuestros backends ahora tienen una naturaleza muy distribuida, necesitábamos definir un vehículo para cada solicitud que la seguirá y capturará los data de depuración en el camino. Llamemos a eso una traza. La traza comenzará cuando comience el flujo de operaciones, y va a tener un ID único. Eso puede ser el frontend, por ejemplo.

Si pensamos en los registros, generalmente nos dicen qué sucedió en un momento particular. Intentan imitar la estructura de nuestro código. Así que inventemos eso ahora. Inventemos algo que vaya a describir la unidad más pequeña de trabajo, como una solicitud HTTP o una llamada a una función o cualquier cosa específica que nuestro software haga en un momento específico. Vamos a llamar a eso un span, y vamos a crear uno inmediatamente cuando comience la traza. Eso va a ser nuestro span raíz.

Así que al igual que los registros, los spans van a imitar la estructura de nuestro software. Pero como lo estamos reinventando, hagámoslo mucho más inteligente que simples mensajes. Entonces, como los spans son la unidad más pequeña de trabajo, como una sola función, y sabemos que una función puede invocar a otra función, que a su vez también puede invocar a una tercera función, vamos a design nuestros spans para que puedan crear spans hijos, que pueden crear sus propios spans hijos y así sucesivamente. Ahora realmente podemos reflejar la estructura de nuestro software con esto. Tenemos una jerarquía de spans, pero necesitamos recordar qué span es hijo de qué span. Para hacer eso, vamos a necesitar algo para identificar cada span. Así que asignaremos un ID a cada span a medida que los creamos. También necesitamos guardar el ID del span padre. Así que vamos a crear un espacio dentro de cada span para que pueda contener data como su ID y su ID padre.

3. Mejorando los Datos de Trazabilidad y Distribuyendo la Trazabilidad

Short description:

Además de capturar datos básicos sobre los spans, también podemos mantener etiquetas y un campo de estado para proporcionar más contexto y permitir un mejor análisis. Al introducir un método de finalización, podemos calcular la duración de los spans e identificar cuellos de botella de rendimiento. Para distribuir la traza en el backend, creamos un contexto de traza que concatena el ID de la traza y el ID del último span en una cadena. Esta cadena puede ser fácilmente transferida y analizada por diferentes componentes, permitiendo una trazabilidad continua.

¿Pero por qué detenernos ahí? Tenemos espacio para más data. Mantengamos un conjunto de etiquetas para que podamos buscarlas, agregarlas y agruparlas más tarde. También mantengamos un campo de estado que va a indicar si los spans funcionan, terminan con éxito o no. Básicamente podemos mantener cualquier tipo de data que pueda ser útil más adelante.

Como sabemos cuándo los creamos, introduzcamos un método de finalización que anotará cuándo terminaron los spans. Así que ahora podemos calcular cuánto tiempo tomaron los spans. Ahora tenemos suficiente información para graficarlos. Y si lo hacemos, vamos a poder identificar fácilmente los cuellos de botella de performance. Quiero decir, será obvio que ese span no debería tomar tanto tiempo.

Pero aún así, ¿cómo distribuimos esto ahora? ¿Cómo podemos continuar esta traza en el backend? Teníamos la traza y su ID. También tenemos un montón de spans adjuntos a ella. Creemos un contexto de traza que va a concatenar el ID de la traza y el ID del último span en una cadena. Ahora podemos transferir esta cadena para que nuestro backend o las próximas unidades de procesamiento puedan analizarla y continuar la trazabilidad, comenzando desde el último span. Como va a ser una cadena, podemos transferirla fácilmente, ya sea un cliente, un microservicio, un trabajo cron, o esté en JavaScript o Python o PHP, siempre y cuando pueda analizar y leer una cadena, puede continuar nuestra traza. Y eso es trazabilidad distribuida. Así es como podemos trazar todo nuestro sistema, sin importar cuán complejo sea.

Available in other languages:

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Una Guía del Comportamiento de Renderizado de React

React Advanced 2022

25 min

Una Guía del Comportamiento de Renderizado de React

Top Content

Mark Erikson

Replay.io

This transcription provides a brief guide to React rendering behavior. It explains the process of rendering, comparing new and old elements, and the importance of pure rendering without side effects. It also covers topics such as batching and double rendering, optimizing rendering and using context and Redux in React. Overall, it offers valuable insights for developers looking to understand and optimize React rendering.

react performance deep dive react rendering

Acelerando tu aplicación React con menos JavaScript

React Summit 2023

32 min

Acelerando tu aplicación React con menos JavaScript

Top Content

Miško Hevery

Qwik Creator

Mishko, the creator of Angular and AngularJS, discusses the challenges of website performance and JavaScript hydration. He explains the differences between client-side and server-side rendering and introduces Quik as a solution for efficient component hydration. Mishko demonstrates examples of state management and intercommunication using Quik. He highlights the performance benefits of using Quik with React and emphasizes the importance of reducing JavaScript size for better performance. Finally, he mentions the use of QUIC in both MPA and SPA applications for improved startup performance.

performance frameworks builders and founders qwik react less

Concurrencia en React, Explicada

React Summit 2023

23 min

Concurrencia en React, Explicada

Top Content

Ivan Akulov

Google Developer Expert, Web Performance Consultant, Netherlands

React 18's concurrent rendering, specifically the useTransition hook, optimizes app performance by allowing non-urgent updates to be processed without freezing the UI. However, there are drawbacks such as longer processing time for non-urgent updates and increased CPU usage. The useTransition hook works similarly to throttling or bouncing, making it useful for addressing performance issues caused by multiple small components. Libraries like React Query may require the use of alternative APIs to handle urgent and non-urgent updates effectively.

react performance best practices react 18 deep dive react concurrent mode

How React Compiler Performs on Real Code

React Advanced 2024

31 min

How React Compiler Performs on Real Code

Top Content

Nadia Makarevich

Coder, writer, author of Advanced React book

I'm Nadia, a developer experienced in performance, re-renders, and React. The React team released the React compiler, which eliminates the need for memoization. The compiler optimizes code by automatically memoizing components, props, and hook dependencies. It shows promise in managing changing references and improving performance. Real app testing and synthetic examples have been used to evaluate its effectiveness. The impact on initial load performance is minimal, but further investigation is needed for interactions performance. The React query library simplifies data fetching and caching. The compiler has limitations and may not catch every re-render, especially with external libraries. Enabling the compiler can improve performance but manual memorization is still necessary for optimal results. There are risks of overreliance and messy code, but the compiler can be used file by file or folder by folder with thorough testing. Practice makes incredible cats. Thank you, Nadia!

performance

Optimización de juegos HTML5: 10 años de aprendizaje

JS GameDev Summit 2022

33 min

Optimización de juegos HTML5: 10 años de aprendizaje

Top Content

Will Eastcott

CEO & co-founder of PlayCanvas

PlayCanvas is an open-source game engine used by game developers worldwide. Optimization is crucial for HTML5 games, focusing on load times and frame rate. Texture and mesh optimization can significantly reduce download sizes. GLTF and GLB formats offer smaller file sizes and faster parsing times. Compressing game resources and using efficient file formats can improve load times. Framerate optimization and resolution scaling are important for better performance. Managing draw calls and using batching techniques can optimize performance. Browser DevTools, such as Chrome and Firefox, are useful for debugging and profiling. Detecting device performance and optimizing based on specific devices can improve game performance. Apple is making progress with WebGPU implementation. HTML5 games can be shipped to the App Store using Cordova.

performance game development game engine

El Futuro de las Herramientas de Rendimiento

JSNation 2022

21 min

El Futuro de las Herramientas de Rendimiento

Top Content

Addy Osmani

Engineering Leader Working on Google Chrome

Today's Talk discusses the future of performance tooling, focusing on user-centric, actionable, and contextual approaches. The introduction highlights Adi Osmani's expertise in performance tools and his passion for DevTools features. The Talk explores the integration of user flows into DevTools and Lighthouse, enabling performance measurement and optimization. It also showcases the import/export feature for user flows and the collaboration potential with Lighthouse. The Talk further delves into the use of flows with other tools like web page test and Cypress, offering cross-browser testing capabilities. The actionable aspect emphasizes the importance of metrics like Interaction to Next Paint and Total Blocking Time, as well as the improvements in Lighthouse and performance debugging tools. Lastly, the Talk emphasizes the iterative nature of performance improvement and the user-centric, actionable, and contextual future of performance tooling.

performance tooling devtools

Workshops on related topic

Masterclass de Depuración de Rendimiento de React

React Summit 2023

170 min

Masterclass de Depuración de Rendimiento de React

Top Content

Featured Workshop

Ivan Akulov

Los primeros intentos de Ivan en la depuración de rendimiento fueron caóticos. Vería una interacción lenta, intentaría una optimización aleatoria, vería que no ayudaba, y seguiría intentando otras optimizaciones hasta que encontraba la correcta (o se rendía).
En aquel entonces, Ivan no sabía cómo usar bien las herramientas de rendimiento. Haría una grabación en Chrome DevTools o React Profiler, la examinaría, intentaría hacer clic en cosas aleatorias, y luego la cerraría frustrado unos minutos después. Ahora, Ivan sabe exactamente dónde y qué buscar. Y en esta masterclass, Ivan te enseñará eso también.
Así es como va a funcionar. Tomaremos una aplicación lenta → la depuraremos (usando herramientas como Chrome DevTools, React Profiler, y why-did-you-render) → identificaremos el cuello de botella → y luego repetiremos, varias veces más. No hablaremos de las soluciones (en el 90% de los casos, es simplemente el viejo y regular useMemo() o memo()). Pero hablaremos de todo lo que viene antes - y aprenderemos a analizar cualquier problema de rendimiento de React, paso a paso.
(Nota: Esta masterclass es más adecuada para ingenieros que ya están familiarizados con cómo funcionan useMemo() y memo() - pero quieren mejorar en el uso de las herramientas de rendimiento alrededor de React. Además, estaremos cubriendo el rendimiento de la interacción, no la velocidad de carga, por lo que no escucharás una palabra sobre Lighthouse 🤐)

react performance best practices advanced debug react debugger react performance react profiler

Next.js 13: Estrategias de Obtención de Datos

React Day Berlin 2022

53 min

Next.js 13: Estrategias de Obtención de Datos

Top Content

Workshop

Alice De Mauro

- Introducción- Prerrequisitos para la masterclass- Estrategias de obtención: fundamentos- Estrategias de obtención – práctica: API de obtención, caché (estática VS dinámica), revalidar, suspense (obtención de datos en paralelo)- Prueba tu construcción y sírvela en Vercel- Futuro: Componentes de servidor VS Componentes de cliente- Huevo de pascua de la masterclass (no relacionado con el tema, destacando la accesibilidad)- Conclusión

performance next.js best practices react server components

Depuración del Rendimiento de React

React Advanced 2023

148 min

Depuración del Rendimiento de React

Top Content

Workshop

Ivan Akulov

Los primeros intentos de Ivan en la depuración de rendimiento fueron caóticos. Veía una interacción lenta, probaba una optimización aleatoria, veía que no ayudaba, y seguía probando otras optimizaciones hasta que encontraba la correcta (o se rendía).
En aquel entonces, Ivan no sabía cómo usar bien las herramientas de rendimiento. Hacía una grabación en Chrome DevTools o React Profiler, la examinaba, intentaba hacer clic en cosas al azar, y luego la cerraba frustrado unos minutos después. Ahora, Ivan sabe exactamente dónde y qué buscar. Y en esta masterclass, Ivan te enseñará eso también.
Así es como va a funcionar. Tomaremos una aplicación lenta → la depuraremos (usando herramientas como Chrome DevTools, React Profiler, y why-did-you-render) → identificaremos el cuello de botella → y luego repetiremos, varias veces más. No hablaremos de las soluciones (en el 90% de los casos, es simplemente el viejo y regular useMemo() o memo()). Pero hablaremos de todo lo que viene antes - y aprenderemos cómo analizar cualquier problema de rendimiento de React, paso a paso.
(Nota: Esta masterclass es más adecuada para ingenieros que ya están familiarizados con cómo funcionan useMemo() y memo() - pero quieren mejorar en el uso de las herramientas de rendimiento alrededor de React. Además, cubriremos el rendimiento de interacción, no la velocidad de carga, por lo que no escucharás una palabra sobre Lighthouse 🤐)

performance debug optimization

Construyendo aplicaciones web que iluminan Internet con QwikCity

JSNation 2023

170 min

Construyendo aplicaciones web que iluminan Internet con QwikCity

WorkshopFree

Miško Hevery

Construir aplicaciones web instantáneas a gran escala ha sido elusivo. Los sitios del mundo real necesitan seguimiento, análisis y interfaces y interacciones de usuario complejas. Siempre comenzamos con las mejores intenciones pero terminamos con un sitio menos que ideal.
QwikCity es un nuevo meta-framework que te permite construir aplicaciones a gran escala con un rendimiento de inicio constante. Veremos cómo construir una aplicación QwikCity y qué la hace única. El masterclass te mostrará cómo configurar un proyecto QwikCity. Cómo funciona el enrutamiento con el diseño. La aplicación de demostración obtendrá datos y los presentará al usuario en un formulario editable. Y finalmente, cómo se puede utilizar la autenticación. Todas las partes básicas para cualquier aplicación a gran escala.
En el camino, también veremos qué hace que Qwik sea único y cómo la capacidad de reanudación permite un rendimiento de inicio constante sin importar la complejidad de la aplicación.

performance frameworks qwik

Masterclass de alto rendimiento Next.js

React Summit 2022

50 min

Masterclass de alto rendimiento Next.js

Workshop

Michele Riva

Next.js es un marco convincente que facilita muchas tareas al proporcionar muchas soluciones listas para usar. Pero tan pronto como nuestra aplicación necesita escalar, es esencial mantener un alto rendimiento sin comprometer el mantenimiento y los costos del servidor. En este masterclass, veremos cómo analizar el rendimiento de Next.js, el uso de recursos, cómo escalarlo y cómo tomar las decisiones correctas al escribir la arquitectura de la aplicación.

performance next.js best practices architecture

Maximizar el rendimiento de la aplicación optimizando las fuentes web

Vue.js London 2023

49 min

Maximizar el rendimiento de la aplicación optimizando las fuentes web

WorkshopFree

Lazar Nikolov

Acabas de llegar a una página web y tratas de hacer clic en un elemento en particular, pero justo antes de hacerlo, se carga un anuncio encima y terminas haciendo clic en eso en su lugar.
Eso... eso es un cambio de diseño. Todos, tanto los desarrolladores como los usuarios, saben que los cambios de diseño son malos. Y cuanto más tarde ocurran, más interrupciones causarán a los usuarios. En este masterclass vamos a analizar cómo las fuentes web causan cambios de diseño y explorar algunas estrategias para cargar fuentes web sin causar grandes cambios de diseño.
Tabla de contenidos:¿Qué es CLS y cómo se calcula?¿Cómo las fuentes pueden causar CLS?Estrategias de carga de fuentes para minimizar CLSRecapitulación y conclusión

performance optimization