¿Qué hay en un bug de Node.js – Un estudio de caso

Bookmark
Rate this content

Anna realiza un análisis profundo de la anatomía de una regresión que afectó a los usuarios de Node.js en desarrollo y producción en el último año, y analiza cómo nos da una visión de cómo funcionan los motores de JS bajo el capó y cómo se está desarrollando actualmente Node.js.

This talk has been presented at Node Congress 2025, check out the latest edition of this JavaScript Conference.

Anna Henningsen
Anna Henningsen
23 min
17 Apr, 2025

Comments

Sign in or register to post your comment.
Video Summary and Transcription
Voy a hablar sobre codificaciones de caracteres, específicamente un bug de Node.js relacionado con UTF-8. Dos codificaciones populares son UTF8 y UTF16. El bug fue descubierto en agosto de 2024 y se rastreó hasta una solicitud de extracción específica en el repositorio principal de Node.js. El bug es causado por una implementación incorrecta del método de escritura rápida de cadenas. Las lecciones aprendidas incluyen la importancia de las convenciones de nomenclatura y pruebas exhaustivas más allá del análisis de cobertura.

1. Introducción a las Codificaciones de Caracteres

Short description:

Voy a hablar sobre un error de Node.js. Soy Anna, ingeniera de personal en MongoDB y excontribuyente del núcleo de Node.js. Me apasiona la codificación de caracteres. Hablemos sobre qué son las codificaciones de caracteres. Las codificaciones de caracteres son conversiones en las que todos están de acuerdo para comunicarse con el mundo exterior. Las primeras codificaciones de caracteres estandarizadas incluyen ASCII e ISA88591. Unicode apareció para representar más caracteres asignando un número a cada carácter y luego asignando una secuencia de bytes a ese número.

Sí, hola a todos, y gracias por unirse a esta charla. Así que, voy a hablar sobre un error de Node.js.

Una rápida introducción sobre mí. Así que, hola, soy Anna. Actualmente soy ingeniera de personal en MongoDB trabajando en las suites de herramientas para desarrolladores. Si alguna vez has usado MongoDB, estoy segura de que muchos de ustedes lo han hecho en algún momento. Estoy trabajando en un par de cosas más. También soy excontribuyente del núcleo de Node.js, he estado bastante activa en el pasado, y soy miembro del comité de dirección técnica en ese lado. Estoy muy, muy apasionada por la codificación de caracteres. He dado charlas sobre ese tema antes. Sé que puede parecer un poco aburrido a veces, o no como si, ya sabes, no es como tecnología de vanguardia, pero sigue siendo algo que creo que siempre genera conversaciones interesantes. Así que, así es como puedes contactarme. También subí las diapositivas en este enlace aquí, si quieres buscarlas en algún momento más tarde.

Así que, sí, antes de que realmente hablemos sobre el error de Node.js al que me refería, hagamos un rápido repaso sobre qué son realmente las codificaciones de caracteres específicamente. Así que, como en una aplicación típica, tienes tu código que ejecutas. Ese es un programa separado. Y de alguna manera se comunica con un sistema operativo o núcleo, que, ya sabes, se encarga de comunicarse con el mundo exterior para tu aplicación. Y la forma en que hemos construido el software resulta ser que este sistema operativo o núcleo principalmente, ya sabes, recibe y envía información en forma de secuencias de bytes. Pero tu aplicación típicamente trabaja con la lógica de secuencias de caracteres, que generalmente se llaman cadenas. Y así, para poder trabajar con cadenas dentro de tu aplicación, necesitas tener algún tipo de conversión en la que todos estén de acuerdo para comunicarse con el mundo exterior. Y esas conversiones se llaman codificaciones de caracteres.

Y así, como algunas de las primeras codificaciones de caracteres estandarizadas, todos conocen ASCII, estoy segura de que era una forma de codificar la mayoría de los caracteres del idioma inglés, sigue siéndolo. Y pero eso significa que hay caracteres que no puedes representar. Y luego, con el tiempo, obviamente, ya sabes, la gente reconoce la necesidad de poder representar otros caracteres. Así que, una de las más populares que también es especial por razones históricas es esta ISA88591, que al menos cubre muchos caracteres de Europa Central. Pero, obviamente, eso, ya sabes, también alcanza sus límites. Quieres poder representar caracteres chinos, vas a tener que idear algo nuevo donde no puedes representar cada carácter con un solo byte. Y así, Unicode apareció y esto comenzó a ser realmente popular a finales de los 90, principios de los 2000. Y eso esencialmente convirtió este proceso en un proceso de dos pasos donde a cada carácter que deseas poder representar, le asignas un número. Y luego a ese número, le asignas una secuencia de bytes.

2. Codificaciones de Caracteres en JavaScript

Short description:

Dos codificaciones de caracteres populares relevantes hoy en día son UTF8, que es compatible hacia atrás con ASCII y hace algo especial para las secuencias de bytes fuera del rango ASCII, y UTF16, que no es compatible con ASCII. Los motores de JavaScript tienen diferentes representaciones para cadenas, algunas de las cuales se concatenan y se representan internamente como múltiples cadenas. Los motores de JavaScript son inteligentes sobre cómo representan las cadenas internamente.

Y así, dos de los más populares y los que son particularmente relevantes para esta conversación hoy son UTF8, que es como, ya sabes, compatible hacia atrás con ASCII en lo que respecta a las secuencias de bytes. Simplemente comienza a hacer algo especial para las secuencias de bytes que están fuera del rango ASCII. Y UTF16, que es una forma que no es compatible con ASCII en absoluto. Pero si miras esto con más detalle, puedes ver que todavía hay algunas representaciones compartidas de caracteres y algunas, ya sabes, una historia compartida cuando se trata de cómo se representan exactamente las cadenas.

Y así, creo que la mayoría de ustedes como desarrolladores de JavaScript habrán escuchado la, ya saben, afirmación de que JavaScript usa UTF16, ¿verdad? Así es como funcionan las cadenas en JavaScript. Y eso es como, eso no es del todo incorrecto, pero tampoco es cierto. Y así, si miramos el código fuente del motor de JavaScript que usa Node.js y que usa Google Chrome, y muchas aplicaciones de JavaScript utilizan hoy en día, podemos mirar el código fuente de los podemos buscar todas las cadenas que esta implementación define, y podemos ver que en realidad hay muchas representaciones muy diferentes para las cadenas. Y hay dos que son particularmente dignas de destacar, que te mostraré en un segundo.

Así que, si quieres inspeccionar, por ejemplo, cómo V8 representa internamente esta cadena aquí que estoy construyendo, es como una concatenación y luego una repetición y un substring de eso. En realidad hay una forma de hacer eso. Necesitas exponer los internos de V8 para eso. Así que, esto no es algo que podrías hacer en una aplicación de producción. Pero hay este ayudante de impresión de depuración que V8 proporciona y necesitas pasar una bandera especial para habilitarlo. Y en realidad puedes mirar, como, ya sabes, hey, ¿qué contiene esta cadena? Y así, por ejemplo, para esta, va a decir que es un tipo de cadena const, lo que significa que está concatenada. En realidad se representa internamente como la concatenación de dos cadenas, no como una sola secuencia en memoria. Y así, si descomponemos esto, podemos ver que, como, sí, es una concatenación de una cadena de un byte o una cadena de un byte es lo que V8 llama. Y una cadena deslizante, que se representa por cadenas de dos bytes. Y entraremos un poco en por qué eso es un mal nombre. Pero el punto que estoy tratando de hacer aquí es que los motores de JavaScript van a ser inteligentes sobre cómo representan internamente las cadenas.

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Es una jungla ahí fuera: ¿Qué está pasando realmente dentro de tu carpeta Node_Modules?
Node Congress 2022Node Congress 2022
26 min
Es una jungla ahí fuera: ¿Qué está pasando realmente dentro de tu carpeta Node_Modules?
Top Content
The talk discusses the importance of supply chain security in the open source ecosystem, highlighting the risks of relying on open source code without proper code review. It explores the trend of supply chain attacks and the need for a new approach to detect and block malicious dependencies. The talk also introduces Socket, a tool that assesses the security of packages and provides automation and analysis to protect against malware and supply chain attacks. It emphasizes the need to prioritize security in software development and offers insights into potential solutions such as realms and Deno's command line flags.
Cargadores ESM: Mejorando la carga de módulos en Node.js
JSNation 2023JSNation 2023
22 min
Cargadores ESM: Mejorando la carga de módulos en Node.js
Top Content
ESM Loaders enhance module loading in Node.js by resolving URLs and reading files from the disk. Module loaders can override modules and change how they are found. Enhancing the loading phase involves loading directly from HTTP and loading TypeScript code without building it. The loader in the module URL handles URL resolution and uses fetch to fetch the source code. Loaders can be chained together to load from different sources, transform source code, and resolve URLs differently. The future of module loading enhancements is promising and simple to use.
Hacia una Biblioteca Estándar para Runtimes de JavaScript
Node Congress 2022Node Congress 2022
34 min
Hacia una Biblioteca Estándar para Runtimes de JavaScript
Top Content
There is a need for a standard library of APIs for JavaScript runtimes, as there are currently multiple ways to perform fundamental tasks like base64 encoding. JavaScript runtimes have historically lacked a standard library, causing friction and difficulty for developers. The idea of a small core has both benefits and drawbacks, with some runtimes abusing it to limit innovation. There is a misalignment between Node and web browsers in terms of functionality and API standards. The proposal is to involve browser developers in conversations about API standardization and to create a common standard library for JavaScript runtimes.
Diagnostics de Node.js listos para usar
Node Congress 2022Node Congress 2022
34 min
Diagnostics de Node.js listos para usar
This talk covers various techniques for getting diagnostics information out of Node.js, including debugging with environment variables, handling warnings and deprecations, tracing uncaught exceptions and process exit, using the v8 inspector and dev tools, and generating diagnostic reports. The speaker also mentions areas for improvement in Node.js diagnostics and provides resources for learning and contributing. Additionally, the responsibilities of the Technical Steering Committee in the TS community are discussed.
El Estado de Node.js 2025
JSNation 2025JSNation 2025
30 min
El Estado de Node.js 2025
The speaker covers a wide range of topics related to Node.js, including its resilience, popularity, and significance in the tech ecosystem. They discuss Node.js version support, organization activity, development updates, enhancements, and security updates. Node.js relies heavily on volunteers for governance and contribution. The speaker introduces an application server for Node.js enabling PHP integration. Insights are shared on Node.js downloads, infrastructure challenges, software maintenance, and the importance of update schedules for security.
Compatibilidad con Node.js en Deno
Node Congress 2022Node Congress 2022
34 min
Compatibilidad con Node.js en Deno
Deno aims to provide Node.js compatibility to make migration smoother and easier. While Deno can run apps and libraries offered for Node.js, not all are supported yet. There are trade-offs to consider, such as incompatible APIs and a less ideal developer experience. Deno is working on improving compatibility and the transition process. Efforts include porting Node.js modules, exploring a superset approach, and transparent package installation from npm.

Workshops on related topic

Construyendo un Sistema RAG en Node.js: Bases de Datos Vectoriales, Embeddings y Chunking
Node Congress 2025Node Congress 2025
98 min
Construyendo un Sistema RAG en Node.js: Bases de Datos Vectoriales, Embeddings y Chunking
Featured Workshop
Alex Korzhikov
Pavlik Kiselev
2 authors
Los Modelos de Lenguaje Grande (LLMs) son poderosos, pero a menudo carecen de conocimiento en tiempo real. La Generación Aumentada por Recuperación (RAG) cierra esta brecha al obtener información relevante de fuentes externas antes de generar respuestas. En esta masterclass, exploraremos cómo construir un pipeline RAG eficiente en Node.js utilizando feeds RSS como fuente de datos. Compararemos diferentes bases de datos vectoriales (FAISS, pgvector, Elasticsearch), métodos de embedding y estrategias de prueba. También cubriremos el papel crucial del chunking: dividir y estructurar datos de manera efectiva para un mejor rendimiento de recuperación.Requisitos Previos- Buen entendimiento de JavaScript o TypeScript- Experiencia con Node.js y desarrollo de API- Conocimientos básicos de bases de datos y LLMs son útiles pero no requeridos
Agenda📢 Introducción a RAG💻 Demo - Aplicación de Ejemplo (RAG con Feeds RSS)📕 Bases de Datos Vectoriales (FAISS, pgvector, Elasticsearch) y Embeddings🛠️ Estrategias de Chunking para Mejor Recuperación🔬 Pruebas y Evaluación de Pipelines RAG (Precisión, Recall, Rendimiento)🏊‍♀️ Consideraciones de Rendimiento y Optimización🥟 Resumen y Preguntas y Respuestas
Masterclass de Node.js
Node Congress 2023Node Congress 2023
109 min
Masterclass de Node.js
Top Content
Workshop
Matteo Collina
Matteo Collina
¿Alguna vez has tenido dificultades para diseñar y estructurar tus aplicaciones Node.js? Construir aplicaciones que estén bien organizadas, sean probables y extensibles no siempre es fácil. A menudo puede resultar ser mucho más complicado de lo que esperas. En este evento en vivo, Matteo te mostrará cómo construye aplicaciones Node.js desde cero. Aprenderás cómo aborda el diseño de aplicaciones y las filosofías que aplica para crear aplicaciones modulares, mantenibles y efectivas.

Nivel: intermedio
Construir y Desplegar un Backend Con Fastify & Platformatic
JSNation 2023JSNation 2023
104 min
Construir y Desplegar un Backend Con Fastify & Platformatic
Top Content
WorkshopFree
Matteo Collina
Matteo Collina
Platformatic te permite desarrollar rápidamente GraphQL y REST APIs con un esfuerzo mínimo. La mejor parte es que también te permite desatar todo el potencial de Node.js y Fastify siempre que lo necesites. Puedes personalizar completamente una aplicación de Platformatic escribiendo tus propias características y plugins adicionales. En la masterclass, cubriremos tanto nuestros módulos de Open Source como nuestra oferta en la Nube:- Platformatic OSS (open-source software) — Herramientas y bibliotecas para construir rápidamente aplicaciones robustas con Node.js (https://oss.platformatic.dev/).- Platformatic Cloud (actualmente en beta) — Nuestra plataforma de alojamiento que incluye características como aplicaciones de vista previa, métricas integradas e integración con tu flujo de Git (https://platformatic.dev/). 
En esta masterclass aprenderás cómo desarrollar APIs con Fastify y desplegarlas en la Platformatic Cloud.
Construyendo un Servidor Web Hiper Rápido con Deno
JSNation Live 2021JSNation Live 2021
156 min
Construyendo un Servidor Web Hiper Rápido con Deno
Workshop
Matt Landers
Will Johnston
2 authors
Deno 1.9 introdujo una nueva API de servidor web que aprovecha Hyper, una implementación rápida y correcta de HTTP para Rust. El uso de esta API en lugar de la implementación std/http aumenta el rendimiento y proporciona soporte para HTTP2. En este masterclass, aprende cómo crear un servidor web utilizando Hyper en el fondo y mejorar el rendimiento de tus aplicaciones web.
0 a Auth en una Hora Usando NodeJS SDK
Node Congress 2023Node Congress 2023
63 min
0 a Auth en una Hora Usando NodeJS SDK
WorkshopFree
Asaf Shen
Asaf Shen
La autenticación sin contraseña puede parecer compleja, pero es fácil de agregar a cualquier aplicación utilizando la herramienta adecuada.
Mejoraremos una aplicación JS de pila completa (backend de Node.JS + frontend de React) para autenticar usuarios con OAuth (inicio de sesión social) y contraseñas de un solo uso (correo electrónico), incluyendo:- Autenticación de usuario - Administrar interacciones de usuario, devolver JWT de sesión / actualización- Gestión y validación de sesiones - Almacenar la sesión para solicitudes de cliente posteriores, validar / actualizar sesiones
Al final del masterclass, también tocaremos otro enfoque para la autenticación de código utilizando Flujos Descope en el frontend (flujos de arrastrar y soltar), manteniendo solo la validación de sesión en el backend. Con esto, también mostraremos lo fácil que es habilitar la biometría y otros métodos de autenticación sin contraseña.
Tabla de contenidos- Una breve introducción a los conceptos básicos de autenticación- Codificación- Por qué importa la autenticación sin contraseña
Requisitos previos- IDE de tu elección- Node 18 o superior
GraphQL: De Cero a Héroe en 3 horas
React Summit 2022React Summit 2022
164 min
GraphQL: De Cero a Héroe en 3 horas
Workshop
Pawel Sawicki
Pawel Sawicki
Cómo construir una aplicación GraphQL fullstack (Postgres + NestJs + React) en el menor tiempo posible.
Todos los comienzos son difíciles. Incluso más difícil que elegir la tecnología es desarrollar una arquitectura adecuada. Especialmente cuando se trata de GraphQL.
En este masterclass, obtendrás una variedad de mejores prácticas que normalmente tendrías que trabajar en varios proyectos, todo en solo tres horas.
Siempre has querido participar en un hackathon para poner algo en funcionamiento en el menor tiempo posible, entonces participa activamente en este masterclass y únete a los procesos de pensamiento del instructor.