Versión en EspañolES

Descubriendo NodeJS y Kafka: Un Cuento de Transmisión de Eventos

En esta charla relámpago revisaremos algunos principios básicos de los sistemas basados en eventos utilizando NodeJS y Kafka y obtendremos información sobre casos de uso reales críticos donde las configuraciones predeterminadas no son suficientes. Cubriremos consejos rápidos, trucos y buenas prácticas de Kafka con NodeJS utilizando la biblioteca KafkaJS y veremos algo de código real a una velocidad vertiginosa.

This talk has been presented at JSNation 2022, check out the latest edition of this JavaScript Conference.

FAQ

El ponente tiene experiencia en computación distribuida, trabajando con big data y plataformas de streaming, especialmente en el backend con tecnologías como Kafka y Kubernetes.

El ponente vive en los Países Bajos desde hace siete años, habiendo emigrado desde Brasil.

El ponente trabaja para Bitvavo, que es el mayor intercambio de criptomonedas en los Países Bajos, especializándose en el mundo de las criptomonedas.

En la charla se discuten problemas como el manejo de mensajes duplicados, la necesidad de separar servicios y el uso de JSON en eventos sin un contrato definido que puede llevar a errores en el consumo de mensajes.

El ponente sugiere utilizar un patrón de cola de mensajes no entregados y configurar esquemas fuertes para garantizar que los mensajes cumplan con un sistema de tipificación específico, evitando así errores de tipo en el consumo.

Para garantizar la entrega única, el ponente recomienda configurar la idempotencia en el lado del productor y deshabilitar la confirmación automática de desplazamiento en el lado del consumidor, además de ajustar otras configuraciones técnicas en Kafka.

Es necesario tener al menos tres particiones y al menos dos réplicas en sincronización para los temas en Kafka para asegurar el funcionamiento adecuado de las transacciones.

El ponente escribe sobre estas técnicas en su blog personal y también proporciona un archivo docker-compose con múltiples nodos de Kafka para probar los trabajos más avanzados en máquinas locales.

node.js backend

Marcos Maia

8 min

16 Jun, 2022

Comments

Video Summary and Transcription

Esta charla relámpago introduce la computación distribuida y analiza los desafíos, patrones y soluciones relacionados con el uso de Kafka para compartir eventos. Se enfatiza la importancia de separar los servicios y utilizar una tipificación fuerte para evitar mensajes rotos. La charla también cubre la configuración y garantías de transacción de Kafka, destacando la necesidad de una configuración adecuada y el uso de identificadores de transacción. En general, proporciona información valiosa sobre el escalado de empresas, big data y plataformas de transmisión.

Available in English: Getting Real with NodeJS and Kafka: An Event Stream Tale

1. Introducción a la Computación Distribuida y Bitvavo

Short description:

Hola a todos. Esta es una charla relámpago donde hablaré sobre la computación distribuida, el escalado de empresas, big data y plataformas de streaming. Vivo en los Países Bajos y escribo publicaciones técnicas en blogs. Trabajo para Bitvavo, el mayor intercambio de criptomonedas en los Países Bajos, con la misión de brindar la oportunidad de operar con criptomonedas para todos.

Hola a todos. Espero que esto encaje. Tuvimos algunos desafíos técnicos, pero sigamos adelante. Esta es una charla relámpago. Así que seré muy rápido.

Pasé mucho tiempo, mucho más que la charla, pensando en qué puedo decir en este corto tiempo que les ayude al menos a salir de aquí sintiendo que aprendieron algo, o tal vez que les hice pensar en algo. Mi experiencia está en la computación distribuida. Así que suelo trabajar con empresas en escalado y ayudando a los sistemas a escalar realmente. Big data, he trabajado mucho en eso. Plataformas de streaming, es mi pan de cada día desde hace unos siete años. Y actualmente, vivo en los Países Bajos desde hace siete años, viniendo de Brasil. Y escribo publicaciones técnicas en blogs. Actualmente, escribo en este, pero solía escribir en otros tres o cuatro lugares diferentes. Pero puedes encontrar mis artículos más recientes allí, generalmente hablando sobre Kafka, sobre Kubernetes, principalmente en el backend, en mi caso. Trabajo para Bitvavo. Es el mayor intercambio de criptomonedas en los Países Bajos. Así que si te interesa el mundo de las criptomonedas o quieres adentrarte en él, es tan rápido como hacer clic en un botón como ves ahí. Y ese es el objetivo de la empresa. Realmente queremos brindar la oportunidad de operar con criptomonedas para todos. Y eso es lo que estamos haciendo. Esa es nuestra misión.

2. Challenges and Solutions with Kafka Event Sharing

Short description:

En esta sección, discutiré los desafíos, errores comunes, patrones y soluciones relacionados con el uso de Kafka para compartir eventos entre sistemas. Es importante separar los servicios en una plataforma global para evitar depender de las bases de datos. Enviar eventos como JSON puede ser conveniente, pero sin un contrato, los eventos rotos pueden interrumpir el sistema. La cola de eventos de Kafka puede provocar una parada del sistema cuando un mensaje no puede procesarse, lo que resulta en una píldora envenenada.

Entonces, lo que voy a intentar hablar en este corto tiempo, voy a hablar un poco sobre este mundo en el que vivimos. Muchos de nosotros, estoy seguro de que muchos de ustedes, usan Kafka para compartir eventos entre sistemas. Y esto es un requisito, por supuesto, porque en el mundo actual en el que globalizamos nuestras plataformas y aplicaciones, no podemos depender de la base de datos. Así que realmente necesitamos separar nuestros servicios, ¿verdad?

Y voy a hablar sobre algunos desafíos, errores comunes y patrones que usamos, y soluciones para eso. Esta es una arquitectura de servicios normal. Puedes llamarlo microservicios. Realmente depende de dónde estés, cómo lo hagas. No importa. Lo importante aquí es que tienes múltiples bases de datos, múltiples fuentes de datos. Estás integrando cosas a través de Kafka. Y eso es un patrón común, cada vez más. Apuesto a que muchos de ustedes tienen esto.

Y una forma común de hacerlo, y he visto esto especialmente en el mundo de TypeScript y JavaScript, es enviar eventos usando JSON. Eso es muy fácil porque todo es JSON, pero el problema es que realmente no tienes un contrato, ¿verdad? Si envías eventos a un JSON, los productores, el lado de envío, pueden enviar algo que en realidad está roto, o que otros productores pueden enviar, y el consumidor comienza a procesarlo y se rompe. Y la forma en que funciona Kafka es una cola de eventos. Si no puedes procesar un mensaje, no avanza en el procesamiento de esos mensajes. Y de repente te quedas atascado, y todo tu sistema se detiene porque tienes lo que llamamos una píldora envenenada.

3. Evitando mensajes rotos con la cola de mensajes no entregados

Short description:

Para evitar mensajes rotos, aplica un patrón llamado cola de mensajes no entregados y utiliza una tipificación fuerte. Asegúrate de que el tipo de mensaje sea correcto en el lado del productor para evitar problemas en el consumidor. Implementa un enfoque de cola de mensajes no entregados para manejar mensajes rotos y utiliza la confirmación manual de desplazamiento.

Entonces, ¿cómo evitas eso? En realidad, es bastante simple. Aplicas un patrón llamado cola de mensajes no entregados y utilizas otros esquemas para definir realmente un esquema. Así que es un tipo fuerte.

Ahora tus mensajes deben cumplir en el lado del productor con un sistema de tipificación específico. Así que garantizas que el tipo no se va a equivocar para ese tema específico, y luego tus consumidores no se romperán para ese caso. Y puedes utilizar un enfoque de cola de mensajes no entregados que si comienzas a consumir un mensaje y está roto, en lugar de entrar en ese ciclo para siempre, intentas un par de veces, si no funciona, lo envías a una cola diferente, y pasas al siguiente mensaje. Y para eso es posible que necesites utilizar la confirmación manual de desplazamiento y voy a explicar eso y mostrar algo porque aquí hay un temporizador. Es realmente aterrador. Tengo que ir rápido.

4. Configuración y garantías de transacciones de Kafka

Short description:

Kafka ofrece una semántica de exactamente una vez y límites de transacción para procesar mensajes en una sola transacción. Para garantizar la integridad del mensaje, configura Kafka para establecer la idempotencia en verdadero en el lado del productor y deshabilitar la confirmación automática del desplazamiento en el lado del consumidor. Utiliza un ID de transacción para establecer límites y garantizar la atomicidad. Ten en cuenta que las transacciones de Kafka no son transacciones distribuidas como las transacciones XA. La configuración adecuada de las particiones del clúster y las réplicas en sincronización es crucial. Inicia, envía y confirma transacciones para garantizar el procesamiento del mensaje o la reversión. Para obtener más información, consulta la publicación del blog y prueba el archivo docker-compose proporcionado con múltiples nodos de Kafka para experimentación local.

Entonces, piensa en este productor y consumidor estándar, si simplemente usas Kafka.js o cualquier cliente que decidas usar. Los productores normales y los consumidores normales no tienen garantías sólidas. Lo que quiero decir con eso es que no te garantiza que vayas a enviar un solo mensaje en el lado del productor, podría haber duplicados. Es lo que llamamos al menos una vez. Esa es la garantía, lo que significa que puedes tener duplicados. Y en algunos sistemas, no puedes hacer eso. Si estás depositando dinero, no deberías hacer eso. Especialmente al retirar dinero de un cliente, no deberías hacer eso. Y en el lado del cliente, también puedes tener procesamiento duplicado. Esos son los valores predeterminados que obtienes si los usas. Hay soluciones para eso.

Entonces, Kafka ofrece una semántica de exactamente una vez. Eso es lo que significa EOS. Y límites de transacción. Y es muy común que tengas un patrón como ese, en el que tienes un procesador, un mensaje que se inicia como un proceso, quieres consumir el mensaje, hacer algún procesamiento y producir el mensaje en otro tema en una sola transacción. Por lo tanto, quieres asegurarte de que cuando consumas, hagas el procesamiento, algo salga mal. Si vuelves a procesar o reinicias tu sistema, procesas ese mensaje nuevamente, porque no finalizaste esos tres pasos, que es enviar ese mensaje al siguiente paso. Y para esto, debes hacer alguna configuración en Kafka.

Desde el lado del productor, debes establecer la idempotencia en verdadero. Eso garantiza que no se duplique y se envíe. Y en el lado del consumidor, debes deshabilitar la confirmación automática del desplazamiento, lo que significa que tu cliente lee el mensaje, pero ahora tienes el control. Cuando quieras decirle a Kafka que realmente procesaste este mensaje, confirmas el desplazamiento. Y también quieres establecer una propiedad llamada max in-flight request en uno, para que no haya procesamiento paralelo y puedas mantener las garantías de ordenamiento. Y en el lado del productor, en el último paso, recuerda, es consumir y luego producir, y quieres que todo esto esté en la misma transacción. Lo que quieres establecer es un ID de transacción, para que el broker pueda establecer los límites de transacción y decir que el punto es verdadero también. Y lo que esto garantiza es que cuando consumes, procesas y envías, es parte de una única transacción atómica. El cliente de Kafka, esto no es una transacción distribuida, como una transacción XA. No está garantizado que si haces una llamada a la base de datos en el lado que se revierta. Debes encargarte de eso. Está en los límites de Kafka. Es lo mismo que tu transacción normal de base de datos entre dos tablas a las que estás acostumbrado, así que ten eso en cuenta.

Algunas configuraciones del clúster, y también he terminado porque mi reloj ya está parpadeando. Debes tener al menos tres particiones y al menos dos réplicas en sincronización para tus temas para que esto funcione. Por lo tanto, si lo intentas localmente y no lo tienes, no funcionará, y también debes iniciar la transacción como puedes ver, iniciar una transacción, enviar un mensaje, enviar los desplazamientos y luego confirmar las transacciones, lo que significa que todo va a suceder o se revertirá. Y eso es básicamente lo que quieres hacer, y es realmente importante tener eso en cuenta. Eso es todo. Si quieres saber más sobre esto, escribo en esta publicación de blog específica sobre esto, y también tengo un archivo docker-compose donde tengo múltiples nodos de Kafka donde puedes probar este tipo de trabajo más avanzado en tu máquina local. Muchas gracias.

Available in other languages:

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Es una jungla ahí fuera: ¿Qué está pasando realmente dentro de tu carpeta Node_Modules?

Node Congress 2022

26 min

Es una jungla ahí fuera: ¿Qué está pasando realmente dentro de tu carpeta Node_Modules?

Top Content

Feross Aboukhadijeh

Feross is the author and maintainer of WebTorrent, StandardJS, and 100s of other open source projects

The talk discusses the importance of supply chain security in the open source ecosystem, highlighting the risks of relying on open source code without proper code review. It explores the trend of supply chain attacks and the need for a new approach to detect and block malicious dependencies. The talk also introduces Socket, a tool that assesses the security of packages and provides automation and analysis to protect against malware and supply chain attacks. It emphasizes the need to prioritize security in software development and offers insights into potential solutions such as realms and Deno's command line flags.

node.js security

Cargadores ESM: Mejorando la carga de módulos en Node.js

JSNation 2023

22 min

Cargadores ESM: Mejorando la carga de módulos en Node.js

Top Content

Gil Tayar

Microsoft, Israel

ESM Loaders enhance module loading in Node.js by resolving URLs and reading files from the disk. Module loaders can override modules and change how they are found. Enhancing the loading phase involves loading directly from HTTP and loading TypeScript code without building it. The loader in the module URL handles URL resolution and uses fetch to fetch the source code. Loaders can be chained together to load from different sources, transform source code, and resolve URLs differently. The future of module loading enhancements is promising and simple to use.

node.js

Hacia una Biblioteca Estándar para Runtimes de JavaScript

Node Congress 2022

34 min

Hacia una Biblioteca Estándar para Runtimes de JavaScript

Top Content

James Snell

Workers team @Cloudflare

There is a need for a standard library of APIs for JavaScript runtimes, as there are currently multiple ways to perform fundamental tasks like base64 encoding. JavaScript runtimes have historically lacked a standard library, causing friction and difficulty for developers. The idea of a small core has both benefits and drawbacks, with some runtimes abusing it to limit innovation. There is a misalignment between Node and web browsers in terms of functionality and API standards. The proposal is to involve browser developers in conversations about API standardization and to create a common standard library for JavaScript runtimes.

javascript component library node.js

Diagnostics de Node.js listos para usar

Node Congress 2022

34 min

Diagnostics de Node.js listos para usar

Colin Ihrig

Member of the Node.js Technical Steering Committee

This talk covers various techniques for getting diagnostics information out of Node.js, including debugging with environment variables, handling warnings and deprecations, tracing uncaught exceptions and process exit, using the v8 inspector and dev tools, and generating diagnostic reports. The speaker also mentions areas for improvement in Node.js diagnostics and provides resources for learning and contributing. Additionally, the responsibilities of the Technical Steering Committee in the TS community are discussed.

node.js

El Estado de Node.js 2025

JSNation 2025

30 min

El Estado de Node.js 2025

Matteo Collina

Node.js TSC committee member. Pino & Fastify author.

The speaker covers a wide range of topics related to Node.js, including its resilience, popularity, and significance in the tech ecosystem. They discuss Node.js version support, organization activity, development updates, enhancements, and security updates. Node.js relies heavily on volunteers for governance and contribution. The speaker introduces an application server for Node.js enabling PHP integration. Insights are shared on Node.js downloads, infrastructure challenges, software maintenance, and the importance of update schedules for security.

node.js

Compatibilidad con Node.js en Deno

Node Congress 2022

34 min

Compatibilidad con Node.js en Deno

Bartek Iwanczuk

Deno core team member

Deno aims to provide Node.js compatibility to make migration smoother and easier. While Deno can run apps and libraries offered for Node.js, not all are supported yet. There are trade-offs to consider, such as incompatible APIs and a less ideal developer experience. Deno is working on improving compatibility and the transition process. Efforts include porting Node.js modules, exploring a superset approach, and transparent package installation from npm.

node.js deno js runtimes

Workshops on related topic

Construyendo un Sistema RAG en Node.js: Bases de Datos Vectoriales, Embeddings y Chunking

Node Congress 2025

98 min

Construyendo un Sistema RAG en Node.js: Bases de Datos Vectoriales, Embeddings y Chunking

Featured Workshop

2 authors

Los Modelos de Lenguaje Grande (LLMs) son poderosos, pero a menudo carecen de conocimiento en tiempo real. La Generación Aumentada por Recuperación (RAG) cierra esta brecha al obtener información relevante de fuentes externas antes de generar respuestas. En esta masterclass, exploraremos cómo construir un pipeline RAG eficiente en Node.js utilizando feeds RSS como fuente de datos. Compararemos diferentes bases de datos vectoriales (FAISS, pgvector, Elasticsearch), métodos de embedding y estrategias de prueba. También cubriremos el papel crucial del chunking: dividir y estructurar datos de manera efectiva para un mejor rendimiento de recuperación.Requisitos Previos- Buen entendimiento de JavaScript o TypeScript- Experiencia con Node.js y desarrollo de API- Conocimientos básicos de bases de datos y LLMs son útiles pero no requeridos
Agenda📢 Introducción a RAG💻 Demo - Aplicación de Ejemplo (RAG con Feeds RSS)📕 Bases de Datos Vectoriales (FAISS, pgvector, Elasticsearch) y Embeddings🛠️ Estrategias de Chunking para Mejor Recuperación🔬 Pruebas y Evaluación de Pipelines RAG (Precisión, Recall, Rendimiento)🏊‍♀️ Consideraciones de Rendimiento y Optimización🥟 Resumen y Preguntas y Respuestas

node.js database

Masterclass de Node.js

Node Congress 2023

109 min

Masterclass de Node.js

Top Content

Workshop

Matteo Collina

¿Alguna vez has tenido dificultades para diseñar y estructurar tus aplicaciones Node.js? Construir aplicaciones que estén bien organizadas, sean probables y extensibles no siempre es fácil. A menudo puede resultar ser mucho más complicado de lo que esperas. En este evento en vivo, Matteo te mostrará cómo construye aplicaciones Node.js desde cero. Aprenderás cómo aborda el diseño de aplicaciones y las filosofías que aplica para crear aplicaciones modulares, mantenibles y efectivas.

Nivel: intermedio

node.js

Construir y Desplegar un Backend Con Fastify & Platformatic

JSNation 2023

104 min

Construir y Desplegar un Backend Con Fastify & Platformatic

Top Content

WorkshopFree

Matteo Collina

Platformatic te permite desarrollar rápidamente GraphQL y REST APIs con un esfuerzo mínimo. La mejor parte es que también te permite desatar todo el potencial de Node.js y Fastify siempre que lo necesites. Puedes personalizar completamente una aplicación de Platformatic escribiendo tus propias características y plugins adicionales. En la masterclass, cubriremos tanto nuestros módulos de Open Source como nuestra oferta en la Nube:- Platformatic OSS (open-source software) — Herramientas y bibliotecas para construir rápidamente aplicaciones robustas con Node.js (https://oss.platformatic.dev/).- Platformatic Cloud (actualmente en beta) — Nuestra plataforma de alojamiento que incluye características como aplicaciones de vista previa, métricas integradas e integración con tu flujo de Git (https://platformatic.dev/).
En esta masterclass aprenderás cómo desarrollar APIs con Fastify y desplegarlas en la Platformatic Cloud.

cloud graphql node.js fastify

Construyendo un Servidor Web Hiper Rápido con Deno

JSNation Live 2021

156 min

Construyendo un Servidor Web Hiper Rápido con Deno

Workshop

2 authors

Deno 1.9 introdujo una nueva API de servidor web que aprovecha Hyper, una implementación rápida y correcta de HTTP para Rust. El uso de esta API en lugar de la implementación std/http aumenta el rendimiento y proporciona soporte para HTTP2. En este masterclass, aprende cómo crear un servidor web utilizando Hyper en el fondo y mejorar el rendimiento de tus aplicaciones web.

node.js backend deno

0 a Auth en una Hora Usando NodeJS SDK

Node Congress 2023

63 min

0 a Auth en una Hora Usando NodeJS SDK

WorkshopFree

Asaf Shen

La autenticación sin contraseña puede parecer compleja, pero es fácil de agregar a cualquier aplicación utilizando la herramienta adecuada.
Mejoraremos una aplicación JS de pila completa (backend de Node.JS + frontend de React) para autenticar usuarios con OAuth (inicio de sesión social) y contraseñas de un solo uso (correo electrónico), incluyendo:- Autenticación de usuario - Administrar interacciones de usuario, devolver JWT de sesión / actualización- Gestión y validación de sesiones - Almacenar la sesión para solicitudes de cliente posteriores, validar / actualizar sesiones
Al final del masterclass, también tocaremos otro enfoque para la autenticación de código utilizando Flujos Descope en el frontend (flujos de arrastrar y soltar), manteniendo solo la validación de sesión en el backend. Con esto, también mostraremos lo fácil que es habilitar la biometría y otros métodos de autenticación sin contraseña.
Tabla de contenidos- Una breve introducción a los conceptos básicos de autenticación- Codificación- Por qué importa la autenticación sin contraseña
Requisitos previos- IDE de tu elección- Node 18 o superior

javascript node.js authentication

GraphQL: De Cero a Héroe en 3 horas

React Summit 2022

164 min

GraphQL: De Cero a Héroe en 3 horas

Workshop

Pawel Sawicki

Cómo construir una aplicación GraphQL fullstack (Postgres + NestJs + React) en el menor tiempo posible.
Todos los comienzos son difíciles. Incluso más difícil que elegir la tecnología es desarrollar una arquitectura adecuada. Especialmente cuando se trata de GraphQL.
En este masterclass, obtendrás una variedad de mejores prácticas que normalmente tendrías que trabajar en varios proyectos, todo en solo tres horas.
Siempre has querido participar en un hackathon para poner algo en funcionamiento en el menor tiempo posible, entonces participa activamente en este masterclass y únete a los procesos de pensamiento del instructor.

graphql web development node.js beginner friendly