Suscripciones de GraphQL con Debezium y Kafka

Rate this content
Bookmark
Reaccionar a los cambios de datos y publicar esos cambios como eventos de GraphQL con suscripciones puede ser difícil, especialmente en un entorno de múltiples servicios con múltiples bases de datos o al escalar su servidor de GraphQL con múltiples instancias. Los clientes de GraphQL no deben perder eventos ni recibirlos dos veces, sin importar cómo sea su arquitectura backend o qué problemas (caída del servicio, pérdida de conexión a la base de datos, ...) puedan tener al atender una solicitud de suscripción.

En esta charla, te mostraré cómo Debezium y Apache Kafka pueden ayudarte a construir suscripciones confiables a partir de cambios en tu base de datos. Debezium es una herramienta de captura de datos de cambio (CDC) que puede enviar cambios desde el registro de transacciones de una base de datos al broker de mensajes Kafka.

En mi charla, utilizaré un backend de GraphQL implementado en Java con "Spring for GraphQL", pero como Debezium y Kafka no están limitados a Java, la idea también es utilizable con otros frameworks y lenguajes de programación de GraphQL. No es necesario tener conocimientos de Java o Spring for GraphQL para entender la charla.

This talk has been presented at GraphQL Galaxy 2022, check out the latest edition of this Tech Conference.

FAQ

La combinación de GraphQL con Kafka y Debezium resuelve el problema de mantener sincronizadas múltiples instancias de un servicio al compartir información sobre cambios en la base de datos, como inserciones, actualizaciones y eliminaciones, asegurando que todos los clientes suscritos reciban las actualizaciones pertinentes en tiempo real.

En esta arquitectura, cuando una instancia del servicio realiza una mutación en la base de datos, Debezium captura ese cambio y publica un evento en Apache Kafka. Las otras instancias del servicio, al estar suscritas a Kafka, reciben este evento, lo que les permite enviar datos de suscripción pertinentes a sus clientes conectados.

Debezium es una herramienta de captura de datos de cambio (CDC) que monitorea las bases de datos y registra los cambios realizados en ellas, como inserciones, actualizaciones y eliminaciones. En este contexto, Debezium publica eventos de cambio en Kafka para que ambas instancias del servicio puedan reaccionar a estos cambios y actualizar a los clientes suscritos de manera oportuna.

Apache Kafka actúa como un broker de mensajes centralizado que facilita la comunicación entre diferentes partes de la aplicación. Recibe y almacena los eventos de cambios de Debezium y permite que varias instancias del servicio accedan a esa información de manera eficiente y en tiempo real, garantizando que todos los suscriptores estén informados de los cambios relevantes.

Debezium, junto con Apache Kafka, ofrece garantías de entrega robustas, asegurando que cualquier cambio en la base de datos se publique y se reciba correctamente, independientemente de la causa del cambio. Esto es crucial para mantener la integridad de los datos y la consistencia entre los usuarios que dependen de suscripciones en tiempo real.

Las suscripciones de GraphQL se benefician de esta arquitectura al recibir actualizaciones en tiempo real sobre los datos que les interesan. Gracias a Kafka y Debezium, los cambios en la base de datos se propagan rápidamente a todas las instancias del servicio, lo que permite que las APIs de GraphQL notifiquen a los clientes suscritos sin demoras, mejorando la experiencia del usuario y la reactividad de la aplicación.

Nils Hartmann
Nils Hartmann
7 min
08 Dec, 2022

Comments

Sign in or register to post your comment.
Video Summary and Transcription
Esta charla relámpago explora el uso de suscripciones de GraphQL con Kafka y Debezium. Al agregar un broker de mensajes como Apache Kafka y una herramienta de captura de datos de cambio como Debezium a la implementación, se pueden resolver problemas con múltiples instancias de servicio y escrituras en la base de datos. Debezium recoge los cambios directamente de la base de datos y envía mensajes de eventos de CDC al broker de mensajes conectado, asegurando que cualquier cambio en la base de datos se publique en Kafka y se reciba por la instancia de servicio. Esta pila tecnológica también se puede utilizar para consultas mediante la construcción de una base de datos de modelo de lectura dedicada para la API de GraphQL.

1. GraphQL Subscriptions with Kafka and Debezium

Short description:

Bienvenidos a mi charla relámpago sobre suscripciones de GraphQL con Kafka y Debezium. Tenemos tres clientes y un servicio que proporciona una API de GraphQL. Cuando el cliente uno agrega un nuevo cliente, el servicio puede enviar eventos a los clientes dos y tres. Sin embargo, puede haber problemas cuando hay múltiples instancias del servicio o al escribir datos en una base de datos. Para resolver estos problemas, podemos agregar un mensaje broker como Apache Kafka y una herramienta de captura de datos de cambio como Debezium a nuestra implementación.

Hola y bienvenidos a mi charla relámpago sobre suscripciones de GraphQL con Kafka y Debezium. Mi nombre es Nils y soy un desarrollador de software freelance de Hamburgo, Alemania.

Echemos un vistazo a esta imagen aquí. Tenemos tres clientes y tenemos un servicio que proporciona una API de GraphQL. El cliente número dos y el cliente número tres envían suscripciones al servicio para recibir información sobre nuevos clientes. Cuando el cliente número uno envía una mutación para agregar un nuevo cliente, nuestro servicio y nuestra API de GraphQL pueden enviar eventos al cliente número dos y tres informándoles sobre los nuevos clientes.

En la vida real, esta configuración puede ser un poco más compleja porque podríamos tener más de una instancia del mismo servicio como en este caso. En este caso, el cliente número dos envía la solicitud de suscripción a la instancia del servicio número uno, mientras que el cliente número tres envía su solicitud a la instancia del servicio número dos. Ahora, cuando el cliente número uno ejecuta la mutación en la instancia del servicio número uno, la instancia del servicio número uno puede informar al cliente número dos sobre el nuevo cliente. Pero desafortunadamente, el cliente número tres no recibe un evento porque la instancia del servicio número dos no sabe nada sobre el nuevo cliente agregado ni sobre la mutación ejecutada.

Para resolver este problema, la instancia del servicio número uno debe informar a la instancia del servicio número dos sobre las cosas que suceden, como la mutación. Podemos resolver este problema agregando un mensaje broker como Apache Kafka a nuestra implementación. En este caso, el cliente uno todavía envía una mutación a la instancia del servicio número uno. Pero en lugar de enviar la suscripción directamente al cliente dos, la instancia del servicio uno envía un mensaje al mensaje broker. El mensaje contiene la información sobre el nuevo cliente y tanto la instancia del servicio uno como la dos están escuchando este mensaje del mensaje broker. Cuando reciben el mensaje, pueden enviar los datos de la suscripción a ambos de sus clientes conectados, el dos y el tres. Ambos clientes están contentos ahora.

En la vida real, las cosas son un poco más complejas porque estamos escribiendo data en una base de datos. En este caso, la instancia del servicio uno y dos deberían escribir en la misma base de datos, y cuando la instancia del servicio uno escribe algo en la base de datos, el mensaje aún se enviará a Apache Kafka y los clientes dos y tres serán informados sobre el nuevo cliente. Pero en la vida real, las cosas pueden salir mal. Por ejemplo, después de confirmar el nuevo cliente, la instancia del servicio número uno no puede enviar un mensaje a Kafka por cualquier motivo. En ese caso, ninguno de los clientes recibirá un evento. Además, lo que puede suceder es que tengamos otra aplicación que escriba directamente en la base de datos para que la instancia del servicio número uno no sepa acerca de estos cambios y, por lo tanto, no pueda enviar un mensaje a través del mensaje broker. Y nuevamente, los clientes dos y tres no son informados sobre el cambio en nuestros datos.

Para resolver este tipo de problemas, podemos agregar una herramienta de captura de datos de cambio como Debezium a nuestra pila de herramientas. Una herramienta de captura de datos de cambio lee todo lo que sucede en su base de datos como inserciones, actualizaciones y eliminaciones, y escribe eventos para estas acciones en un mensaje broker. En el caso de Debezium, Debezium publica eventos de cambio en Apache Kafka. Un evento de cambio de Debezium podría verse así. Tiene un atributo de origen donde se establece la tabla, por ejemplo. Tiene una operación como actualización, eliminación o inserción que describe lo que ha sucedido en la base de datos, y tiene los datos antes y después.

2. Arquitectura con Debezium y Kafka

Short description:

En este caso, Debezium recoge los cambios directamente de la base de datos y envía mensajes de eventos CDC al mensaje broker conectado. Las instancias del servicio reciben estos eventos, los interpretan y envían datos de suscripción a los clientes. Gracias a Debezium y Apache Kafka, podemos estar seguros de que cualquier cambio en la base de datos se publicará en Kafka y será recibido por nuestra instancia del servicio. También podemos utilizar esta combinación de tecnologías para consultas mediante la creación de una base de datos de modelo de lectura dedicada para nuestra API de GraphQL.

En este caso, los datos antes y después de una operación de actualización. Nuestra arquitectura con Debezium se vería así. El cliente uno todavía envía la mutación directamente a la instancia del servicio uno. La instancia del servicio número uno escribe el nuevo cliente en la base de datos o alguna otra aplicación escribe algo en la base de datos.

Y en ambos casos, Debezium recoge los cambios directamente de tu base de datos y envía un mensaje de evento CDC al mensaje broker conectado. Tanto la instancia del servicio número uno como la número dos reciben estos eventos de captura de cambios CDC, pueden interpretar estos eventos y enviar datos de suscripción a través de su API de GraphQL al cliente número dos y al cliente número tres. Y ambos clientes están contentos ahora.

Gracias a las garantías de entrega que Debezium y Apache Kafka nos brindan, podemos estar seguros de que cualquier cambio en la base de datos, ya sea una actualización, inserción o eliminación, se publicará en Kafka y será recibido por nuestra instancia del servicio, de modo que podemos estar seguros de que podemos enviar una suscripción para cualquier cambio en la base de datos por cualquier motivo que haya cambiado la base de datos.

Si quieres probar esto por ti mismo, he creado una pequeña aplicación de muestra construida con GraphQL Java y Spring para GraphQL. Puedes encontrar el código fuente en el repositorio de GitHub en la siguiente URL.

Por cierto, esta combinación de tecnologías no solo la podemos utilizar para suscripciones, sino que también creo que la podemos utilizar para consultas. Podríamos construir una base de datos de modelo de lectura dedicada para nuestra API de GraphQL. Imagina que tenemos una lista de microservicios cada uno conectado a su propia base de datos. Utilizando Debezium y Apache Kafka, podemos recoger todos los cambios de todas las bases de datos y construir una base de datos optimizada y dedicada solo para nuestra API de GraphQL. La API de GraphQL puede leer los datos de esta base de datos específica y no necesita consultar todos los microservicios para obtener los datos solicitados en una consulta de GraphQL. Hasta aquí, muchas gracias por hoy, nos vemos y diviértete construyendo APIs de GraphQL.

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

De GraphQL Zero a GraphQL Hero con RedwoodJS
GraphQL Galaxy 2021GraphQL Galaxy 2021
32 min
De GraphQL Zero a GraphQL Hero con RedwoodJS
Top Content
Tom Pressenwurter introduces Redwood.js, a full stack app framework for building GraphQL APIs easily and maintainably. He demonstrates a Redwood.js application with a React-based front end and a Node.js API. Redwood.js offers a simplified folder structure and schema for organizing the application. It provides easy data manipulation and CRUD operations through GraphQL functions. Redwood.js allows for easy implementation of new queries and directives, including authentication and limiting access to data. It is a stable and production-ready framework that integrates well with other front-end technologies.
Estado Local y Caché del Servidor: Encontrando un Equilibrio
Vue.js London Live 2021Vue.js London Live 2021
24 min
Estado Local y Caché del Servidor: Encontrando un Equilibrio
Top Content
This Talk discusses handling local state in software development, particularly when dealing with asynchronous behavior and API requests. It explores the challenges of managing global state and the need for actions when handling server data. The Talk also highlights the issue of fetching data not in Vuex and the challenges of keeping data up-to-date in Vuex. It mentions alternative tools like Apollo Client and React Query for handling local state. The Talk concludes with a discussion on GitLab going public and the celebration that followed.
Baterías Incluidas Reimaginadas - El Resurgimiento de GraphQL Yoga
GraphQL Galaxy 2021GraphQL Galaxy 2021
33 min
Baterías Incluidas Reimaginadas - El Resurgimiento de GraphQL Yoga
Envelope is a powerful GraphQL plugin system that simplifies server development and allows for powerful plugin integration. It provides conformity for large corporations with multiple GraphQL servers and can be used with various frameworks. Envelope acts as the Babel of GraphQL, allowing the use of non-spec features. The Guild offers GraphQL Hive, a service similar to Apollo Studio, and encourages collaboration with other frameworks and languages.
Aplicaciones sólidas de React y GraphQL para personas con prisa
GraphQL Galaxy 2022GraphQL Galaxy 2022
29 min
Aplicaciones sólidas de React y GraphQL para personas con prisa
The Talk discusses the challenges and advancements in using GraphQL and React together. It introduces RedwoodJS, a framework that simplifies frontend-backend integration and provides features like code generation, scaffolding, and authentication. The Talk demonstrates how to set up a Redwood project, generate layouts and models, and perform CRUD operations. Redwood automates many GraphQL parts and provides an easy way for developers to get started with GraphQL. It also highlights the benefits of Redwood and suggests checking out RedwoodJS.com for more information.
Adoptando GraphQL en una Empresa
GraphQL Galaxy 2021GraphQL Galaxy 2021
32 min
Adoptando GraphQL en una Empresa
Today's Talk is about adopting GraphQL in an enterprise. It discusses the challenges of using REST APIs and the benefits of GraphQL. The Talk explores different approaches to adopting GraphQL, including coexistence with REST APIs. It emphasizes the power of GraphQL and provides tips for successful adoption. Overall, the Talk highlights the advantages of GraphQL in terms of efficiency, collaboration, and control over APIs.
Deja paso a los resolvers: un nuevo enfoque para la ejecución de GraphQL
GraphQL Galaxy 2022GraphQL Galaxy 2022
16 min
Deja paso a los resolvers: un nuevo enfoque para la ejecución de GraphQL
GraphQL has made a huge impact in the way we build client applications, websites, and mobile apps. Despite the dominance of resolvers, the GraphQL specification does not mandate their use. Introducing Graphast, a new project that compiles GraphQL operations into execution and output plans, providing advanced optimizations. In GraphFast, instead of resolvers, we have plan resolvers that deal with future data. Graphfast plan resolvers are short and efficient, supporting all features of modern GraphQL.

Workshops on related topic

Construye una aplicación WordPress sin cabeza con Next.js y WPGraphQL
React Summit 2022React Summit 2022
173 min
Construye una aplicación WordPress sin cabeza con Next.js y WPGraphQL
Top Content
WorkshopFree
Kellen Mace
Kellen Mace
En esta masterclass, aprenderás cómo construir una aplicación Next.js que utiliza Apollo Client para obtener datos de un backend de WordPress sin cabeza y usarlo para renderizar las páginas de tu aplicación. Aprenderás cuándo debes considerar una arquitectura de WordPress sin cabeza, cómo convertir un backend de WordPress en un servidor GraphQL, cómo componer consultas usando el IDE GraphiQL, cómo colocar fragmentos GraphQL con tus componentes, y más.
Construir con SvelteKit y GraphQL
GraphQL Galaxy 2021GraphQL Galaxy 2021
140 min
Construir con SvelteKit y GraphQL
Top Content
WorkshopFree
Scott Spence
Scott Spence
¿Alguna vez has pensado en construir algo que no requiera mucho código de plantilla con un tamaño de paquete pequeño? En esta masterclass, Scott Spence irá desde el hola mundo hasta cubrir el enrutamiento y el uso de endpoints en SvelteKit. Configurarás una API de GraphQL en el backend y luego usarás consultas de GraphQL con SvelteKit para mostrar los datos de la API de GraphQL. Construirás un proyecto rápido y seguro que utiliza las características de SvelteKit, y luego lo desplegarás como un sitio completamente estático. Este curso es para los curiosos de Svelte que no han tenido una experiencia extensa con SvelteKit y quieren una comprensión más profunda de cómo usarlo en aplicaciones prácticas.

Tabla de contenidos:
- Inicio e introducción a Svelte
- Inicializar el proyecto frontend
- Recorrido por el proyecto esqueleto de SvelteKit
- Configurar el proyecto backend
- Consultar datos con GraphQL
- Recuperación de datos en el frontend con GraphQL
- Estilización
- Directivas de Svelte
- Enrutamiento en SvelteKit
- Endpoints en SvelteKit
- Despliegue en Netlify
- Navegación
- Mutaciones en GraphCMS
- Envío de mutaciones GraphQL a través de SvelteKit
- Preguntas y respuestas
Modelado de Bases de Datos Relacionales para GraphQL
GraphQL Galaxy 2020GraphQL Galaxy 2020
106 min
Modelado de Bases de Datos Relacionales para GraphQL
Top Content
Workshop
Adron Hall
Adron Hall
En esta masterclass profundizaremos en el modelado de datos. Comenzaremos con una discusión sobre varios tipos de bases de datos y cómo se mapean a GraphQL. Una vez que se haya establecido esa base, el enfoque se desplazará a tipos específicos de bases de datos y cómo construir modelos de datos que funcionen mejor para GraphQL en varios escenarios.
Índice de contenidosParte 1 - Hora 1      a. Modelado de Datos de Bases de Datos Relacionales      b. Comparando Bases de Datos Relacionales y NoSQL      c. GraphQL con la Base de Datos en menteParte 2 - Hora 2      a. Diseño de Modelos de Datos Relacionales      b. Relación, Construcción de Tablas Multijoin      c. Complejidades de Consulta de Modelado de Datos Relacionales y GraphQL
Prerrequisitos      a. Herramienta de modelado de datos. El formador utilizará dbdiagram      b. Postgres, aunque no es necesario instalar esto localmente, ya que estaré utilizando una imagen de Dicker de Postgres, de Docker Hub para todos los ejemplos      c. Hasura
Construye y Despliega un Backend con Fastify y Platformatic
JSNation 2023JSNation 2023
104 min
Construye y Despliega un Backend con Fastify y Platformatic
WorkshopFree
Matteo Collina
Matteo Collina
Platformatic te permite desarrollar rápidamente APIs GraphQL y REST con un esfuerzo mínimo. La mejor parte es que también te permite aprovechar todo el potencial de Node.js y Fastify cuando lo necesites. Puedes personalizar completamente una aplicación de Platformatic escribiendo tus propias características y complementos adicionales. En el masterclass, cubriremos tanto nuestros módulos de código abierto como nuestra oferta en la nube:- Platformatic OSS (open-source software) — Herramientas y bibliotecas para construir rápidamente aplicaciones robustas con Node.js (https://oss.platformatic.dev/).- Platformatic Cloud (actualmente en beta) — Nuestra plataforma de alojamiento que incluye características como aplicaciones de vista previa, métricas integradas e integración con tu flujo de Git (https://platformatic.dev/).
En este masterclass aprenderás cómo desarrollar APIs con Fastify y desplegarlas en la nube de Platformatic.
Construyendo APIs GraphQL sobre Ethereum con The Graph
GraphQL Galaxy 2021GraphQL Galaxy 2021
48 min
Construyendo APIs GraphQL sobre Ethereum con The Graph
WorkshopFree
Nader Dabit
Nader Dabit
The Graph es un protocolo de indexación para consultar redes como Ethereum, IPFS y otras blockchains. Cualquiera puede construir y publicar APIs abiertas, llamadas subgrafos, para hacer que los datos sean fácilmente accesibles.

En este masterclass aprenderás cómo construir un subgrafo que indexa datos de blockchain de NFT del contrato inteligente Foundation. Desplegaremos la API y aprenderemos cómo realizar consultas para recuperar datos utilizando diferentes tipos de patrones de acceso a datos, implementando filtros y ordenamiento.

Al final del masterclass, deberías entender cómo construir y desplegar APIs de alto rendimiento en The Graph para indexar datos de cualquier contrato inteligente desplegado en Ethereum.
Problemas difíciles de GraphQL en Shopify
GraphQL Galaxy 2021GraphQL Galaxy 2021
164 min
Problemas difíciles de GraphQL en Shopify
WorkshopFree
Rebecca Friedman
Jonathan Baker
Alex Ackerman
Théo Ben Hassen
 Greg MacWilliam
5 authors
En Shopify a gran escala, resolvemos algunos problemas bastante difíciles. En este masterclass, cinco oradores diferentes describirán algunos de los desafíos que hemos enfrentado y cómo los hemos superado.

Tabla de contenidos:
1 - El infame problema "N+1": Jonathan Baker - Vamos a hablar sobre qué es, por qué es un problema y cómo Shopify lo maneja a gran escala en varios APIs de GraphQL.
2 - Contextualizando APIs de GraphQL: Alex Ackerman - Cómo y por qué decidimos usar directivas. Compartiré qué son las directivas, qué directivas están disponibles de forma predeterminada y cómo crear directivas personalizadas.
3 - Consultas de GraphQL más rápidas para clientes móviles: Theo Ben Hassen - A medida que tu aplicación móvil crece, también lo harán tus consultas de GraphQL. En esta charla, repasaré diversas estrategias para hacer que tus consultas sean más rápidas y efectivas.
4 - Construyendo el producto del futuro hoy: Greg MacWilliam - Cómo Shopify adopta las características futuras en el código actual.
5 - Gestión efectiva de APIs grandes: Rebecca Friedman - Tenemos miles de desarrolladores en Shopify. Veamos cómo estamos asegurando la calidad y consistencia de nuestras APIs de GraphQL con tantos colaboradores.