Suscripciones de GraphQL con Debezium y Kafka

Rate this content
Bookmark
Reaccionar a los cambios de datos y publicar esos cambios como eventos de GraphQL con suscripciones puede ser difícil, especialmente en un entorno de múltiples servicios con múltiples bases de datos o al escalar su servidor de GraphQL con múltiples instancias. Los clientes de GraphQL no deben perder eventos ni recibirlos dos veces, sin importar cómo sea su arquitectura backend o qué problemas (caída del servicio, pérdida de conexión a la base de datos, ...) puedan tener al atender una solicitud de suscripción.

En esta charla, te mostraré cómo Debezium y Apache Kafka pueden ayudarte a construir suscripciones confiables a partir de cambios en tu base de datos. Debezium es una herramienta de captura de datos de cambio (CDC) que puede enviar cambios desde el registro de transacciones de una base de datos al broker de mensajes Kafka.

En mi charla, utilizaré un backend de GraphQL implementado en Java con "Spring for GraphQL", pero como Debezium y Kafka no están limitados a Java, la idea también es utilizable con otros frameworks y lenguajes de programación de GraphQL. No es necesario tener conocimientos de Java o Spring for GraphQL para entender la charla.

This talk has been presented at GraphQL Galaxy 2022, check out the latest edition of this Tech Conference.

FAQ

La combinación de GraphQL con Kafka y Debezium resuelve el problema de mantener sincronizadas múltiples instancias de un servicio al compartir información sobre cambios en la base de datos, como inserciones, actualizaciones y eliminaciones, asegurando que todos los clientes suscritos reciban las actualizaciones pertinentes en tiempo real.

En esta arquitectura, cuando una instancia del servicio realiza una mutación en la base de datos, Debezium captura ese cambio y publica un evento en Apache Kafka. Las otras instancias del servicio, al estar suscritas a Kafka, reciben este evento, lo que les permite enviar datos de suscripción pertinentes a sus clientes conectados.

Debezium es una herramienta de captura de datos de cambio (CDC) que monitorea las bases de datos y registra los cambios realizados en ellas, como inserciones, actualizaciones y eliminaciones. En este contexto, Debezium publica eventos de cambio en Kafka para que ambas instancias del servicio puedan reaccionar a estos cambios y actualizar a los clientes suscritos de manera oportuna.

Apache Kafka actúa como un broker de mensajes centralizado que facilita la comunicación entre diferentes partes de la aplicación. Recibe y almacena los eventos de cambios de Debezium y permite que varias instancias del servicio accedan a esa información de manera eficiente y en tiempo real, garantizando que todos los suscriptores estén informados de los cambios relevantes.

Debezium, junto con Apache Kafka, ofrece garantías de entrega robustas, asegurando que cualquier cambio en la base de datos se publique y se reciba correctamente, independientemente de la causa del cambio. Esto es crucial para mantener la integridad de los datos y la consistencia entre los usuarios que dependen de suscripciones en tiempo real.

Las suscripciones de GraphQL se benefician de esta arquitectura al recibir actualizaciones en tiempo real sobre los datos que les interesan. Gracias a Kafka y Debezium, los cambios en la base de datos se propagan rápidamente a todas las instancias del servicio, lo que permite que las APIs de GraphQL notifiquen a los clientes suscritos sin demoras, mejorando la experiencia del usuario y la reactividad de la aplicación.

Nils Hartmann
Nils Hartmann
7 min
08 Dec, 2022

Comments

Sign in or register to post your comment.
Video Summary and Transcription
Esta charla relámpago explora el uso de suscripciones de GraphQL con Kafka y Debezium. Al agregar un broker de mensajes como Apache Kafka y una herramienta de captura de datos de cambio como Debezium a la implementación, se pueden resolver problemas con múltiples instancias de servicio y escrituras en la base de datos. Debezium recoge los cambios directamente de la base de datos y envía mensajes de eventos de CDC al broker de mensajes conectado, asegurando que cualquier cambio en la base de datos se publique en Kafka y se reciba por la instancia de servicio. Esta pila tecnológica también se puede utilizar para consultas mediante la construcción de una base de datos de modelo de lectura dedicada para la API de GraphQL.

1. GraphQL Subscriptions with Kafka and Debezium

Short description:

Bienvenidos a mi charla relámpago sobre suscripciones de GraphQL con Kafka y Debezium. Tenemos tres clientes y un servicio que proporciona una API de GraphQL. Cuando el cliente uno agrega un nuevo cliente, el servicio puede enviar eventos a los clientes dos y tres. Sin embargo, puede haber problemas cuando hay múltiples instancias del servicio o al escribir datos en una base de datos. Para resolver estos problemas, podemos agregar un mensaje broker como Apache Kafka y una herramienta de captura de datos de cambio como Debezium a nuestra implementación.

Hola y bienvenidos a mi charla relámpago sobre suscripciones de GraphQL con Kafka y Debezium. Mi nombre es Nils y soy un desarrollador de software freelance de Hamburgo, Alemania.

Echemos un vistazo a esta imagen aquí. Tenemos tres clientes y tenemos un servicio que proporciona una API de GraphQL. El cliente número dos y el cliente número tres envían suscripciones al servicio para recibir información sobre nuevos clientes. Cuando el cliente número uno envía una mutación para agregar un nuevo cliente, nuestro servicio y nuestra API de GraphQL pueden enviar eventos al cliente número dos y tres informándoles sobre los nuevos clientes.

En la vida real, esta configuración puede ser un poco más compleja porque podríamos tener más de una instancia del mismo servicio como en este caso. En este caso, el cliente número dos envía la solicitud de suscripción a la instancia del servicio número uno, mientras que el cliente número tres envía su solicitud a la instancia del servicio número dos. Ahora, cuando el cliente número uno ejecuta la mutación en la instancia del servicio número uno, la instancia del servicio número uno puede informar al cliente número dos sobre el nuevo cliente. Pero desafortunadamente, el cliente número tres no recibe un evento porque la instancia del servicio número dos no sabe nada sobre el nuevo cliente agregado ni sobre la mutación ejecutada.

Para resolver este problema, la instancia del servicio número uno debe informar a la instancia del servicio número dos sobre las cosas que suceden, como la mutación. Podemos resolver este problema agregando un mensaje broker como Apache Kafka a nuestra implementación. En este caso, el cliente uno todavía envía una mutación a la instancia del servicio número uno. Pero en lugar de enviar la suscripción directamente al cliente dos, la instancia del servicio uno envía un mensaje al mensaje broker. El mensaje contiene la información sobre el nuevo cliente y tanto la instancia del servicio uno como la dos están escuchando este mensaje del mensaje broker. Cuando reciben el mensaje, pueden enviar los datos de la suscripción a ambos de sus clientes conectados, el dos y el tres. Ambos clientes están contentos ahora.

En la vida real, las cosas son un poco más complejas porque estamos escribiendo data en una base de datos. En este caso, la instancia del servicio uno y dos deberían escribir en la misma base de datos, y cuando la instancia del servicio uno escribe algo en la base de datos, el mensaje aún se enviará a Apache Kafka y los clientes dos y tres serán informados sobre el nuevo cliente. Pero en la vida real, las cosas pueden salir mal. Por ejemplo, después de confirmar el nuevo cliente, la instancia del servicio número uno no puede enviar un mensaje a Kafka por cualquier motivo. En ese caso, ninguno de los clientes recibirá un evento. Además, lo que puede suceder es que tengamos otra aplicación que escriba directamente en la base de datos para que la instancia del servicio número uno no sepa acerca de estos cambios y, por lo tanto, no pueda enviar un mensaje a través del mensaje broker. Y nuevamente, los clientes dos y tres no son informados sobre el cambio en nuestros datos.

Para resolver este tipo de problemas, podemos agregar una herramienta de captura de datos de cambio como Debezium a nuestra pila de herramientas. Una herramienta de captura de datos de cambio lee todo lo que sucede en su base de datos como inserciones, actualizaciones y eliminaciones, y escribe eventos para estas acciones en un mensaje broker. En el caso de Debezium, Debezium publica eventos de cambio en Apache Kafka. Un evento de cambio de Debezium podría verse así. Tiene un atributo de origen donde se establece la tabla, por ejemplo. Tiene una operación como actualización, eliminación o inserción que describe lo que ha sucedido en la base de datos, y tiene los datos antes y después.

2. Arquitectura con Debezium y Kafka

Short description:

En este caso, Debezium recoge los cambios directamente de la base de datos y envía mensajes de eventos CDC al mensaje broker conectado. Las instancias del servicio reciben estos eventos, los interpretan y envían datos de suscripción a los clientes. Gracias a Debezium y Apache Kafka, podemos estar seguros de que cualquier cambio en la base de datos se publicará en Kafka y será recibido por nuestra instancia del servicio. También podemos utilizar esta combinación de tecnologías para consultas mediante la creación de una base de datos de modelo de lectura dedicada para nuestra API de GraphQL.

En este caso, los datos antes y después de una operación de actualización. Nuestra arquitectura con Debezium se vería así. El cliente uno todavía envía la mutación directamente a la instancia del servicio uno. La instancia del servicio número uno escribe el nuevo cliente en la base de datos o alguna otra aplicación escribe algo en la base de datos.

Y en ambos casos, Debezium recoge los cambios directamente de tu base de datos y envía un mensaje de evento CDC al mensaje broker conectado. Tanto la instancia del servicio número uno como la número dos reciben estos eventos de captura de cambios CDC, pueden interpretar estos eventos y enviar datos de suscripción a través de su API de GraphQL al cliente número dos y al cliente número tres. Y ambos clientes están contentos ahora.

Gracias a las garantías de entrega que Debezium y Apache Kafka nos brindan, podemos estar seguros de que cualquier cambio en la base de datos, ya sea una actualización, inserción o eliminación, se publicará en Kafka y será recibido por nuestra instancia del servicio, de modo que podemos estar seguros de que podemos enviar una suscripción para cualquier cambio en la base de datos por cualquier motivo que haya cambiado la base de datos.

Si quieres probar esto por ti mismo, he creado una pequeña aplicación de muestra construida con GraphQL Java y Spring para GraphQL. Puedes encontrar el código fuente en el repositorio de GitHub en la siguiente URL.

Por cierto, esta combinación de tecnologías no solo la podemos utilizar para suscripciones, sino que también creo que la podemos utilizar para consultas. Podríamos construir una base de datos de modelo de lectura dedicada para nuestra API de GraphQL. Imagina que tenemos una lista de microservicios cada uno conectado a su propia base de datos. Utilizando Debezium y Apache Kafka, podemos recoger todos los cambios de todas las bases de datos y construir una base de datos optimizada y dedicada solo para nuestra API de GraphQL. La API de GraphQL puede leer los datos de esta base de datos específica y no necesita consultar todos los microservicios para obtener los datos solicitados en una consulta de GraphQL. Hasta aquí, muchas gracias por hoy, nos vemos y diviértete construyendo APIs de GraphQL.

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

De GraphQL Zero a GraphQL Hero con RedwoodJS
GraphQL Galaxy 2021GraphQL Galaxy 2021
32 min
De GraphQL Zero a GraphQL Hero con RedwoodJS
Top Content
Tom Pressenwurter introduces Redwood.js, a full stack app framework for building GraphQL APIs easily and maintainably. He demonstrates a Redwood.js application with a React-based front end and a Node.js API. Redwood.js offers a simplified folder structure and schema for organizing the application. It provides easy data manipulation and CRUD operations through GraphQL functions. Redwood.js allows for easy implementation of new queries and directives, including authentication and limiting access to data. It is a stable and production-ready framework that integrates well with other front-end technologies.
Estado Local y Caché del Servidor: Encontrando un Equilibrio
Vue.js London Live 2021Vue.js London Live 2021
24 min
Estado Local y Caché del Servidor: Encontrando un Equilibrio
Top Content
This Talk discusses handling local state in software development, particularly when dealing with asynchronous behavior and API requests. It explores the challenges of managing global state and the need for actions when handling server data. The Talk also highlights the issue of fetching data not in Vuex and the challenges of keeping data up-to-date in Vuex. It mentions alternative tools like Apollo Client and React Query for handling local state. The Talk concludes with a discussion on GitLab going public and the celebration that followed.
Baterías Incluidas Reimaginadas - El Resurgimiento de GraphQL Yoga
GraphQL Galaxy 2021GraphQL Galaxy 2021
33 min
Baterías Incluidas Reimaginadas - El Resurgimiento de GraphQL Yoga
Envelope is a powerful GraphQL plugin system that simplifies server development and allows for powerful plugin integration. It provides conformity for large corporations with multiple GraphQL servers and can be used with various frameworks. Envelope acts as the Babel of GraphQL, allowing the use of non-spec features. The Guild offers GraphQL Hive, a service similar to Apollo Studio, and encourages collaboration with other frameworks and languages.
Aplicaciones sólidas de React y GraphQL para personas con prisa
GraphQL Galaxy 2022GraphQL Galaxy 2022
29 min
Aplicaciones sólidas de React y GraphQL para personas con prisa
The Talk discusses the challenges and advancements in using GraphQL and React together. It introduces RedwoodJS, a framework that simplifies frontend-backend integration and provides features like code generation, scaffolding, and authentication. The Talk demonstrates how to set up a Redwood project, generate layouts and models, and perform CRUD operations. Redwood automates many GraphQL parts and provides an easy way for developers to get started with GraphQL. It also highlights the benefits of Redwood and suggests checking out RedwoodJS.com for more information.
Adoptando GraphQL en una Empresa
GraphQL Galaxy 2021GraphQL Galaxy 2021
32 min
Adoptando GraphQL en una Empresa
Today's Talk is about adopting GraphQL in an enterprise. It discusses the challenges of using REST APIs and the benefits of GraphQL. The Talk explores different approaches to adopting GraphQL, including coexistence with REST APIs. It emphasizes the power of GraphQL and provides tips for successful adoption. Overall, the Talk highlights the advantages of GraphQL in terms of efficiency, collaboration, and control over APIs.
Deja paso a los resolvers: un nuevo enfoque para la ejecución de GraphQL
GraphQL Galaxy 2022GraphQL Galaxy 2022
16 min
Deja paso a los resolvers: un nuevo enfoque para la ejecución de GraphQL
GraphQL has made a huge impact in the way we build client applications, websites, and mobile apps. Despite the dominance of resolvers, the GraphQL specification does not mandate their use. Introducing Graphast, a new project that compiles GraphQL operations into execution and output plans, providing advanced optimizations. In GraphFast, instead of resolvers, we have plan resolvers that deal with future data. Graphfast plan resolvers are short and efficient, supporting all features of modern GraphQL.

Workshops on related topic

Construir con SvelteKit y GraphQL
GraphQL Galaxy 2021GraphQL Galaxy 2021
140 min
Construir con SvelteKit y GraphQL
Top Content
Featured WorkshopFree
Scott Spence
Scott Spence
¿Alguna vez has pensado en construir algo que no requiera mucho código de plantilla con un tamaño de paquete pequeño? En esta masterclass, Scott Spence irá desde el hola mundo hasta cubrir el enrutamiento y el uso de endpoints en SvelteKit. Configurarás una API de GraphQL en el backend y luego usarás consultas de GraphQL con SvelteKit para mostrar los datos de la API de GraphQL. Construirás un proyecto rápido y seguro que utiliza las características de SvelteKit, y luego lo desplegarás como un sitio completamente estático. Este curso es para los curiosos de Svelte que no han tenido una experiencia extensa con SvelteKit y quieren una comprensión más profunda de cómo usarlo en aplicaciones prácticas.

Tabla de contenidos:
- Inicio e introducción a Svelte
- Inicializar el proyecto frontend
- Recorrido por el proyecto esqueleto de SvelteKit
- Configurar el proyecto backend
- Consultar datos con GraphQL
- Recuperación de datos en el frontend con GraphQL
- Estilización
- Directivas de Svelte
- Enrutamiento en SvelteKit
- Endpoints en SvelteKit
- Despliegue en Netlify
- Navegación
- Mutaciones en GraphCMS
- Envío de mutaciones GraphQL a través de SvelteKit
- Preguntas y respuestas
Construye Aplicaciones Modernas Utilizando GraphQL y Javascript
Node Congress 2024Node Congress 2024
152 min
Construye Aplicaciones Modernas Utilizando GraphQL y Javascript
Featured Workshop
Emanuel Scirlet
Miguel Henriques
2 authors
Ven y aprende cómo puedes potenciar tus aplicaciones modernas y seguras utilizando GraphQL y Javascript. En este masterclass construiremos una API de GraphQL y demostraremos los beneficios del lenguaje de consulta para APIs y los casos de uso para los que es adecuado. Se requiere conocimiento básico de Javascript.
Seguridad de tipo de extremo a extremo con React, GraphQL y Prisma
React Advanced 2022React Advanced 2022
95 min
Seguridad de tipo de extremo a extremo con React, GraphQL y Prisma
Featured WorkshopFree
Sabin Adams
Sabin Adams
En este masterclass, obtendrás una visión de primera mano de lo que es la seguridad de tipo de extremo a extremo y por qué es importante. Para lograr esto, construirás una API de GraphQL utilizando herramientas modernas y relevantes que serán consumidas por un cliente de React.
Prerrequisitos: - Node.js instalado en tu máquina (12.2.X / 14.X)- Se recomienda (pero no es obligatorio) utilizar VS Code para las tareas prácticas- Un IDE instalado (se recomienda VSCode)- (Bueno tener) *Un conocimiento básico de Node.js, React y TypeScript
GraphQL para Desarrolladores de React
GraphQL Galaxy 2022GraphQL Galaxy 2022
112 min
GraphQL para Desarrolladores de React
Featured Workshop
Roy Derks
Roy Derks
Hay muchas ventajas en utilizar GraphQL como fuente de datos para el desarrollo frontend, en comparación con las API REST. Nosotros, los desarrolladores, por ejemplo, necesitamos escribir mucho código imperativo para recuperar datos y mostrarlos en nuestras aplicaciones y manejar el estado. Con GraphQL, no solo puedes reducir la cantidad de código necesario para la obtención de datos y la gestión del estado, sino que también obtendrás una mayor flexibilidad, mejor rendimiento y, sobre todo, una mejor experiencia de desarrollo. En este masterclass aprenderás cómo GraphQL puede mejorar tu trabajo como desarrollador frontend y cómo manejar GraphQL en tu aplicación frontend de React.
Construye una aplicación WordPress sin cabeza con Next.js y WPGraphQL
React Summit 2022React Summit 2022
173 min
Construye una aplicación WordPress sin cabeza con Next.js y WPGraphQL
Top Content
WorkshopFree
Kellen Mace
Kellen Mace
En esta masterclass, aprenderás cómo construir una aplicación Next.js que utiliza Apollo Client para obtener datos de un backend de WordPress sin cabeza y usarlo para renderizar las páginas de tu aplicación. Aprenderás cuándo debes considerar una arquitectura de WordPress sin cabeza, cómo convertir un backend de WordPress en un servidor GraphQL, cómo componer consultas usando el IDE GraphiQL, cómo colocar fragmentos GraphQL con tus componentes, y más.
Modelado de Bases de Datos Relacionales para GraphQL
GraphQL Galaxy 2020GraphQL Galaxy 2020
106 min
Modelado de Bases de Datos Relacionales para GraphQL
Top Content
WorkshopFree
Adron Hall
Adron Hall
En esta masterclass profundizaremos en el modelado de datos. Comenzaremos con una discusión sobre varios tipos de bases de datos y cómo se mapean a GraphQL. Una vez que se haya establecido esa base, el enfoque se desplazará a tipos específicos de bases de datos y cómo construir modelos de datos que funcionen mejor para GraphQL en varios escenarios.
Índice de contenidosParte 1 - Hora 1      a. Modelado de Datos de Bases de Datos Relacionales      b. Comparando Bases de Datos Relacionales y NoSQL      c. GraphQL con la Base de Datos en menteParte 2 - Hora 2      a. Diseño de Modelos de Datos Relacionales      b. Relación, Construcción de Tablas Multijoin      c. Complejidades de Consulta de Modelado de Datos Relacionales y GraphQL
Prerrequisitos      a. Herramienta de modelado de datos. El formador utilizará dbdiagram      b. Postgres, aunque no es necesario instalar esto localmente, ya que estaré utilizando una imagen de Dicker de Postgres, de Docker Hub para todos los ejemplos      c. Hasura