NodeJS & AI: Building Smarter Applications

This ad is not shown to multipass and full ticket holders
React Summit US
React Summit US 2025
November 17 - 21, 2025
New York, US & Online
The biggest React conference in the US
Learn More
In partnership with Focus Reactive
Upcoming event
React Summit US 2025
React Summit US 2025
November 17 - 21, 2025. New York, US & Online
Learn more
Bookmark
Rate this content

Desbloquea el potencial de la IA en aplicaciones de Node.js a través de implementaciones prácticas y del mundo real. Esta sesión demuestra cómo integrar tanto modelos de IA de código abierto como cerrados para construir características inteligentes como la búsqueda semántica y agentes autónomos. Los asistentes aprenderán patrones listos para producción para sistemas RAG, incrustaciones vectoriales y agentes de IA, mientras comprenden las decisiones arquitectónicas clave detrás de cada implementación. Perfecto para desarrolladores listos para ir más allá de las llamadas básicas a la API y construir aplicaciones sofisticadas mejoradas con IA.

This talk has been presented at Node Congress 2025, check out the latest edition of this JavaScript Conference.

Aileen Villanueva
Aileen Villanueva
19 min
17 Apr, 2025

Comments

Sign in or register to post your comment.
  • Christos kuznos
    Christos kuznos
    None
    are they more than the 2 types of models, closed and open source?
Video Summary and Transcription
La charla de hoy exploró la combinación de Node.js e inteligencia artificial para construir aplicaciones inteligentes. Se discutieron dos tipos de modelos, cerrados y de código abierto, con modelos cerrados accesibles a través de una API y modelos de código abierto alojados localmente o en la nube. Se explicó el uso de RAC (Recuperación de Generación de Métodos) para mejorar los modelos, junto con el proceso de obtención de datos y mejora del rendimiento de recuperación. Se introdujeron técnicas de chunking, incrustación y bases de datos vectoriales como métodos para organizar y transformar datos. La charla también cubrió la recuperación de datos utilizando búsqueda semántica y la generación de respuestas legibles por humanos utilizando modelos. Se discutió el concepto de mejorar modelos con agentes, centrándose en cómo los agentes descomponen objetivos complejos y utilizan funciones externas. Se destacó el uso de herramientas y el patrón de React en la implementación de agentes. Por último, la charla tocó la implementación de patrones de agentes y la mejora de LLMs, con demostraciones y código disponibles para una exploración adicional.

1. Introducción a Node.js y AI

Short description:

Hoy exploraremos la combinación de Node.js y la inteligencia artificial para construir aplicaciones inteligentes. Los modelos son programas especializados entrenados con datos para reconocer patrones y hacer predicciones. Usaremos modelos de lenguaje grande que sobresalen en la comprensión y generación del lenguaje humano. Hay dos tipos de modelos: cerrados y de código abierto. Los modelos cerrados como chat GPT y Gemini se acceden a través de una API. Los modelos de código abierto como Lama y Gemma se pueden alojar localmente o en la nube. Aunque estos modelos son poderosos, tienen limitaciones. Ahí es donde entran en juego nuevas técnicas.

Hola a todos, estoy emocionada de hablar hoy sobre cómo podemos combinar Node.js y una parte de la inteligencia artificial para construir aplicaciones que no solo sean funcionales, sino inteligentes. Ha habido una creciente importancia de la inteligencia artificial en el software, y yo quiero animar a ustedes, desarrolladores de TypeScript y JavaScript, a aprender y aplicar estas tecnologías.

Mi nombre es Aileen. Actualmente trabajo como desarrolladora de software en Orama, y he estado haciendo software durante 10 años. Organizo encuentros tecnológicos en mi ciudad, y estoy realmente apasionada por la intersección de la IA y el software.

Pero antes de sumergirnos, quiero que nos alineemos con algunos conceptos de los que hablaremos. Y empecemos definiendo qué es un modelo. Y quiero que piensen en un modelo como un programa especializado que ha sido entrenado con enormes cantidades de datos para reconocer patrones y hacer predicciones o decisiones. Estos modelos han sido entrenados para realizar tareas específicas, como entender texto, generar contenido o clasificar imágenes. Y vamos a interactuar con ellos proporcionando a estos modelos una entrada. Utilizaría todos estos patrones aprendidos y generaría una salida. Esta salida podría ser una inferencia, una generación o una predicción.

Hoy vamos a utilizar modelos de lenguaje grande. Y un modelo de lenguaje grande es un modelo que es bueno para entender y generar el lenguaje humano. Se basan en la arquitectura de transformadores. Hay un artículo llamado Attention is All You Need, y realmente lo recomiendo para leerlo si realmente quieres entender cómo funcionan por debajo. Están entrenados con grandes cantidades de datos, y funcionan para muchas tareas. Así que pueden hacer resúmenes. Pueden hacer respuestas a preguntas o traducción. Hoy vamos a hablar sobre dos tipos de modelos, que son los modelos cerrados. Y estos modelos son modelos como chat GPT, como Cloud, de Anthropic, como Gemini, y algunos de los modelos de Mistral. Estos modelos se acceden a través de una API, y tienen un costo. No puedes descargarlos, así que básicamente dependes de estos proveedores para usar estos modelos. El otro tipo de modelos son los modelos de código abierto. Y estos modelos, puedes encontrarlos alojados en Hug y Face. Puedes descargarlos y ejecutarlos en tu máquina local usando Olama. También podrías descargarlos y alojarlos en cualquier infraestructura en la nube, y estos modelos son modelos como Lama, como DeepSeq, o como Gemma de Google. Pero como puedes ver, estos modelos son realmente poderosos, y definitivamente podemos hacerlos más poderosos. Recordemos que estos modelos han sido entrenados con enormes cantidades de datos, y no hay duda de que estos modelos no son buenos en matemáticas o en necesidades muy específicas o nichos de una industria. Así que ahí es cuando entra en juego una nueva técnica.

2. Usando RAC para Mejorar Modelos

Short description:

RAC (Retrieve of Method Generation) reduce la alucinación al proporcionar información precisa a los modelos. El uso de datos privados y RAC puede hacer que los modelos sean más poderosos. Sin embargo, los modelos pueden estar desactualizados o carecer de conocimiento. Por ejemplo, cuando se preguntó sobre los oradores del Node Congress 2025, el conocimiento de un modelo se cortó en octubre de 2024. Para abordar esto, vamos a recorrer el proceso de crear y mejorar el modelo con RAC. El primer paso es obtener datos, que pueden estar en varios formatos como PDFs, JSON, o extraídos de sitios web. A continuación, utilizamos la división para facilitar la búsqueda de información relevante y mejorar el rendimiento de recuperación. La biblioteca LimeChain y la función de divisor de texto de caracteres recursivos se pueden usar para este propósito.

Y esa técnica es RAC. RAC significa Retrieve of Method Generation. Y RAC definitivamente ayuda en cosas como la alucinación. Aunque no elimina la alucinación, definitivamente podría reducirla. Porque si un modelo no sabe algo, podría haber inventado una respuesta que no es precisa. Así que con RAC, si proporcionamos esa información, ese modelo puede responder correctamente. O podemos habilitar el uso de datos privados. Así que definitivamente, si no fueron entrenados con datos que tienes disponibles solo para ti, definitivamente ayudaría a hacer tu modelo más poderoso.

Pero también, recordemos que tal vez todos estos modelos no se entrenan diariamente. Así que hay conocimiento que no tienen, o podrían estar desactualizados. Y hay un caso de uso específico que quiero mostrarte. Así que le pregunté a Claude quiénes van a ser los oradores del Node Congress 2025. Y como puedes ver en la respuesta, menciona que el conocimiento de ese modelo en esta fecha actual se cortó en octubre de 2024. Así que no sabe quiénes van a ser los oradores de esta conferencia. Y así que para el ejercicio de hoy, voy a ir y guiarte a través de cómo crear y mejorar este modelo con RAC para realmente responder a esta pregunta. Vamos a seguir un par de pasos. Y nuestro primer paso es datos. Así que hay muchas maneras en las que puedes encontrar datos para esta mejora de nuestros modelos con RAC. Y eso podría ser un PDF, podría ser un JSON, un archivo CSV, un crawler, un sitio de DocuSign, o una base de datos. En este caso, estoy usando un crawler para ir a toda la página web del Node Congress. Y solo estoy añadiendo algunos archivos markdown que más tarde tendré disponibles para que los lean. Así que este es un ejemplo de cómo se ve el markdown basado en el crawler que hice para esta página web.

El siguiente paso es la división. Así que los documentos grandes pueden ser abrumadores, y nuestro modelo de IA puede dificultar que encuentres información relevante a través de todos estos datos. Así que con la división, vamos a cortarlo y tal vez hacer más fácil buscar algo como en un libro. Así que puedes buscar información en un capítulo en lugar de leer todo el libro. Así que la división es una buena técnica que se usa para mejorar el rendimiento de recuperación. Y también, es muy buena para representar el contexto. Aquí, estoy usando una biblioteca llamada LimeChain, y estoy usando la función de divisor de texto de caracteres recursivos. Esto también es algo que necesitarás decidir según tu caso de uso.

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Es una jungla ahí fuera: ¿Qué está pasando realmente dentro de tu carpeta Node_Modules?
Node Congress 2022Node Congress 2022
26 min
Es una jungla ahí fuera: ¿Qué está pasando realmente dentro de tu carpeta Node_Modules?
Top Content
The talk discusses the importance of supply chain security in the open source ecosystem, highlighting the risks of relying on open source code without proper code review. It explores the trend of supply chain attacks and the need for a new approach to detect and block malicious dependencies. The talk also introduces Socket, a tool that assesses the security of packages and provides automation and analysis to protect against malware and supply chain attacks. It emphasizes the need to prioritize security in software development and offers insights into potential solutions such as realms and Deno's command line flags.
Construyendo un Asistente AI Activado por Voz con Javascript
JSNation 2023JSNation 2023
21 min
Construyendo un Asistente AI Activado por Voz con Javascript
Top Content
This Talk discusses building a voice-activated AI assistant using web APIs and JavaScript. It covers using the Web Speech API for speech recognition and the speech synthesis API for text to speech. The speaker demonstrates how to communicate with the Open AI API and handle the response. The Talk also explores enabling speech recognition and addressing the user. The speaker concludes by mentioning the possibility of creating a product out of the project and using Tauri for native desktop-like experiences.
El Flujo de Trabajo del Desarrollador Asistido por IA: Construye Más Rápido e Inteligente Hoy
JSNation US 2024JSNation US 2024
31 min
El Flujo de Trabajo del Desarrollador Asistido por IA: Construye Más Rápido e Inteligente Hoy
Top Content
AI is transforming software engineering by using agents to help with coding. Agents can autonomously complete tasks and make decisions based on data. Collaborative AI and automation are opening new possibilities in code generation. Bolt is a powerful tool for troubleshooting, bug fixing, and authentication. Code generation tools like Copilot and Cursor provide support for selecting models and codebase awareness. Cline is a useful extension for website inspection and testing. Guidelines for coding with agents include defining requirements, choosing the right model, and frequent testing. Clear and concise instructions are crucial in AI-generated code. Experienced engineers are still necessary in understanding architecture and problem-solving. Energy consumption insights and sustainability are discussed in the Talk.
El Ascenso del Ingeniero de IA
React Summit US 2023React Summit US 2023
30 min
El Ascenso del Ingeniero de IA
Top Content
The rise of AI engineers is driven by the demand for AI and the emergence of ML research and engineering organizations. Start-ups are leveraging AI through APIs, resulting in a time-to-market advantage. The future of AI engineering holds promising results, with a focus on AI UX and the role of AI agents. Equity in AI and the central problems of AI engineering require collective efforts to address. The day-to-day life of an AI engineer involves working on products or infrastructure and dealing with specialties and tools specific to the field.
IA y Desarrollo Web: ¿Exageración o Realidad?
JSNation 2023JSNation 2023
24 min
IA y Desarrollo Web: ¿Exageración o Realidad?
Top Content
This talk explores the use of AI in web development, including tools like GitHub Copilot and Fig for CLI commands. AI can generate boilerplate code, provide context-aware solutions, and generate dummy data. It can also assist with CSS selectors and regexes, and be integrated into applications. AI is used to enhance the podcast experience by transcribing episodes and providing JSON data. The talk also discusses formatting AI output, crafting requests, and analyzing embeddings for similarity.
Cargadores ESM: Mejorando la carga de módulos en Node.js
JSNation 2023JSNation 2023
22 min
Cargadores ESM: Mejorando la carga de módulos en Node.js
Top Content
ESM Loaders enhance module loading in Node.js by resolving URLs and reading files from the disk. Module loaders can override modules and change how they are found. Enhancing the loading phase involves loading directly from HTTP and loading TypeScript code without building it. The loader in the module URL handles URL resolution and uses fetch to fetch the source code. Loaders can be chained together to load from different sources, transform source code, and resolve URLs differently. The future of module loading enhancements is promising and simple to use.

Workshops on related topic

IA a demanda: IA sin servidor
DevOps.js Conf 2024DevOps.js Conf 2024
163 min
IA a demanda: IA sin servidor
Top Content
Featured WorkshopFree
Nathan Disidore
Nathan Disidore
En esta masterclass, discutimos los méritos de la arquitectura sin servidor y cómo se puede aplicar al espacio de la IA. Exploraremos opciones para construir aplicaciones RAG sin servidor para un enfoque más lambda-esque a la IA. A continuación, nos pondremos manos a la obra y construiremos una aplicación CRUD de muestra que te permite almacenar información y consultarla utilizando un LLM con Workers AI, Vectorize, D1 y Cloudflare Workers.
AI para Desarrolladores de React
React Advanced 2024React Advanced 2024
142 min
AI para Desarrolladores de React
Top Content
Featured Workshop
Eve Porcello
Eve Porcello
El conocimiento de las herramientas de AI es fundamental para preparar el futuro de las carreras de los desarrolladores de React, y la suite de herramientas de AI de Vercel es una vía de acceso accesible. En este curso, examinaremos más de cerca el Vercel AI SDK y cómo esto puede ayudar a los desarrolladores de React a construir interfaces de transmisión con JavaScript y Next.js. También incorporaremos APIs de terceros adicionales para construir y desplegar una aplicación de visualización de música.
Temas:- Creación de un Proyecto de React con Next.js- Elección de un LLM- Personalización de Interfaces de Transmisión- Construcción de Rutas- Creación y Generación de Componentes - Uso de Hooks (useChat, useCompletion, useActions, etc)
Building Full Stack Apps With Cursor
JSNation 2025JSNation 2025
46 min
Building Full Stack Apps With Cursor
Featured Workshop
Mike Mikula
Mike Mikula
En esta masterclass cubriré un proceso repetible sobre cómo iniciar aplicaciones full stack en Cursor. Espere comprender técnicas como el uso de GPT para crear requisitos de producto, esquemas de base de datos, hojas de ruta y usarlos en notas para generar listas de verificación que guíen el desarrollo de aplicaciones. Profundizaremos más en cómo solucionar alucinaciones/errores que ocurren, indicaciones útiles para hacer que su aplicación se vea y se sienta moderna, enfoques para conectar cada capa y más. Al final, ¡espere poder ejecutar su propia aplicación full stack generada por IA en su máquina!
Por favor, encuentre las preguntas frecuentes aquí
How to 9,2x Your Development Speed with Cline
JSNation 2025JSNation 2025
64 min
How to 9,2x Your Development Speed with Cline
Featured Workshop
Nik Pash
Nik Pash
La forma en que escribimos código está cambiando fundamentalmente. En lugar de quedar atrapado en bucles anidados y detalles de implementación, imagine enfocarse puramente en la arquitectura y la resolución creativa de problemas mientras su programador de pares de IA maneja la ejecución. En esta masterclass práctica, te mostraré cómo aprovechar Cline (un agente de codificación autónomo que recientemente alcanzó 1M de descargas en VS Code) para acelerar drásticamente tu flujo de trabajo de desarrollo a través de una práctica que llamamos "vibe coding" - donde los humanos se enfocan en el pensamiento de alto nivel y la IA maneja la implementación.Descubrirás:Los principios fundamentales del "vibe coding" y cómo se diferencia del desarrollo tradicionalCómo diseñar soluciones a un alto nivel y hacer que la IA las implemente con precisiónDemostración en vivo: Construcción de un sistema de almacenamiento en caché de grado de producción en Go que nos ahorró $500/semanaTécnicas para usar IA para entender bases de código complejas en minutos en lugar de horasMejores prácticas para solicitar a los agentes de IA que obtengan exactamente el código que deseasErrores comunes a evitar al trabajar con asistentes de codificación de IAEstrategias para usar IA para acelerar el aprendizaje y reducir la dependencia de ingenieros seniorCómo combinar efectivamente la creatividad humana con las capacidades de implementación de IAYa sea que seas un desarrollador junior que busca acelerar tu aprendizaje o un ingeniero senior que desea optimizar tu flujo de trabajo, saldrás de esta masterclass con experiencia práctica en desarrollo asistido por IA que puedes aplicar inmediatamente a tus proyectos. A través de demostraciones de codificación en vivo y ejercicios prácticos, aprenderás cómo aprovechar Cline para escribir mejor código más rápido mientras te enfocas en lo que importa: resolver problemas reales.
Webinar gratuito: Construyendo aplicaciones Full Stack con Cursor
Productivity Conf for Devs and Tech LeadersProductivity Conf for Devs and Tech Leaders
71 min
Webinar gratuito: Construyendo aplicaciones Full Stack con Cursor
Top Content
WorkshopFree
Mike Mikula
Mike Mikula
Para asistir al webinar, por favor regístrate aquí.En este webinar cubriré un proceso repetible sobre cómo iniciar aplicaciones Full Stack en Cursor. Espera entender técnicas como usar GPT para crear requisitos de producto, esquemas de base de datos, hojas de ruta y usar esos en notas para generar listas de verificación que guíen el desarrollo de la aplicación. Profundizaremos más en cómo corregir alucinaciones/errores que ocurren, indicaciones útiles para hacer que tu aplicación se vea y se sienta moderna, enfoques para conectar cada capa y más. Al final, ¡espera poder ejecutar tu propia aplicación Full Stack generada por IA en tu máquina!
Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React
React Advanced 2023React Advanced 2023
98 min
Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React
Top Content
Workshop
Richard Moss
Richard Moss
En esta masterclass daremos un recorrido por la IA aplicada desde la perspectiva de los desarrolladores de front end, enfocándonos en las mejores prácticas emergentes cuando se trata de trabajar con LLMs para construir grandes productos. Esta masterclass se basa en los aprendizajes obtenidos al trabajar con la API de OpenAI desde su debut en noviembre pasado para construir un MVP funcional que se convirtió en PowerModeAI (una herramienta de creación de ideas y presentaciones orientada al cliente).
En la masterclass habrá una mezcla de presentación y ejercicios prácticos para cubrir temas que incluyen:
- Fundamentos de GPT- Trampas de los LLMs- Mejores prácticas y técnicas de ingeniería de prompts- Uso efectivo del playground- Instalación y configuración del SDK de OpenAI- Enfoques para trabajar con la API y la gestión de prompts- Implementación de la API para construir una aplicación orientada al cliente potenciada por IA- Ajuste fino y embeddings- Mejores prácticas emergentes en LLMOps