Los Modelos de Lenguaje Grande (LLMs) son poderosos, pero a menudo carecen de conocimiento en tiempo real. La Generación Aumentada por Recuperación (RAG) cierra esta brecha al obtener información relevante de fuentes externas antes de generar respuestas. En esta masterclass, exploraremos cómo construir un pipeline RAG eficiente en Node.js utilizando feeds RSS como fuente de datos. Compararemos diferentes bases de datos vectoriales (FAISS, pgvector, Elasticsearch), métodos de embedding y estrategias de prueba. También cubriremos el papel crucial del chunking: dividir y estructurar datos de manera efectiva para un mejor rendimiento de recuperación.
Requisitos Previos
- Buen entendimiento de JavaScript o TypeScript
- Experiencia con Node.js y desarrollo de API
- Conocimientos básicos de bases de datos y LLMs son útiles pero no requeridos
Agenda
📢 Introducción a RAG
💻 Demo - Aplicación de Ejemplo (RAG con Feeds RSS)
📕 Bases de Datos Vectoriales (FAISS, pgvector, Elasticsearch) y Embeddings
🛠️ Estrategias de Chunking para Mejor Recuperación
🔬 Pruebas y Evaluación de Pipelines RAG (Precisión, Recall, Rendimiento)
🏊♀️ Consideraciones de Rendimiento y Optimización
🥟 Resumen y Preguntas y Respuestas
This workshop has been presented at Node Congress 2025, check out the latest edition of this JavaScript Conference.
Comments