Enhancing AI with RAG

Rate this content
Bookmark
Slides

La generación aumentada por recuperación (RAG) proporciona a los modelos de lenguaje grandes información actualizada y les ayuda a alucinar menos. Pero, ¿cómo funciona todo bajo la superficie?


En esta sesión de codificación en vivo, construiremos los componentes de un sistema RAG desde cero en JavaScript. (¡Aparte del LLM, probablemente no haya tiempo para eso!) Al construir el nuestro, entenderemos la vectorización, la búsqueda de similitud y el papel de los modelos de incrustación y las bases de datos vectoriales. Luego lo conectaremos todo para ver a nuestro bot aumentado en acción.


Obtendrás una buena base en los componentes de chatbots exitosos y por qué funcionan.

This talk has been presented at JSNation US 2024, check out the latest edition of this JavaScript Conference.

Phil Nash
Phil Nash
20 min
21 Nov, 2024

Comments

Sign in or register to post your comment.
Video Summary and Transcription
La charla de hoy explora el concepto de generación aumentada por recuperación (RAG) y su aplicación en la construcción de chatbots. RAG implica dar a los modelos de lenguaje más contexto al recuperar datos relevantes. Esto se logra creando vectores para cada charla y usando la similitud coseno para compararlos. La charla enfatiza las limitaciones de los vectores basados en palabras y los beneficios de usar modelos de incrustación y bases de datos vectoriales. Al reemplazar los modelos basados en palabras con búsqueda vectorial, el contenido puede ser ordenado y recuperado de manera más eficiente. RAG, junto con modelos de lenguaje grandes e IA, tiene el potencial de mejorar la escalabilidad y desatar nuevas posibilidades.
Available in English: Build RAG from Scratch

1. Introducción y Contexto

Short description:

Hoy vamos a hablar sobre cómo construir un rag desde cero. Los modelos de lenguaje grandes tienen el problema de no tener acceso a datos actualizados e información privada. Descubramos cómo podemos darles el contexto necesario.

¿Qué tal a todos? Mi nombre es Fonash y soy un ingeniero de relaciones con desarrolladores en una empresa llamada Datastacks. Si alguna vez quieren encontrarme en línea, pueden encontrarme en todas partes como Fonash en Twitter, en LinkedIn. Vengan y conéctense conmigo, me encantaría charlar con ustedes.

Pero entremos en la charla. Hoy vamos a hablar sobre cómo construir un rag desde cero, y para lidiar con eso, primero tendremos que averiguar qué es un rag. Todo esto se trata de la IA generativa, y si han tratado con modelos de lenguaje grandes, ya sea usando aplicaciones de consumo o intentando desarrollar usando sus APIs, sabrán que tienen un par de problemas. Uno de ellos es que no conocen ningún dato actualizado, porque tienen una fecha de corte de entrenamiento, y por lo tanto no pueden saber nada más allá de la fecha en que dejaron de entrenar. Y el segundo es que no conocen ninguna información privada, y eso es algo bueno. No queremos que conozcan nuestra información privada necesariamente. Ciertamente no queremos que hayan sido entrenados con nuestra información privada.

2. Retrieval Augmented Generation

Short description:

Voy a mostrarte una demostración del AI studio de Google hablando con Gemini Flash. El modelo no puede proporcionar información en tiempo real y sugiere consultar el sitio web oficial. Si pregunto sobre oradores o eventos específicos, el bot no tiene acceso a esa información debido a limitaciones de entrenamiento.

Solo quiero mostrarte eso como una demostración. Tengo el AI studio de Google aquí hablando con Gemini Flash, uno de sus modelos, y voy a preguntar qué está pasando en JS Nation US? Y no puede saber esto, porque fue entrenado mucho antes y dice que no tiene acceso a información en tiempo real. Podrías también consultar el sitio web oficial. Es un buen consejo, pero no es un bot muy útil. También podríamos, ya sabes, este es un bot construido con mi propia cosa, y así esto también está llamando a la API de Gemini 1.5 Flash, y si le pregunto qué está hablando Phil Nash sobre JS Nation, también, simplemente no va a saber esto. No sabe nada sobre mí. Necesita más información para responder esa pregunta. Y eso es justo. No lo sabe. Fue más allá de su fecha de corte de entrenamiento.

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Construyendo un Asistente AI Activado por Voz con Javascript
JSNation 2023JSNation 2023
21 min
Construyendo un Asistente AI Activado por Voz con Javascript
Top Content
This Talk discusses building a voice-activated AI assistant using web APIs and JavaScript. It covers using the Web Speech API for speech recognition and the speech synthesis API for text to speech. The speaker demonstrates how to communicate with the Open AI API and handle the response. The Talk also explores enabling speech recognition and addressing the user. The speaker concludes by mentioning the possibility of creating a product out of the project and using Tauri for native desktop-like experiences.
IA y Desarrollo Web: ¿Exageración o Realidad?
JSNation 2023JSNation 2023
24 min
IA y Desarrollo Web: ¿Exageración o Realidad?
Top Content
This talk explores the use of AI in web development, including tools like GitHub Copilot and Fig for CLI commands. AI can generate boilerplate code, provide context-aware solutions, and generate dummy data. It can also assist with CSS selectors and regexes, and be integrated into applications. AI is used to enhance the podcast experience by transcribing episodes and providing JSON data. The talk also discusses formatting AI output, crafting requests, and analyzing embeddings for similarity.
El Ascenso del Ingeniero de IA
React Summit US 2023React Summit US 2023
30 min
El Ascenso del Ingeniero de IA
Top Content
The rise of AI engineers is driven by the demand for AI and the emergence of ML research and engineering organizations. Start-ups are leveraging AI through APIs, resulting in a time-to-market advantage. The future of AI engineering holds promising results, with a focus on AI UX and the role of AI agents. Equity in AI and the central problems of AI engineering require collective efforts to address. The day-to-day life of an AI engineer involves working on products or infrastructure and dealing with specialties and tools specific to the field.
El Flujo de Trabajo del Desarrollador Asistido por IA: Construye Más Rápido e Inteligente Hoy
JSNation US 2024JSNation US 2024
31 min
El Flujo de Trabajo del Desarrollador Asistido por IA: Construye Más Rápido e Inteligente Hoy
AI is transforming software engineering by using agents to help with coding. Agents can autonomously complete tasks and make decisions based on data. Collaborative AI and automation are opening new possibilities in code generation. Bolt is a powerful tool for troubleshooting, bug fixing, and authentication. Code generation tools like Copilot and Cursor provide support for selecting models and codebase awareness. Cline is a useful extension for website inspection and testing. Guidelines for coding with agents include defining requirements, choosing the right model, and frequent testing. Clear and concise instructions are crucial in AI-generated code. Experienced engineers are still necessary in understanding architecture and problem-solving. Energy consumption insights and sustainability are discussed in the Talk.
TensorFlow.js 101: Aprendizaje automático en el navegador y más allá
ML conf EU 2020ML conf EU 2020
41 min
TensorFlow.js 101: Aprendizaje automático en el navegador y más allá
TensorFlow.js enables machine learning in the browser and beyond, with features like face mesh, body segmentation, and pose estimation. It offers JavaScript prototyping and transfer learning capabilities, as well as the ability to recognize custom objects using the Image Project feature. TensorFlow.js can be used with Cloud AutoML for training custom vision models and provides performance benefits in both JavaScript and Python development. It offers interactivity, reach, scale, and performance, and encourages community engagement and collaboration between the JavaScript and machine learning communities.
Aplicaciones Web del Futuro con Web AI
JSNation 2024JSNation 2024
32 min
Aplicaciones Web del Futuro con Web AI
Web AI in JavaScript allows for running machine learning models client-side in a web browser, offering advantages such as privacy, offline capabilities, low latency, and cost savings. Various AI models can be used for tasks like background blur, text toxicity detection, 3D data extraction, face mesh recognition, hand tracking, pose detection, and body segmentation. JavaScript libraries like MediaPipe LLM inference API and Visual Blocks facilitate the use of AI models. Web AI is in its early stages but has the potential to revolutionize web experiences and improve accessibility.

Workshops on related topic

IA a demanda: IA sin servidor
DevOps.js Conf 2024DevOps.js Conf 2024
163 min
IA a demanda: IA sin servidor
Top Content
Featured WorkshopFree
Nathan Disidore
Nathan Disidore
En esta masterclass, discutimos los méritos de la arquitectura sin servidor y cómo se puede aplicar al espacio de la IA. Exploraremos opciones para construir aplicaciones RAG sin servidor para un enfoque más lambda-esque a la IA. A continuación, nos pondremos manos a la obra y construiremos una aplicación CRUD de muestra que te permite almacenar información y consultarla utilizando un LLM con Workers AI, Vectorize, D1 y Cloudflare Workers.
AI para Desarrolladores de React
React Advanced 2024React Advanced 2024
142 min
AI para Desarrolladores de React
Featured Workshop
Eve Porcello
Eve Porcello
El conocimiento de las herramientas de AI es fundamental para preparar el futuro de las carreras de los desarrolladores de React, y la suite de herramientas de AI de Vercel es una vía de acceso accesible. En este curso, examinaremos más de cerca el Vercel AI SDK y cómo esto puede ayudar a los desarrolladores de React a construir interfaces de transmisión con JavaScript y Next.js. También incorporaremos APIs de terceros adicionales para construir y desplegar una aplicación de visualización de música.
Temas:- Creación de un Proyecto de React con Next.js- Elección de un LLM- Personalización de Interfaces de Transmisión- Construcción de Rutas- Creación y Generación de Componentes - Uso de Hooks (useChat, useCompletion, useActions, etc)
Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React
React Advanced 2023React Advanced 2023
98 min
Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React
Top Content
Workshop
Richard Moss
Richard Moss
En esta masterclass daremos un recorrido por la IA aplicada desde la perspectiva de los desarrolladores de front end, enfocándonos en las mejores prácticas emergentes cuando se trata de trabajar con LLMs para construir grandes productos. Esta masterclass se basa en los aprendizajes obtenidos al trabajar con la API de OpenAI desde su debut en noviembre pasado para construir un MVP funcional que se convirtió en PowerModeAI (una herramienta de creación de ideas y presentaciones orientada al cliente).
En la masterclass habrá una mezcla de presentación y ejercicios prácticos para cubrir temas que incluyen:
- Fundamentos de GPT- Trampas de los LLMs- Mejores prácticas y técnicas de ingeniería de prompts- Uso efectivo del playground- Instalación y configuración del SDK de OpenAI- Enfoques para trabajar con la API y la gestión de prompts- Implementación de la API para construir una aplicación orientada al cliente potenciada por IA- Ajuste fino y embeddings- Mejores prácticas emergentes en LLMOps
Construyendo Aplicaciones AI para la Web
React Day Berlin 2023React Day Berlin 2023
98 min
Construyendo Aplicaciones AI para la Web
Workshop
Roy Derks
Roy Derks
Hoy en día, cada desarrollador está utilizando LLMs en diferentes formas y figuras. Muchos productos han introducido capacidades AI incorporadas, y en esta masterclass aprenderás cómo construir tu propia aplicación AI. No se necesita experiencia en la construcción de LLMs o en el aprendizaje automático. En cambio, utilizaremos tecnologías web como JavaScript, React y GraphQL que ya conoces y amas.
Construyendo tu Aplicación de IA Generativa
React Summit 2024React Summit 2024
82 min
Construyendo tu Aplicación de IA Generativa
WorkshopFree
Dieter Flick
Dieter Flick
La IA generativa está emocionando a los entusiastas de la tecnología y a las empresas con su vasto potencial. En esta sesión, presentaremos Retrieval Augmented Generation (RAG), un marco que proporciona contexto a los Modelos de Lenguaje Grande (LLMs) sin necesidad de volver a entrenarlos. Te guiaremos paso a paso en la construcción de tu propia aplicación RAG, culminando en un chatbot completamente funcional.
Conceptos Clave: IA Generativa, Retrieval Augmented Generation
Tecnologías: OpenAI, LangChain, AstraDB Vector Store, Streamlit, Langflow
Building Your Own GenAI Agent Application
React Summit US 2024React Summit US 2024
87 min
Building Your Own GenAI Agent Application
WorkshopFree
Amit Mandelbaum
Idan Rozin
2 authors
Los agentes GenAI son una de las direcciones más prometedoras para aplicaciones complejas basadas en GenAI. Estos agentes pueden buscar en la web, codificar y realizar tareas complejas de manera completamente autónoma para el usuario. En esta masterclass aprenderemos los conceptos básicos de los agentes GenAI. Definiremos los términos y marcos básicos y entenderemos cómo se diferencian del uso tradicional de LLMs.Entenderemos las técnicas de prompting para agentes LLM y específicamente la técnica de React prompting para agentes de IA (no confundir con React el lenguaje de programación). Construiremos, desde cero, nuestro propio agente GenAI que puede interactuar con el usuario, realizar búsquedas en la web y codificar y ejecutar en Javascript.Tabla de contenidos:- Introducción a los agentes GenAI- Entendiendo el marco de React- Construcción práctica de un agente GenAI simple- Despliegue del Agente con streamlit- Consejos y marcos para desarrollar agentes GenAI