De hecho, vectorizará las consultas por ti si lo configuras para hacerlo. Así que no tienes que preocuparte por hacer dos llamadas diferentes. Puedes simplemente permitir que la base de datos maneje la vectorización por ti. Y eso es realmente genial.
Solo quiero mostrar una demostración rápida en la que voy a eliminar nuestro modelo de bolsa de palabras. Eso es con lo que estábamos lidiando allí porque se basaba completamente en las palabras. Reemplázalo con búsqueda vectorial, que es esa consulta que acabamos de ver allí. Vamos a vectorizar esto al entrar. Ya guardé todas estas charlas en AstroDB, y ahora podemos ordenar usando nuestra consulta vectorizada y obtener un conjunto de cosas similares.
Y así, si ahora voy y miro de qué está hablando Phil Ash, va a hacer esa ordenación, hacer esa búsqueda y encontrar que la similitud de esa consulta, de qué está hablando Phil Ash, con mi charla es 0.72. Aunque en realidad habla de ello, también tiene similitud con otras cosas. Si miramos AI y desarrolladores, vamos a obtener puntuaciones muy similares a cosas como la charla de Addy, como la charla de Tober Lindbergh, como vimos. Y esta es una puntuación de similitud mucho mejor, una captura mucho mejor de cómo funciona todo.
Y así, si ahora preguntara de qué está hablando Phil Ash, todavía está usando esa similitud para simplemente devolver lo que tenemos. Y si digo quién está hablando, pero AI y desarrolladores, obtenemos esa misma lista. Pero ahora sabemos que en realidad estamos usando un modelo real para esto. Estamos usando una base de datos real para esto, por lo que es mucho más escalable y utilizable a largo plazo. Y eso es RAG, eso es Generación Aumentada por Recuperación.
Lo que hicimos aquí fue construir una idea muy pobre de un vector que fue realmente útil para nosotros ver, creo, cómo capturar el significado como una lista de números es útil para nosotros y cómo podemos luego compararlos. Luego reemplazamos eso usando modelos reales de aprendizaje automático para hacer la captura de significado y usando una base de datos para hacer la ordenación de una manera mucho más eficiente. Pero hay mucho más en esto. Si quieres investigar más sobre RAG, entonces hay formas alternativas de hacer embeddings vectoriales como Colbert. Hay formas alternativas de almacenar cosas en una base de datos, como usar un sistema RAG de grafos basado en el contenido. Acabo de compartir algunas otras publicaciones de blog que he escrito aquí, como una donde usé la ordenación por similitud para crear publicaciones relacionadas en un blog, en este caso un blog de Astro, Astro y Astra juntos, bastante divertido. Así que eso es todo lo que tengo para ti. Nuevamente, mi nombre es Phil Nash, soy un Ingeniero de Relaciones con Desarrolladores en Datastacks. Espero que disfrutes el resto de JSNation US. Nuevamente, encuéntrame en línea, soy Phil Nash por todas partes, o escanea este código QR para las diapositivas. Espero que puedas salir y explorar usando RAG, usando grandes modelos de lenguaje y construyendo con IA. Muchas gracias.
Comments