Versión en EspañolES

[EN] DeepPavlov Agent: Open-source Framework for Multiskill Conversational AI
[ES] DeepPavlov Agent: Marco de código abierto para IA conversacional multihabilidad

DeepPavlov Agent: Marco de código abierto para IA conversacional multihabilidad

DeepPavlov Agent es un marco diseñado para facilitar el desarrollo de asistentes virtuales multi-habilidad escalables y listos para producción, sistemas de diálogo complejos y chatbots. Las características clave de DeepPavlov Agent incluyen (1) escalabilidad y confiabilidad en entornos de alta carga debido a la arquitectura de microservicios; (2) facilidad para agregar y orquestar habilidades conversacionales; (3) memoria compartida de estado de diálogo y anotaciones de NLP accesibles para todas las habilidades.

DeepPavlov DREAM es una plataforma de socialbot con un diseño modular con componentes principales como anotadores, habilidades y selectores que se ejecutan como servicios independientes. Estos componentes se configuran e implementan utilizando contenedores Docker. Permite a los desarrolladores centrarse en el desarrollo de aplicaciones en lugar de enfocarse en los detalles intrínsecos de la configuración de infraestructura manual a nivel bajo.

This talk has been presented at ML conf EU 2020, check out the latest edition of this Tech Conference.

FAQ

El Agente Pavlov es un marco de código abierto para IA conversacional multi-habilidad desarrollado en el Instituto de Física y Tecnología de Moscú. Su propósito es permitir la creación y orquestación de múltiples habilidades conversacionales en sistemas de diálogo, facilitando así la construcción de asistentes digitales más complejos y eficientes.

La multi-habilidad es crucial porque la experiencia del cliente abarca múltiples dominios, como encuestas, promociones y soporte técnico. Cada dominio requiere habilidades específicas, por lo que un sistema multi-habilidad puede manejar diversas tareas y proporcionar una interacción más completa y útil con los usuarios.

En un sistema de diálogo modular, la entrada del usuario se procesa primero para detectar el dominio, la intención y las entidades. Esta información se utiliza para crear un marco semántico que el Gestor de Diálogos usa para actualizar el estado del diálogo y decidir la acción sistémica a tomar, que luego se convierte en lenguaje natural mediante un módulo de generación de lenguaje.

El ciclo de vida comienza con un Producto Mínimo Viable (MVP) que luego se despliega para interactuar con los usuarios. A medida que el sistema gana complejidad y se identifican nuevas necesidades, se agregan más características y scripts. El proyecto Pavlov busca ir más allá, permitiendo la fácil integración de nuevas habilidades conversacionales a medida que el sistema se expande.

La arquitectura del Agente Pavlov, basada en microservicios, permite una escalabilidad eficiente y la integración de habilidades conversacionales como servicios independientes. Esto facilita la gestión del desarrollo por equipos distribuidos, mejora la organización y permite la reutilización y extensión de habilidades previamente desarrolladas.

La Biblioteca Deep Pavlov es una biblioteca de código abierto para construir tuberías de procesamiento del lenguaje natural y habilidades conversacionales. Se utiliza para crear componentes que luego pueden ser orquestados por el Agente Pavlov en un sistema de IA conversacional, permitiendo así la creación de asistentes digitales más robustos y versátiles.

machine learning

Mikhail Burtsev

27 min

02 Jul, 2021

Comments

Video Summary and Transcription

El Agente Pavlov es un marco de código abierto para IA conversacional multihabilidad, que aborda la necesidad de habilidades específicas en diferentes dominios. La arquitectura de microservicios permite la escalabilidad y reutilización de habilidades. La Biblioteca Deep Pavlov permite la creación de tuberías de procesamiento de lenguaje natural (NLP) para diferentes habilidades. Deep Pavlov Dream sirve como un repositorio de habilidades y plantillas, mientras que el Agente de Implementación orquesta todos los componentes para una experiencia conversacional perfecta. DeepLove.AI ofrece más flexibilidad y personalización en comparación con el servicio LUIS de Microsoft.

Available in English: DeepPavlov Agent: Open-source Framework for Multiskill Conversational AI

1. Introducción a Pavlov Agent

Short description:

Hola, mi nombre es Mikhail Burtsev, y soy fundador y líder del proyecto Pavlov en el Instituto de Física y Tecnología de Moscú. Hoy les hablaré sobre el Agente Pavlov, un marco de código abierto para IA conversacional multi-habilidad. La multi-habilidad es importante porque la experiencia del cliente abarca múltiples dominios y, para abordar cada dominio, se necesitan habilidades específicas. Los sistemas de conversación tradicionales utilizan un sistema de diálogo modular, donde las indicaciones del usuario se convierten a forma textual y se procesan mediante un módulo de comprensión del lenguaje natural. El Gestor de Diálogos actualiza el estado del diálogo y realiza acciones basadas en el estado actual. Los sistemas actuales se basan en redes neuronales, modelos de aprendizaje profundo y reglas para la gestión del diálogo y la generación del lenguaje natural. El ciclo de vida del asistente de IA comienza con un Producto Mínimo Viable, que incluye modelos pre-entrenados para NLU y scripts para el Gestor de Diálogos.

Hola, mi nombre es Mikhail Burtsev, y soy fundador y líder del proyecto Pavlov en el Instituto de Física y Tecnología de Moscú. Y hoy les hablaré sobre el Agente Pavlov, que es un marco de código abierto para IA conversacional multi-habilidad. Así que comencemos con una pregunta, ¿por qué es tan importante la multi-habilidad? Es importante porque la experiencia del cliente abarca múltiples dominios, como encuestas, promociones, campañas, servicio al cliente, soporte técnico y muchos otros. Y generalmente, para abordar cada dominio, se necesita una habilidad específica. Por eso necesitamos construir un asistente digital multi-habilidades, y necesitamos tener múltiples habilidades conversacionales en nuestro sistema. Y si observamos los asistentes de comercio electrónico, como los sistemas de diálogo complejos modernos. Por ejemplo, aquí tenemos el caso de Alimia Assist, que es un asistente en AliExpress. Entonces puedes ver aquí que es un sistema híbrido con muchas habilidades diferentes. Por ejemplo, tenemos este servicio de asistente con un motor de llenado de espacios, y tenemos servicio al cliente con un motor de gráficos de conocimiento, y tenemos servicio de chat con un motor de chat. Así que ves que es una combinación de algunas reglas comerciales, de escenarios escritos y con habilidades específicas que abordan diferentes necesidades del cliente.

Entonces, ¿cuál es la forma tradicional de construir sistemas de conversación en la actualidad? El enfoque más dominante es el llamado sistema de diálogo modular. ¿Cómo funciona? Tenemos al usuario, el usuario tiene alguna indicación para el sistema, y esta indicación se convierte a forma textual y se alimenta al módulo de comprensión del lenguaje natural, que realiza básicamente tres funciones. Detección de dominio, detección de intención y detección de entidades en la entrada del usuario. Y luego, después de este preprocesamiento, tenemos una descripción formal de la entrada del usuario, que también se llama marco semántico, donde tenemos la intención, aquí es solicitar una película, y tenemos las entidades. En esta solicitud, es comedia general y fin de semana. Y luego, toda esta información va al Gestor de Diálogos. Y la tarea del Gestor de Diálogos es primero actualizar el estado de diálogo actual, para que esté actualizado, para integrar esta nueva información en el historial previo del diálogo, y luego, con este estado de diálogo actualizado, realizar la acción necesaria en el lado del sistema.

Entonces, consta del estado de diálogo y de la política, o guion, que decide qué acción se debe seleccionar, dada la situación actual del diálogo. Y aquí en nuestro ejemplo tenemos la acción que es solicitar ubicación. Pero esta acción está en alguna representación interna del sistema. Y necesitamos convertir esta acción en la indicación de lenguaje natural. Y aquí tenemos el último módulo de nuestro sistema, que es la generación de lenguaje natural. Que crea la forma superficial de nuestra solicitud para los usuarios. Así que, con la acción de solicitar ubicación, tenemos como resultado en lenguaje natural `¿Dónde estás?`. Así es básicamente cómo se construyen los sistemas actuales. Y principalmente en esta parte de la entrevista, tenemos muchas redes neuronales, modelos de aprendizaje profundo, que se utilizan aquí, y en la parte del Gestor de Diálogos, tenemos algunas redes neuronales y muchas reglas y diálogos escritos. Y también para la generación de lenguaje natural, principalmente tenemos modelos de recuperación con algún llenado de espacios o plantillas.

Bien, entonces, ¿cuál es el ciclo de vida del asistente de IA? ¿Cómo construimos nuestro asistente digital, nuestros sistemas de diálogo, con esta tecnología modular? Por lo general, comenzamos con un Producto Mínimo Viable (MVP). Para NLU, tenemos algunas características y algunos modelos pre-entrenados para este dominio, y en el lado del Gestor de Diálogos, tenemos algunos scripts y es muy agradable y claro architecture, y entendemos cómo funciona.

2. Ventajas de la Descomposición de la Complejidad

Short description:

Queremos ir más allá del techo de complejidad de la tecnología actual mediante la descomposición de la complejidad entre el agente y las habilidades conversacionales. Nuestra arquitectura de microservicios permite la escalabilidad y la reutilización de habilidades existentes. Con la Biblioteca Deep Pavlov, podemos construir tuberías de procesamiento del lenguaje natural y combinar diferentes componentes en habilidades conversacionales para dominios y tareas específicas.

Cubre los aspectos más importantes de la interacción entre el sistema y el usuario. Y luego, desplegamos este MVP en producción y este sistema comienza a interactuar con los usuarios. Y aquí, entendemos que necesitamos aumentar la cobertura del sistema porque los usuarios hacen las mismas preguntas de manera diferente debido a la variabilidad del lenguaje, por lo que necesitamos agregar más características y hacer que nuestra comprensión del lenguaje natural sea más compleja.

Y también queremos cubrir más funciones, por lo que agregamos más scripts en el lado de nuestro gestor de diálogos. Y luego, continuamos con más características y más scripts, más características, más scripts, llegamos a la llamada etapa principal del asistente de IA, que en realidad es un desorden de características y scripts. Y esta es una solución que ya alcanza la complejidad máxima debido a todos estos componentes interdependientes. Así que ahora estás en una posición en la que no puedes hacer crecer tu producto más.

Y lo que queremos hacer con nuestro marco, con el Agente Deep Pavlov, es romper esta imagen. Queremos ir más allá de este techo de complejidad de la tecnología actual. Así que en nuestra visión, el ciclo de vida del sistema de IA comienza con el mismo MVP simple, claro y agradable. Y luego, lo que haces, lo pruebas y luego lo agregas al sistema ya desplegado como una de las habilidades conversacionales. Y luego, si quieres agregar más funcionalidad a tu sistema, simplemente creas una nueva habilidad conversacional y la agregas a tu agente. Esto te permite descomponer la complejidad entre el agente, que es básicamente un marco de orquestación de habilidades, y las habilidades conversacionales. Y esto te proporciona una arquitectura de microservicios muy agradable, que se puede escalar en un sistema de IA mayor mucho más complejo.

Y también te brinda muchas características interesantes. Por ejemplo, puedes tener habilidades predeterminadas. No necesitas desarrollarlas tú mismo. Solo necesitas conectar tus propias habilidades. Y es, como dije, una arquitectura muy escalable porque cada habilidad se despliega como un microservicio. Y también es muy práctico porque cuando creas un nuevo producto o quieres crear nuevas habilidades, que son similares a las que ya tienes, simplemente puedes reutilizar las antiguas y ampliarlas para la nueva función o integrarlas en tu producto. Y lo que también es importante en nuestra cultura de desarrollo global en este momento, es que generalmente las soluciones complejas se construyen con equipos distribuidos. Y esta arquitectura de orquestación de habilidades y estructura modular de tu agente conversacional te permite distribuir el mantenimiento y desarrollo de habilidades separadas a diferentes equipos separados. Esto hace que tu trabajo y coordinación entre habilidades sea mucho más organizado y eficiente. Así que esto es lo que queremos, esta es nuestra visión. Lo que queremos hacer es tener habilidades conversacionales y tener un nivel de orquestación conversacional. Entonces, lo que estamos haciendo ahora mismo para implementar esta visión. Así que hemos comenzado con la Biblioteca Deep Pavlov. La Biblioteca Deep Pavlov es una biblioteca de código abierto para construir tuberías de procesamiento del lenguaje natural y habilidades conversacionales para la IA conversacional. Entonces puedes tener modelos específicos de NLP como reconocimiento de entidades nombradas, resolución de correferencia, reconocimiento de intención y autodetección, respuesta a preguntas, política de diálogo, historial de diálogo, modelos de lenguaje, y así sucesivamente. Y luego, con nuestro marco, puedes combinar estos diferentes componentes en habilidades conversacionales para dominios y tareas específicas, como aquí.

3. Deep Pavlov Agent Framework and DreamSocialBot

Short description:

Tenemos habilidades orientadas a tareas, habilidades factorizadas y habilidades de conversación informal, todas orquestadas por el marco del agente Deep Pavlov. Un ejemplo de esta arquitectura es el DreamSocialBot, construido para la competencia Alexa Prize. La entrada del usuario es procesada por los anotadores, que extraen información y actualizan el estado del diálogo. Un selector de habilidades determina las habilidades más relevantes, y un subconjunto de estas habilidades se ejecuta para producir candidatos de respuesta. Los anotadores de candidatos garantizan la seguridad del usuario, y un selector de respuestas realiza la selección final. Este sistema multi-habilidad se ejecuta de forma asíncrona, con la biblioteca Deep Pavlov como base para crear tuberías de procesamiento del lenguaje natural.

Podemos tener habilidades orientadas a tareas, como reservas de restaurantes. Podemos tener habilidades factorizadas, que te permiten responder a una pregunta factorizada, y podemos tener habilidades de conversación informal. Y luego, tenemos el marco del agente Deep Pavlov, que orquesta estas habilidades.

Y como ejemplo de esta arquitectura, me gustaría presentarte la arquitectura de DreamSocialBot, que está construido con Deep Pavlov y el marco del agente Deep Pavlov para la competencia Alexa Prize, el Desafío Alexa Prize. Y nuestro equipo, como es un equipo universitario, participamos el año pasado en el Desafío Alexa y fuimos seleccionados como uno de los 10 equipos de entre 350 solicitudes para desarrollar una solución que se alojará dentro de Amazon Alexa y que puede ser invocada por Alexa Chat Commons. Así que usamos nuestro agente Deep Pavlov para construir este DreamSocialbot. Así que echemos un vistazo a cómo funciona.

Entonces, primero tenemos la entrada del usuario. Y esta entrada del usuario va a los llamados anotadores. Es la primera etapa del procesamiento. Los anotadores actuales también están implementados como tuberías de procesamiento del lenguaje natural de Deep Pavlov y se ejecutan como microservicios y se utilizan para extraer información de la entrada del usuario. Después de eso, esta entrada del usuario anotada pasa al estado del diálogo y el estado del diálogo es como una memoria compartida entre todos los microservicios como anotadores o habilidades, etc. Entonces, esta entrada del usuario anotada y el estado actual del diálogo son utilizados por un selector de habilidades para decidir qué habilidades son más relevantes para el estado actual del diálogo. Y aquí, para la competencia, hemos desarrollado alrededor de 25 habilidades diferentes y algunas para uso para el clima, películas, libros, como chat general, etc.

Y luego, como dije, solo se selecciona un subconjunto de estas habilidades y estas habilidades se ejecutan y producen candidatos de respuesta. Cada habilidad produce un candidato de respuesta y cierta confianza en su propia respuesta. Y todos estos candidatos van a los anotadores de candidatos. Necesitamos que estos anotadores se aseguren de que no haya candidatos que puedan ser perjudiciales para nuestros usuarios. Así que realizamos la detección de toxicidad, la detección de terminación del diálogo y el filtrado de la lista negra de los candidatos de respuesta. Después de eso, tenemos candidatos de respuesta anotados y realizamos la selección final. Así que tenemos un selector de respuestas que realiza la selección final de la salida final de nuestro sistema. Y esta respuesta también puede ser anotada posteriormente y presentada a los usuarios. Y como puedes ver, en realidad es un sistema multi-habilidad y todos los elementos de nuestra tubería se ejecutan de forma asíncrona. Por lo tanto, todos los anotadores y habilidades se ejecutan de forma asíncrona como microservicios con solo dos puntos de sincronización, que son el selector de habilidades y el selector de respuestas y nuestro estado de diálogo, como dije, sirve como una memoria compartida. Y lo que tenemos ahora mismo, lo que queremos construir, en realidad tenemos lo que podemos llamar un ecosistema de Deep Pavlov. Es un ecosistema de nuestros productos y en el lado izquierdo aquí, puedes ver nuestra biblioteca Deep Pavlov, que es una biblioteca para crear tuberías de procesamiento del lenguaje natural. Y también puedes incluir modelos de procesamiento del lenguaje natural de terceros, como Hugging Face Transformers o NVIDIA NIMU, como componentes de tus tuberías de procesamiento del lenguaje natural. Y luego, puedes implementar todas estas tuberías de procesamiento del lenguaje natural como microservicios en la nube. Por ejemplo, para tu asistente de IA, estos pueden ser anotadores o algunos componentes deNLP. Y luego tenemos lo que llamamos el sueño de Deep Pavlov.

4. Deep Pavlov Dream and Deployment Agent

Short description:

Queremos abrir nuestros conocimientos y ofrecerlos como una distribución predeterminada para agentes conversacionales. Puedes reutilizar nuestros conocimientos y agregar tus propias habilidades orientadas a tareas. El sueño de Deep Pavlov es un repositorio de diferentes habilidades y plantillas, que permite la integración de habilidades de terceros. El agente Pavlov orquesta todos los componentes para producir la experiencia conversacional final. Nuestro objetivo es crear un centro abierto para el intercambio de habilidades, facilitando y acelerando el desarrollo. Nuestra biblioteca DeepPowell integra modelos de aprendizaje automático en tuberías de procesamiento del lenguaje natural y resuelve problemas de habilidades conversacionales. Ofrecemos una solución única con nuestro Deployment Agent para la orquestación de múltiples habilidades.

¿Por qué llamamos a esto el sueño de Deep Pavlov? Porque lo que queremos hacer es abrir nuestros conocimientos, que hemos desarrollado para la competencia, y hacerlos de código abierto para proporcionar una distribución predeterminada para agentes conversacionales que pueda ser utilizada por otros. Entonces, no necesitas desarrollar tu propia habilidad de chit chat o habilidades básicas como el clima, entre otras. Para tu solución, simplemente puedes reutilizar nuestros conocimientos y luego agregar tus propias habilidades orientadas a tareas.

Como dije, el sueño de Deep Pavlov es un repositorio de diferentes habilidades o plantillas. Y también puedes utilizar habilidades de terceros aquí, porque nuestra architecture te permite integrar otras habilidades a través de una API. Así que puedes usar Rasa o habilidades de IA/ML en tu tubería como parte del sueño de Pavlov. Luego, ejecutas todas estas habilidades como microservicios. Y en el centro tenemos el agente Pavlov, que realiza la orquestación de todos estos componentes, anotadores y habilidades, para producir la experiencia conversacional final de tu asistente de IA.

Como dije, lo que queremos hacer es crear algo que se pueda ver como un sistema operativo de código abierto pero aquí no tenemos un sistema operativo, sino un sistema de conversación o diálogo porque tenemos algunas aplicaciones y estas aplicaciones son habilidades conversacionales y tenemos algunos servicios como anotadores y tenemos la user experience. Así que puedes agregar tus aplicaciones para mejorar la user experience. Y también queremos crear un centro abierto para el intercambio de habilidades para facilitar la vida de cada desarrollador de asistentes conversacionales complejos, porque al intercambiar algunas habilidades de propósito general se facilita mucho más el desarrollo de la solución y la prototipación de tus agentes conversacionales complejos.

Ahora, si observamos la pila de tecnologías de IA conversacional, en la parte inferior de esta pila tenemos plataformas de aprendizaje automático como PyTorch y TensorFlow. Luego tenemos frameworks de procesamiento del lenguaje natural (NLP) que integran modelos de aprendizaje automático en las tuberías de NLP y aquí tenemos SpaCy, Transformers y NVIDIA NIMR, e incluso Stanford NLP, y nuestra biblioteca DeepPowell pertenece a este nivel de frameworks de NLP. Pero no solo a este nivel, también forma parte del nivel de habilidades conversacionales porque puedes crear una tubería de NLP en DeepPowell que resuelve exactamente el problema de la habilidad conversacional.

En este nivel de habilidades conversacionales, tenemos Rasa, Pandora Bots o LMONT. Estos son frameworks para crear habilidades conversacionales separadas. Y luego, en el nivel más alto, en el nivel de orquestación de múltiples habilidades, creo que en el dominio de código abierto, ofrecemos una solución única en este momento. Es nuestro Deployment Agent, que es un marco para la orquestación de habilidades conversacionales. Con él, puedes implementar y gestionar tus habilidades y orquestar para proporcionar una experiencia de usuario muy agradable. Esta imagen muestra toda la línea de nuestro marco que estamos construyendo para crear nuestra solución de código abierto para la IA conversacional, una solución de código abierto de extremo a extremo para la IA conversacional. Así que gracias por tu atención. Eso es todo. Y estaré encantado de responder tus preguntas. Gracias. Hola, una vez más. Hola, gracias por unirte hoy y dar esta increíble charla.

5. Comparison with Microsoft LUIS

Short description:

DeepLove.AI es completamente de código abierto, lo que proporciona más flexibilidad en comparación con el servicio de comprensión del lenguaje (LUIS) de Microsoft. Si bien hay una curva de aprendizaje más pronunciada, nuestro marco permite una mayor personalización y control sobre los componentes.

Tenemos algunas preguntas de la audiencia. ¿Empezamos de inmediato? Sí. Muy bien. Bueno, la primera pregunta es en realidad de mi co-presentador, AJ, y le gustaría saber, ¿cómo comparas DeepLove AI con otros sistemas de IA conversacional, como los construidos con el servicio de comprensión del lenguaje de Microsoft, por ejemplo? Lo siento. Perdón, ¿puedes repetir la pregunta? ¿Cómo compararías DeepLove.AI con otros sistemas de IA conversacional, como los construidos con el servicio de comprensión del lenguaje de Microsoft, LUIS, por ejemplo? De acuerdo. La diferencia principal aquí es que nuestro proyecto es completamente de código abierto. Con Microsoft LUIS, no tienes tanta flexibilidad como con nuestro marco, y por supuesto, con esta flexibilidad, hay un costo para dominar todos los componentes. Por lo tanto, necesitas un mejor conocimiento de los componentes para construir algo similar a lo que puedes construir en LUIS, y así sucesivamente. Sí, por lo tanto, hay una curva de aprendizaje más pronunciada, pero eres más flexible. Sí. Sí, muy bien. La siguiente pregunta es de un miembro de la audiencia llamado Nick. Quiere saber cuáles serán los pasos para integrar DeepPath de un Agente como un chatbot para el servicio de soporte al cliente. También puede haber anotadores para la localización. Actualmente, DeepPath of an Agent se puede integrar a través de la API, por lo que necesitas simplemente como un servicio REST, puedes usarlo como un servicio REST. Y también tiene muchos componentes como anotadores y habilidades, y estas habilidades pueden usar algunos data de tus bases de datos internas. Y en este caso, también debes proporcionar tus propios conectores para enviar los data de tu database dentro de tus habilidades conversacionales. Y tenemos envoltorios para Telegram y para Amazon Alexa, pero si es para tu empresa y si no estás usando Telegram, por ejemplo, y estás usando tu propio widget de sitio web o chatbot, como una interfaz web construida por ti, entonces debes usar esta API REST, creo. De acuerdo. Siguiente pregunta. Los chatbots de IA generalmente dan respuestas graciosas/raras en conversaciones extendidas, incluso los basados en modelos de lenguaje. ¿Cuánto tiempo crees que tomará para que podamos esperar oraciones coherentes en conversaciones largas utilizando, por supuesto, deeplove.ai? Creo que aquí deberíamos hablar de dos tipos de habilidades conversacionales. En DeepPavlov, tienes una architecture de múltiples habilidades, donde diferentes habilidades pueden implementarse con diferentes tecnologías de fondo. Por lo general, si tienes algo como GPT-free o alguna pregunta y respuesta basada en modelos de lenguaje, tienes un control muy débil sobre lo que obtienes como respuesta. Pero, en otros casos, puedes usar IA/ML u otros enfoques, que te permiten tener plantillas más estrictamente definidas para tus respuestas. Y en este caso, controlas lo que dice tu bot. Tal vez no cubra una amplia gama de temas, pero luego en un dominio estrecho, tendrás respuestas muy sensatas. En Deep Pavlov, puedes integrar tanto enfoques basados en reglas como generación neuronal, y luego decidir en el estado actual del diálogo cuál es el más apropiado para tu usuario, tratando de combinar ambos enfoques. El primero es basado en reglas y guiones, donde controlas el flujo del diálogo, y por otro lado, es generación neuronal, donde puedes tener respuestas mucho más graciosas y mucho más variables, pero pueden perder coherencia después de cierto número de términos de conversación. De acuerdo, muchas gracias. Otra pregunta es de mi co-presentador Sergey. Como diriges un laboratorio de investigación, ¿qué opinas de OpenAI? ¿Ayuda a acelerar la investigación? Creo que juega un papel en ambos lados, acelerando la investigación y también generando expectativas en la investigación, porque comenzaron creando OpenAI Gym, y es un conjunto muy bueno de tareas para el aprendizaje por refuerzo, y muchas personas las utilizan, y es muy bueno. Pero luego lanzaron, o no lanzaron GPT-2, y comenzaron una discusión y promoción de sus resultados sin abrir la solución. Y esto parece un poco extraño, es una organización un poco extraña porque, por un lado, tiene objetivos de producir investigación abierta, pero por otro lado, tiene reglas muy estrictas para no publicar algo y usarlo para obtener ganancias. Por lo tanto, no está claro para la community cómo entender los objetivos de OpenAI en este momento. De acuerdo. Creo que eso es todo el tiempo que tenemos ahora para esta sesión de preguntas y respuestas, pero si las personas aún tienen preguntas o quieren profundizar en Deep Bath Love, entonces estarás en tu sala de oradores, ¿verdad? Así que las personas pueden unirse allí en Spatial.Chat y sí, ahora me gustaría agradecerte por tu tiempo e invitarte a ir a tu sala de oradores.

Available in other languages:

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

TensorFlow.js 101: Aprendizaje automático en el navegador y más allá

ML conf EU 2020

41 min

TensorFlow.js 101: Aprendizaje automático en el navegador y más allá

Jason Mayes

Web AI Lead at Google.

TensorFlow.js enables machine learning in the browser and beyond, with features like face mesh, body segmentation, and pose estimation. It offers JavaScript prototyping and transfer learning capabilities, as well as the ability to recognize custom objects using the Image Project feature. TensorFlow.js can be used with Cloud AutoML for training custom vision models and provides performance benefits in both JavaScript and Python development. It offers interactivity, reach, scale, and performance, and encourages community engagement and collaboration between the JavaScript and machine learning communities.

tensorflow machine learning innovation tensorflow react

Transformers.js: Machine Learning de Última Generación para la Web

JSNation 2025

27 min

Transformers.js: Machine Learning de Última Generación para la Web

Joshua Lochner

Hugging Face

Joshua introduces Transformers JS and Hugging Face, emphasizing community collaboration and pre-trained models. Transformers JS evolution led to 1.4 million monthly users, supporting 155 architectures. The library's browser-based capabilities offer real-time processing, cost-efficiency, and scalability. Integration enhancements include native web GPU execution and React Native implementation. Web ML implementation focuses on Onyx Runtime for device execution and web GPU for resource optimization. Browser-based ML applications cover vision, speech recognition, and text-to-speech. Advanced implementations include multimodal applications and educational tools. Interactive AI demonstrations showcase semantic search and conversational AI scenarios. Model licensing transitions to ECMAScript for efficiency and model redownloading factors are discussed.

machine learning webgpu

Uso de MediaPipe para Crear Aplicaciones de Aprendizaje Automático Multiplataforma con React

React Advanced 2021

21 min

Uso de MediaPipe para Crear Aplicaciones de Aprendizaje Automático Multiplataforma con React

Workshops on related topic

¿Pueden los LLM aprender? Personalicemos un LLM para chatear con tus propios datos

C3 Dev Festival 2024

48 min

¿Pueden los LLM aprender? Personalicemos un LLM para chatear con tus propios datos

WorkshopFree

Andreia Ocanoaia

Sientes las limitaciones de los LLMs? Pueden ser creativos, pero a veces carecen de precisión o se basan en información desactualizada. En esta masterclass, desglosaremos el proceso de construir y desplegar fácilmente un sistema de Generación con Recuperación Mejorada. Este enfoque te permite aprovechar el poder de los LLMs con el beneficio adicional de precisión factual e información actualizada.

machine learning artificial intelligence openai

Aprovechando LLMs para Construir Experiencias de IA Intuitivas con JavaScript

JSNation 2024

108 min

Aprovechando LLMs para Construir Experiencias de IA Intuitivas con JavaScript

Workshop

2 authors

Hoy en día, todos los desarrolladores están utilizando LLMs en diferentes formas y variantes, desde ChatGPT hasta asistentes de código como GitHub CoPilot. Siguiendo esto, muchos productos han introducido capacidades de IA integradas, y en este masterclass haremos que los LLMs sean comprensibles para los desarrolladores web. Y nos adentraremos en la codificación de tu propia aplicación impulsada por IA. No se necesita experiencia previa en trabajar con LLMs o aprendizaje automático. En su lugar, utilizaremos tecnologías web como JavaScript, React que ya conoces y amas, al mismo tiempo que aprendemos sobre algunas nuevas bibliotecas como OpenAI, Transformers.js

machine learning artificial intelligence openai

Deja que la IA sea tu Documentación

JSNation 2024

69 min

Deja que la IA sea tu Documentación

Workshop

Jesse Hall

Únete a nuestro masterclass dinámico para crear un portal de documentación impulsado por IA. Aprende a integrar ChatGPT de OpenAI con Next.js 14, Tailwind CSS y tecnología de vanguardia para ofrecer soluciones de código e resúmenes instantáneos. Esta sesión práctica te equipará con el conocimiento para revolucionar la forma en que los usuarios interactúan con la documentación, convirtiendo las búsquedas tediosas en descubrimientos eficientes e inteligentes.
Aspectos destacados:
- Experiencia práctica en la creación de un sitio de documentación impulsado por IA.- Comprensión de la integración de la IA en las experiencias de usuario.- Habilidades prácticas con las últimas tecnologías de desarrollo web.- Estrategias para implementar y mantener recursos de documentación inteligente.
Tabla de contenidos:- Introducción a la IA en la documentación- Configuración del entorno- Construcción de la estructura de documentación- Integración de ChatGPT para documentación interactiva

frameworks machine learning artificial intelligence

Prácticas con TensorFlow.js

ML conf EU 2020

160 min

Prácticas con TensorFlow.js

Workshop

Jason Mayes

Ven y descubre nuestro masterclass que te guiará a través de 3 recorridos comunes al usar TensorFlow.js. Comenzaremos demostrando cómo usar uno de nuestros modelos predefinidos, clases de JS muy fáciles de usar para trabajar rápidamente con ML. Luego veremos cómo volver a entrenar uno de estos modelos en minutos utilizando el aprendizaje por transferencia en el navegador a través de Teachable Machine y cómo se puede usar en tu propio sitio web personalizado. Finalmente, terminaremos con un hola mundo escribiendo tu propio código de modelo desde cero para hacer una regresión lineal simple y predecir los precios ficticios de las casas en función de sus metros cuadrados.

tensorflow machine learning

La Guía del Autoestopista de la Galaxia de Ingeniería de Aprendizaje Automático

ML conf EU 2020

112 min

La Guía del Autoestopista de la Galaxia de Ingeniería de Aprendizaje Automático

Workshop

Alyona Galyeva

¿Eres un Ingeniero de Software al que se le asignó la tarea de implementar un modelo de aprendizaje automático o aprendizaje profundo por primera vez en tu vida? ¿Te preguntas qué pasos seguir y cómo se diferencia el software impulsado por IA del software tradicional? Entonces este es el masterclass adecuado al que asistir.
Internet ofrece miles de artículos y cursos gratuitos que muestran lo fácil que es entrenar e implementar un modelo de IA simple. Al mismo tiempo, en la realidad es difícil integrar un modelo real en la infraestructura actual, depurarlo, probarlo, implementarlo y monitorearlo correctamente. En este masterclass, te guiaré a través de este proceso compartiendo consejos, trucos y herramientas de código abierto favoritas que te facilitarán mucho la vida. Así que al final del masterclass, sabrás por dónde empezar tu viaje de implementación, qué herramientas utilizar y qué preguntas hacer.

machine learning

Introducción al Aprendizaje Automático en la Nube

ML conf EU 2020

146 min

Introducción al Aprendizaje Automático en la Nube

Workshop

Dmitry Soshnikov

Este masterclass será tanto una introducción suave al Aprendizaje Automático, como un ejercicio práctico de uso de la nube para entrenar modelos de aprendizaje automático simples y no tan simples. Comenzaremos utilizando ML Automático para entrenar el modelo para predecir la supervivencia en el Titanic, y luego pasaremos a tareas de aprendizaje automático más complejas como la optimización de hiperparámetros y la programación de series de experimentos en el clúster de cómputo. Finalmente, mostraré cómo Azure Machine Learning se puede utilizar para generar pinturas artificiales utilizando Redes Generativas Adversarias, y cómo entrenar un modelo de preguntas y respuestas de lenguaje en documentos de COVID para responder preguntas relacionadas con COVID.

azure machine learning