Aplicaciones Web del Futuro con Web AI

Rate this content
Bookmark

La IA está en todas partes, pero ¿por qué deberías preocuparte como desarrollador web? Únete a Jason Mayes, líder de Web AI en Google, quien te pondrá en el camino desmitificando la terminología común para asegurarse de que nadie se quede atrás, y luego te guiará a través de algunos de los últimos modelos de aprendizaje automático, herramientas y frameworks que puedes utilizar directamente en el navegador a través de JavaScript para ayudarte a dar vida a tus ideas creativas de aplicaciones web para casi cualquier industria en la que estés trabajando. Al mover la IA al lado del cliente, no hay dependencia del servidor después de la carga de la página, lo que te brinda beneficios como privacidad, baja latencia, soluciones sin conexión y costos más bajos, que serán de creciente importancia a medida que se desarrolle el campo. Esta charla es adecuada para todos los curiosos de la web y el aprendizaje automático, así que ven y aprende algo nuevo para agregar a tu conjunto de herramientas de ingeniería web para 2024.

This talk has been presented at JSNation 2024, check out the latest edition of this JavaScript Conference.

Jason Mayes
Jason Mayes
32 min
13 Jun, 2024

Comments

Sign in or register to post your comment.
  • Francisco Baptista
    Francisco Baptista
    Great keynote Jason!! TeamSportz is expanding our use of pose estimation to deliver exercises to help athletes recover from injuries. We should talk

Video Summary and Transcription

La IA en JavaScript permite ejecutar modelos de aprendizaje automático en el lado del cliente en un navegador web, ofreciendo ventajas como privacidad, capacidades sin conexión, baja latencia y ahorro de costos. Se pueden utilizar varios modelos de IA para tareas como desenfoque de fondo, detección de toxicidad de texto, extracción de datos 3D, reconocimiento de malla facial, seguimiento de manos, detección de posturas y segmentación corporal. Las bibliotecas de JavaScript como MediaPipe LLM inference API y Visual Blocks facilitan el uso de modelos de IA. La IA web está en sus primeras etapas, pero tiene el potencial de revolucionar las experiencias web y mejorar la accesibilidad.

1. Introducción a Web AI en JavaScript

Short description:

Soy Jason Mayes, líder de Web AI en Google. Comienza a investigar el aprendizaje automático en el lado del cliente en JavaScript para obtener superpoderes en tu próxima aplicación web. Web AI es el arte de utilizar modelos de ML en el lado del cliente en un navegador web, a diferencia de la IA en la nube. En el futuro, todas las industrias aprovecharán la IA. Actualízate en esta área ahora para obtener beneficios únicos en JavaScript.

Soy Jason Mayes, líder de Web AI aquí en Google. Hoy vengo a ti como un ingeniero de JavaScript para compartir contigo una historia sobre por qué deberías comenzar a investigar el aprendizaje automático en el lado del cliente en JavaScript para obtener superpoderes en tu próxima aplicación web.

Primero, definamos formalmente lo que quiero decir con Web AI, que es un término que acuñé en 2022 para destacar frente a los sistemas de IA en la nube que eran populares en ese entonces. Web AI es el arte de utilizar modelos de aprendizaje automático en el lado del cliente en un navegador web, ejecutándose en el procesador o tarjeta gráfica de tu propio dispositivo, utilizando JavaScript y tecnologías web como WebAssembly y WebGPU para aceleración. Esto es diferente de la IA en la nube, donde el modelo se ejecutaría en el lado del servidor y se accedería a través de alguna API, lo que significa que necesitas una conexión a internet activa para comunicarte con esa API en todo momento para obtener las capacidades avanzadas proporcionadas.

Como desarrolladores y diseñadores web, tenemos el privilegio de trabajar en diversas industrias cuando trabajamos con nuestros clientes. De manera similar, es probable que la inteligencia artificial sea aprovechada por todas esas industrias en el futuro para hacerlas más eficientes que nunca. De hecho, en unos años, los clientes esperarán funciones de IA en su próximo producto para mantenerse al día con todos los demás que ya lo están haciendo. Así que ahora es el momento perfecto para actualizarte en esta área, ya que puedes obtener beneficios únicos al hacer esto en el dispositivo en JavaScript.

2. Ventajas de la IA en el lado del cliente en aplicaciones web

Short description:

Privacidad: No es necesario enviar datos al servidor para la clasificación, protegiendo los datos personales del usuario. Capacidad de funcionar sin conexión en el propio dispositivo. Baja latencia que permite la ejecución en tiempo real del modelo. Menor costo al ejecutar IA directamente en el navegador. Experiencia sin fricciones para los usuarios finales. Alcance y escala de la web. Uso creciente de bibliotecas de IA en el lado del cliente. Ejemplo real de una solución de videoconferencia con desenfoque de fondo. Ahorro de costos al utilizar IA en el lado del cliente en la segmentación de video.

¿Qué son esas ventajas? Bueno, primero está la privacidad. Como no es necesario enviar data como la cámara, el micrófono o incluso el texto al servidor para la clasificación, se protegen los datos personales del usuario. Un gran ejemplo de esto es mostrado aquí por include health que utiliza modelos de estimación de postura basados en el navegador para realizar fisioterapia remota sin enviar ninguna imagen a la cloud. En su lugar, solo se envían el rango de movimiento resultante y las estadísticas de la sesión, lo que permite al paciente realizar la consulta desde la comodidad de su propia casa.

También tienes la capacidad de funcionar sin conexión en el propio dispositivo, por lo que incluso puedes realizar tareas en áreas con poca o ninguna conectividad después de cargar la página. Ahora, es posible que te preguntes por qué una aplicación web necesita hacer todas esas cosas sin conexión. Bueno, en este gran ejemplo de Hugo Zanini, realiza una verificación de ubicación de productos utilizando una aplicación web en supermercados para un cliente minorista con el que estaba trabajando. Todos sabemos lo malas que son las conexiones Wi-Fi en los supermercados. Utilizó TensorFlow.js directamente en el navegador, que puede funcionar completamente sin conexión y luego sincroniza los datos cuando tiene conectividad más tarde.

A continuación, está la baja latencia que te permite ejecutar muchos modelos en tiempo real, ya que no tienes que esperar a que los datos se envíen a la cloud y luego obtener una respuesta de vuelta. Por ejemplo, nuestros modelos de cuerpo, postura y segmentación pueden ejecutarse a más de 120 fotogramas por segundo en una computadora portátil con una GPU de gama media con gran precisión, como se puede ver en esta diapositiva. También tienes un menor costo, ya que no necesitas contratar y mantener costosas GPU basadas en la cloud las 24 horas del día, los 7 días de la semana, lo que significa que ahora puedes ejecutar IA generativa directamente en el navegador, como este gran modelo de lenguaje en el lado izquierdo, sin arruinarte. Y estamos viendo a aplicaciones web listas para producción beneficiarse de ahorros significativos de costos también, como se muestra en el ejemplo de características avanzadas de videoconferencia como el desenfoque de fondo que se muestra a la derecha.

Y lo que es aún mejor, puedes ofrecer una experiencia sin fricciones para tus usuarios finales, ya que no se requiere ninguna instalación para ejecutar una página web. Simplemente ve a un enlace y funciona. De hecho, Adobe hizo exactamente eso aquí con Adobe Photoshop web, permitiendo a cualquier persona en cualquier lugar utilizar sus características creativas favoritas en casi cualquier dispositivo. Cuando se trata de la herramienta de selección de objetos que se muestra en esta diapositiva, aprovechar el aprendizaje automático en el lado del cliente puede proporcionar a los usuarios de Adobe una mejor experiencia de usuario al eliminar la latencia del servidor en la cloud, lo que resulta en predicciones más rápidas y una experiencia de usuario más receptiva. Y en ese sentido, también significa que puedes aprovechar el alcance y la escala de la web misma, que cuenta con más de seis mil millones de dispositivos habilitados para navegadores para personas capaces de ver tu creación. Entonces, no importa si estás mejorando tu próxima transmisión en vivo de YouTuber para convertirte en una persona diferente o capturando movimientos faciales detallados para controlar un personaje de juego utilizando nada más que una webcam regular o en el lado del cliente en el navegador, hasta lo último en IA generativa donde incluso puedes ejecutar modelos de difusión en el navegador web a velocidades increíbles con nuevas tecnologías de navegadores como web GPU ahora habilitado de forma predeterminada en Chrome y navegadores basados en Chrome, las cosas están a punto de ponerse realmente emocionantes en lo que podemos esperar de una aplicación web en el futuro.

Incluso si aún no estás utilizando IA en el lado del cliente, quiero ilustrar lo rápido que está creciendo y por qué deberías echarle un vistazo. Solo tengo estadísticas de las bibliotecas de IA web de Google, por lo que es probable que el uso a nivel mundial sea aún mayor que esto, pero en los últimos dos años, hemos promediado 600 millones de descargas por año de TensorFlow.js y modelos y bibliotecas web basadas en medios, lo que nos lleva a más de 1.2 mil millones de descargas en ese tiempo por primera vez, y estamos en camino de superar esa cifra en 2024 con nuestro uso continuo en crecimiento. Así que ahora es realmente el momento de formar parte de este crecimiento tú mismo. De hecho, hemos visto este crecimiento constante desde 2020 a medida que cada vez más desarrolladores, como tú, han comenzado a utilizar IA web en casos de uso de producción. Y hablando de ejemplos del mundo real, profundicemos en una solución típica de videoconferencia.

Ahí van mis notificaciones. Muchos de estos servicios ofrecen desenfoque de fondo o reemplazo de fondo en llamadas de video por motivos de privacidad. Así que vamos a calcular algunos números hipotéticos para el valor de utilizar IA en el lado del cliente en un caso de uso como este. Primero, una webcam produce típicamente video a 30 fotogramas por segundo. Así que suponiendo que la reunión promedio dura unos 30 minutos, eso son 54,000 fotogramas que tienes que procesar en cada reunión. Ahora, supongamos que, si tienes un servicio popular, podrías tener un millón de reuniones al día, lo que significa 54 mil millones de segmentaciones cada día. Incluso si asumimos un costo realmente ultrabajo de solo 0.0001 centavos por segmentación, aún serían $5.4 millones al día que tendrías que gastar en la cloud, lo que equivale a alrededor de $2 mil millones al año solo en costos de GPU.

QnA

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Construyendo un Asistente AI Activado por Voz con Javascript
JSNation 2023JSNation 2023
21 min
Construyendo un Asistente AI Activado por Voz con Javascript
Top Content
This Talk discusses building a voice-activated AI assistant using web APIs and JavaScript. It covers using the Web Speech API for speech recognition and the speech synthesis API for text to speech. The speaker demonstrates how to communicate with the Open AI API and handle the response. The Talk also explores enabling speech recognition and addressing the user. The speaker concludes by mentioning the possibility of creating a product out of the project and using Tauri for native desktop-like experiences.
IA y Desarrollo Web: ¿Exageración o Realidad?
JSNation 2023JSNation 2023
24 min
IA y Desarrollo Web: ¿Exageración o Realidad?
Top Content
This talk explores the use of AI in web development, including tools like GitHub Copilot and Fig for CLI commands. AI can generate boilerplate code, provide context-aware solutions, and generate dummy data. It can also assist with CSS selectors and regexes, and be integrated into applications. AI is used to enhance the podcast experience by transcribing episodes and providing JSON data. The talk also discusses formatting AI output, crafting requests, and analyzing embeddings for similarity.
El Ascenso del Ingeniero de IA
React Summit US 2023React Summit US 2023
30 min
El Ascenso del Ingeniero de IA
The rise of AI engineers is driven by the demand for AI and the emergence of ML research and engineering organizations. Start-ups are leveraging AI through APIs, resulting in a time-to-market advantage. The future of AI engineering holds promising results, with a focus on AI UX and the role of AI agents. Equity in AI and the central problems of AI engineering require collective efforts to address. The day-to-day life of an AI engineer involves working on products or infrastructure and dealing with specialties and tools specific to the field.
Construyendo la IA para Athena Crisis
JS GameDev Summit 2023JS GameDev Summit 2023
37 min
Construyendo la IA para Athena Crisis
Join Christoph from Nakazawa Tech in building the AI for Athena Crisis, a game where the AI performs actions just like a player. Learn about the importance of abstractions, primitives, and search algorithms in building an AI for a video game. Explore the architecture of Athena Crisis, which uses immutable persistent data structures and optimistic updates. Discover how to implement AI behaviors and create a class for the AI. Find out how to analyze units, assign weights, and prioritize actions based on the game state. Consider the next steps in building the AI and explore the possibility of building an AI for a real-time strategy game.
Cobertura de código con IA
TestJS Summit 2023TestJS Summit 2023
8 min
Cobertura de código con IA
Codium is a generative AI assistant for software development that offers code explanation, test generation, and collaboration features. It can generate tests for a GraphQL API in VS Code, improve code coverage, and even document tests. Codium allows analyzing specific code lines, generating tests based on existing ones, and answering code-related questions. It can also provide suggestions for code improvement, help with code refactoring, and assist with writing commit messages.
Qué puede hacer, no puede hacer y no debería hacer la IA en los juegos
C3 Dev Festival 2024C3 Dev Festival 2024
26 min
Qué puede hacer, no puede hacer y no debería hacer la IA en los juegos
AI in game development has evolved rapidly, with generative AI being a focus. However, game developers like Romero Games have concerns about ethics and prefer using AI to automate processes and make creative work easier. AI has been used in games for decades, from path-finding AI to decision trees. Procedural world building and advanced AI technology are pushing the boundaries of FPS games. Different teams within a company have different approaches to the use of AI, depending on their specific needs and requirements.

Workshops on related topic

IA a demanda: IA sin servidor
DevOps.js Conf 2024DevOps.js Conf 2024
163 min
IA a demanda: IA sin servidor
Top Content
Featured WorkshopFree
Nathan Disidore
Nathan Disidore
En esta masterclass, discutimos los méritos de la arquitectura sin servidor y cómo se puede aplicar al espacio de la IA. Exploraremos opciones para construir aplicaciones RAG sin servidor para un enfoque más lambda-esque a la IA. A continuación, nos pondremos manos a la obra y construiremos una aplicación CRUD de muestra que te permite almacenar información y consultarla utilizando un LLM con Workers AI, Vectorize, D1 y Cloudflare Workers.
Aprovechando LLMs para Construir Experiencias de IA Intuitivas con JavaScript
JSNation 2024JSNation 2024
108 min
Aprovechando LLMs para Construir Experiencias de IA Intuitivas con JavaScript
Featured Workshop
Roy Derks
Shivay Lamba
2 authors
Hoy en día, todos los desarrolladores están utilizando LLMs en diferentes formas y variantes, desde ChatGPT hasta asistentes de código como GitHub CoPilot. Siguiendo esto, muchos productos han introducido capacidades de IA integradas, y en este masterclass haremos que los LLMs sean comprensibles para los desarrolladores web. Y nos adentraremos en la codificación de tu propia aplicación impulsada por IA. No se necesita experiencia previa en trabajar con LLMs o aprendizaje automático. En su lugar, utilizaremos tecnologías web como JavaScript, React que ya conoces y amas, al mismo tiempo que aprendemos sobre algunas nuevas bibliotecas como OpenAI, Transformers.js
Masterclass: Qué son y cómo aprovechar los LLMs
React Summit 2024React Summit 2024
66 min
Masterclass: Qué son y cómo aprovechar los LLMs
Featured Workshop
Nathan Marrs
Haris Rozajac
2 authors
Únete a Nathan en esta sesión práctica donde primero aprenderás a alto nivel qué son los modelos de lenguaje grandes (LLMs) y cómo funcionan. Luego sumérgete en un ejercicio de codificación interactivo donde implementarás la funcionalidad de LLM en una aplicación de ejemplo básica. Durante este ejercicio, adquirirás habilidades clave para trabajar con LLMs en tus propias aplicaciones, como la ingeniería de indicaciones y la exposición a la API de OpenAI.
Después de esta sesión, tendrás una idea de qué son los LLMs y cómo se pueden utilizar prácticamente para mejorar tus propias aplicaciones.
Tabla de contenidos:- Demostración interactiva de la implementación de funciones básicas impulsadas por LLM en una aplicación de demostración- Discutir cómo decidir dónde aprovechar los LLMs en un producto- Lecciones aprendidas sobre la integración con OpenAI / descripción general de la API de OpenAI- Mejores prácticas para la ingeniería de indicaciones- Desafíos comunes específicos de React (gestión de estado :D / buenas prácticas de UX)
Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React
React Advanced Conference 2023React Advanced Conference 2023
98 min
Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React
Top Content
Workshop
Richard Moss
Richard Moss
En esta masterclass daremos un recorrido por la IA aplicada desde la perspectiva de los desarrolladores de front end, enfocándonos en las mejores prácticas emergentes cuando se trata de trabajar con LLMs para construir grandes productos. Esta masterclass se basa en los aprendizajes obtenidos al trabajar con la API de OpenAI desde su debut en noviembre pasado para construir un MVP funcional que se convirtió en PowerModeAI (una herramienta de creación de ideas y presentaciones orientada al cliente).
En la masterclass habrá una mezcla de presentación y ejercicios prácticos para cubrir temas que incluyen:
- Fundamentos de GPT- Trampas de los LLMs- Mejores prácticas y técnicas de ingeniería de prompts- Uso efectivo del playground- Instalación y configuración del SDK de OpenAI- Enfoques para trabajar con la API y la gestión de prompts- Implementación de la API para construir una aplicación orientada al cliente potenciada por IA- Ajuste fino y embeddings- Mejores prácticas emergentes en LLMOps
Construyendo Aplicaciones AI para la Web
React Day Berlin 2023React Day Berlin 2023
98 min
Construyendo Aplicaciones AI para la Web
Workshop
Roy Derks
Roy Derks
Hoy en día, cada desarrollador está utilizando LLMs en diferentes formas y figuras. Muchos productos han introducido capacidades AI incorporadas, y en esta masterclass aprenderás cómo construir tu propia aplicación AI. No se necesita experiencia en la construcción de LLMs o en el aprendizaje automático. En cambio, utilizaremos tecnologías web como JavaScript, React y GraphQL que ya conoces y amas.
Construyendo tu Aplicación de IA Generativa
React Summit 2024React Summit 2024
82 min
Construyendo tu Aplicación de IA Generativa
WorkshopFree
Dieter Flick
Dieter Flick
La IA generativa está emocionando a los entusiastas de la tecnología y a las empresas con su vasto potencial. En esta sesión, presentaremos Retrieval Augmented Generation (RAG), un marco que proporciona contexto a los Modelos de Lenguaje Grande (LLMs) sin necesidad de volver a entrenarlos. Te guiaremos paso a paso en la construcción de tu propia aplicación RAG, culminando en un chatbot completamente funcional.
Conceptos Clave: IA Generativa, Retrieval Augmented Generation
Tecnologías: OpenAI, LangChain, AstraDB Vector Store, Streamlit, Langflow