Versión en EspañolES

Utiliza el aprendizaje automático... ¡y diviértete con ello!

Google Developer Expert in Web Technologies

El aprendizaje automático es visto por muchos como el siguiente paso en la inteligencia artificial hacia una nueva etapa de la evolución humana. Y así nos ayuda a encontrar nuevos enfoques para resolver problemas del mundo real. Uf... Eso suena complejo... ¿Y cómo se supone que eso es divertido? Bueno, además de los grandes problemas de nuestro tiempo, al final es solo otra herramienta con la que podemos jugar. Si bien es importante entender primero los conceptos básicos del aprendizaje automático, podemos ir mucho más allá rápidamente. ¡Prepárate para algunos ejemplos inesperados de cómo comenzar con el aprendizaje automático en tu aplicación de React!

This talk has been presented at React Summit 2023, check out the latest edition of this React Conference.

FAQ

Nico es un desarrollador frontend independiente de Suiza y forma parte del programa Google Developer Experts para tecnologías web, especializándose en nuevas tecnologías para navegadores.

TensorFlow.js es una plataforma de aprendizaje automático de código abierto que permite usar modelos pre-entrenados, entrenar nuevos modelos o ampliar modelos existentes directamente en el navegador usando JavaScript.

Nico encontró desafiante el uso repetitivo de ciertas palabras en sus charlas en suizo alemán. Para abordar esto, exploró el uso de la API de Reconocimiento de Voz y el aprendizaje automático para detectar estas palabras específicas durante sus presentaciones.

El aprendizaje automático puede ser utilizado para entrenar un modelo con ejemplos de audio, convirtiendo segmentos de audio en espectrogramas (imágenes) que luego se comparan con espectrogramas de nuevas entradas de audio para detectar palabras específicas.

Nico utilizó Teachable Machine, una aplicación web de Google que permite entrenar modelos de reconocimiento de imagen o audio con datos de entrada personalizados directamente en el navegador.

TensorFlow.js utiliza varios backends dependiendo del navegador y sistema operativo. Nico menciona WebGL como el backend más eficiente disponible en la mayoría de los navegadores y WebGPU, aunque este último requiere características experimentales en Chrome Canary.

En su última charla, Nico implementó un modelo de aprendizaje automático entrenado para detectar palabras específicas. Cada vez que estas palabras eran pronunciadas, se activaba un zumbador, demostrando la efectividad del modelo en tiempo real.

Nico recomienda el curso gratuito de Jason Maes sobre Machine Learning para desarrolladores web, disponible en Google, para aquellos interesados en profundizar en el aprendizaje automático aplicado a la web.

react machine learning

Nico Martin

9 min

06 Jun, 2023

Comments

Video Summary and Transcription

Nico, un desarrollador frontend independiente y parte del programa de Expertos en Desarrolladores de Google, ofrece una introducción al aprendizaje automático en el navegador. Explica cómo el aprendizaje automático difiere de los algoritmos tradicionales y destaca el uso de TensorFlow.js para implementar el aprendizaje automático en el navegador. La charla también cubre el uso de diferentes backends, como WebGL, y la conversión de audio en espectrogramas para la comparación de modelos. Nico menciona el uso de superposición para mejorar la precisión de detección y la disponibilidad de detección de comandos de voz y entrenamiento de modelos personalizados con TensorFlow. En general, la charla enfatiza los beneficios de utilizar y entrenar modelos de aprendizaje automático directamente en el dispositivo.

Available in English: useMachineLearning… and Have Fun with It!

1. Introducción al Aprendizaje Automático en el Navegador

Short description:

Hola a todos. Soy Nico, un desarrollador frontend independiente de Suiza y parte del programa Google Developer Experts. Hoy les daré una breve introducción al aprendizaje automático en el navegador. De manera clásica, definimos reglas y condiciones para los algoritmos, pero el aprendizaje automático adopta un enfoque diferente al entrenar los algoritmos con datos de entrada y salida. TensorFlow.js nos permite utilizar el aprendizaje automático directamente en el navegador con JavaScript.

Hola a todos. Mi nombre es Nico. Soy un desarrollador frontend independiente de Suiza. También formo parte del programa Google Developer Experts para tecnologías web, lo que básicamente significa que paso demasiado tiempo libre jugando con todo tipo de nuevas tecnologías para navegadores.

Y hoy estoy aquí para darles una breve introducción al aprendizaje automático en el navegador. En los últimos años he dado muchas charlas, principalmente en inglés, algunas en alemán, pero solo dos charlas en Baden Dich, que es nuestro dialecto suizo alemán local. Ahora, en septiembre de 2021, di mi primera charla en suizo alemán, que afortunadamente fue grabada. Permítanme mostrarles un breve clip de eso. Y así sucesivamente. Como pueden ver, logré usar la palabra schlussendlich e im Endeffekt más de 35 veces en unos 30 minutos, lo cual fue extremadamente molesto para mí después. Ambas palabras básicamente significan finalmente o al final.

Ahora, en febrero de 2023, mi segunda charla en Bandage estaba a la vuelta de la esquina y era enormemente importante para mí encontrar una forma de detener esto. Así que busqué formas de detectar esas palabras en mi discurso. Lo más obvio sería utilizar la API de Reconocimiento de Voz en el navegador. El problema aquí es que esto funciona bastante bien para el alemán, pero no para el suizo alemán o incluso para Bandage. Pero nuevamente, el reconocimiento de voz no es más que modelos de aprendizaje automático, ¿verdad? Y ¿no podemos ejecutarlos directamente en el navegador? Por supuesto que sí.

En esta charla relámpago no podré profundizar en los detalles, pero quiero darles una breve descripción general. En el núcleo, el aprendizaje automático es un enfoque completamente diferente para escribir algoritmos. De manera clásica, cuando intentamos escribir un algoritmo para resolver un problema, definiríamos un conjunto de reglas y condiciones y luego pasaríamos una entrada y obtendríamos una salida. Y eso funciona muy bien para problemas simples, pero tan pronto como tenemos una entrada más compleja data, necesitamos una nueva forma de procesarla. Y el aprendizaje automático adopta este enfoque diferente. Aquí la idea es entrenar el algoritmo con una entrada y salida predefinidas y luego el algoritmo encuentra patrones por sí mismo. Esto significa que tenemos muchos datos de entrada y la salida esperada. Ahora la máquina aprende a predecir la salida esperada de una entrada similar. Este algoritmo entrenado es el núcleo del aprendizaje automático y se llama modelo. Y ahí es donde entra en juego TensorFlow. TensorFlow es una plataforma de aprendizaje automático de código abierto de extremo a extremo que te permite utilizar modelos pre-entrenados existentes, pero también entrenar nuevos modelos o ampliar modelos existentes con tu propio caso de uso. Y desde 2019, con TensorFlow.js, incluso podemos usarlo directamente en el navegador con JavaScript. Ahora, al igual que cualquier tarea de aprendizaje automático, TensorFlow.js depende de operaciones matemáticas bastante complejas. Estas operaciones se procesan en los llamados backends.

2. Aprendizaje Automático en el Navegador

Short description:

La web puede utilizar diferentes backends, como WebGL, para el aprendizaje automático. El audio se puede convertir en espectrogramas para comparar con modelos. Una superposición puede mejorar la precisión de detección. TensorFlow ofrece detección de comandos de voz y permite entrenar modelos personalizados con Teachable Machine. El aprendizaje automático en el navegador permite usar y entrenar modelos directamente en el dispositivo.

Por ahora, la web puede utilizar un par de backends diferentes dependiendo del navegador y el sistema operativo. La forma más eficiente sería utilizar el backend WebGPU, pero eso requiere la API WebGPU que solo está disponible en Chrome Canary detrás de la bandera. Así que en mi ejemplo, estoy utilizando WebGL, que es el backend más eficiente que está disponible en la mayoría de los navegadores en este momento.

Ahora, probablemente todos hayamos visto ejemplos básicos de reconocimiento de imágenes, como en este caso la detección de puntos de referencia faciales, donde podemos dar una imagen como entrada y luego recibir la posición de los puntos clave en la cara. Y las imágenes funcionan bastante bien con el aprendizaje automático porque al final, los modelos de aprendizaje automático esperan una entrada numérica y devuelven una salida, y las imágenes no son más que los valores numéricos RGB en un rectángulo 2D.

Ahora, en mi caso, quiero reconocer ciertas palabras, y bueno, las palabras no son imágenes, ¿verdad? Excepto cuando lo son. Así que al final, cada fragmento de audio se puede convertir en un espectrograma, y imaginemos que tenemos 100 grabaciones de mí diciendo las palabras a Sandler. Ahora tenemos 100 imágenes de este clip de dos segundos que ahora podemos comparar con el espectrograma de mi charla. Ahora, por supuesto, es difícil comparar un espectrograma de toda la charla que crece con el tiempo con mi clip de dos segundos, pero podemos dividir la pista completa en partes de dos segundos y comparar esos dos segundos con nuestro modelo. El problema aquí es que perderemos muchas palabras, porque no podemos estar seguros de que la división realmente corte una palabra completa. La solución aquí sería agregar una superposición. En este caso, tenemos una superposición de 0.5, lo que significa que tenemos más imágenes por segundo para analizar. Cuanto mayor sea la superposición, más imágenes habrá para analizar y más precisa será la detección. En mi ejemplo, incluso necesité una superposición de 0.95 para obtener un resultado significativo.

Ahora, similar a la detección de puntos de referencia faciales, TensorFlow también ofrece detección de comandos de voz, y al igual que antes, podemos importarlo, podemos crear un reconocedor y podemos comenzar a escuchar. El modelo predeterminado busca un par de palabras clave predefinidas, pero por supuesto, mis palabras en suizo alemán no están en esa lista, así que necesito entrenar mi propio modelo. Con Teachable Machine, Google publicó una aplicación web que te permite entrenar tu propio modelo de imagen o audio basado en tus propios datos de entrada. En la derecha puedes ver mis datos de entrenamiento, donde tengo alrededor de una hora de mí hablando como la clase de fondo, y luego tenemos 50 y 70 ejemplos de las dos palabras clave que quiero detectar. Y con Teachable Machine, ahora puedo entrenar los datos en el navegador y simplemente genera el modelo para mí. Ahora, todo lo que necesito hacer es pasar el modelo creado y los metadatos a la función Create y ahora usará el nuevo modelo para detectar mi entrada personalizada. Mis diapositivas se están ejecutando en el navegador y ahora puedo activar el oyente. Eso puede llevar algo de tiempo. Ahora, cada vez que digo palabras como MandEffect, activará el zumbador. Y en realidad funcionó bastante bien en mi última charla en suizo alemán. Así que realmente espero haberlos inspirado con esta breve visión del aprendizaje automático en el navegador para que podamos usar modelos, entrenar nuevos modelos, todo directamente en el dispositivo en el navegador. Para obtener más y un conocimiento más profundo, también puedo recomendar el curso gratuito de Jason Maes de Google Machine Learning para desarrolladores web. Y con esto, me gustaría agradecerles por su interés y les deseo un buen resto de la conferencia. ¡Adiós!

Available in other languages:

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Una Guía del Comportamiento de Renderizado de React

React Advanced 2022

25 min

Una Guía del Comportamiento de Renderizado de React

Top Content

Mark Erikson

Replay.io

This transcription provides a brief guide to React rendering behavior. It explains the process of rendering, comparing new and old elements, and the importance of pure rendering without side effects. It also covers topics such as batching and double rendering, optimizing rendering and using context and Redux in React. Overall, it offers valuable insights for developers looking to understand and optimize React rendering.

react performance deep dive react rendering

Construyendo Mejores Sitios Web con Remix

React Summit Remote Edition 2021

33 min

Construyendo Mejores Sitios Web con Remix

Top Content

Michael Jackson

React Training

Remix is a web framework built on React Router that focuses on web fundamentals, accessibility, performance, and flexibility. It delivers real HTML and SEO benefits, and allows for automatic updating of meta tags and styles. It provides features like login functionality, session management, and error handling. Remix is a server-rendered framework that can enhance sites with JavaScript but doesn't require it for basic functionality. It aims to create quality HTML-driven documents and is flexible for use with different web technologies and stacks.

react remix frameworks

Compilador React Forget - Entendiendo React Idiomático

React Advanced 2023

33 min

Compilador React Forget - Entendiendo React Idiomático

Top Content

2 authors

The Talk discusses React Forget, a compiler built at Meta that aims to optimize client-side React development. It explores the use of memoization to improve performance and the vision of Forget to automatically determine dependencies at build time. Forget is named with an F-word pun and has the potential to optimize server builds and enable dead code elimination. The team plans to make Forget open-source and is focused on ensuring its quality before release.

react build tools builders and founders react 19 react forget

Uso efectivo de useEffect

React Advanced 2022

30 min

Uso efectivo de useEffect

Top Content

David Khourshid

Stately

Today's Talk explores the use of the useEffect hook in React development, covering topics such as fetching data, handling race conditions and cleanup, and optimizing performance. It also discusses the correct use of useEffect in React 18, the distinction between Activity Effects and Action Effects, and the potential misuse of useEffect. The Talk highlights the benefits of using useQuery or SWR for data fetching, the problems with using useEffect for initializing global singletons, and the use of state machines for handling effects. The speaker also recommends exploring the beta React docs and using tools like the stately.ai editor for visualizing state machines.

react best practices state management react hook missing dependency

Enrutamiento en React 18 y más allá

React Summit 2022

20 min

Enrutamiento en React 18 y más allá

Top Content

Delba de Oliveira

Senior Developer Advocate @ Vercel

Routing in React 18 brings a native app-like user experience and allows applications to transition between different environments. React Router and Next.js have different approaches to routing, with React Router using component-based routing and Next.js using file system-based routing. React server components provide the primitives to address the disadvantages of multipage applications while maintaining the same user experience. Improving navigation and routing in React involves including loading UI, pre-rendering parts of the screen, and using server components for more performant experiences. Next.js and Remix are moving towards a converging solution by combining component-based routing with file system routing.

react next.js patterns react file based routing

Concurrencia en React, Explicada

React Summit 2023

23 min

Concurrencia en React, Explicada

Top Content

Ivan Akulov

Google Developer Expert, Web Performance Consultant, Netherlands

React 18's concurrent rendering, specifically the useTransition hook, optimizes app performance by allowing non-urgent updates to be processed without freezing the UI. However, there are drawbacks such as longer processing time for non-urgent updates and increased CPU usage. The useTransition hook works similarly to throttling or bouncing, making it useful for addressing performance issues caused by multiple small components. Libraries like React Query may require the use of alternative APIs to handle urgent and non-urgent updates effectively.

react performance best practices react 18 deep dive react concurrent mode

Workshops on related topic

Masterclass de Depuración de Rendimiento de React

React Summit 2023

170 min

Masterclass de Depuración de Rendimiento de React

Top Content

Featured Workshop

Ivan Akulov

Los primeros intentos de Ivan en la depuración de rendimiento fueron caóticos. Vería una interacción lenta, intentaría una optimización aleatoria, vería que no ayudaba, y seguiría intentando otras optimizaciones hasta que encontraba la correcta (o se rendía).
En aquel entonces, Ivan no sabía cómo usar bien las herramientas de rendimiento. Haría una grabación en Chrome DevTools o React Profiler, la examinaría, intentaría hacer clic en cosas aleatorias, y luego la cerraría frustrado unos minutos después. Ahora, Ivan sabe exactamente dónde y qué buscar. Y en esta masterclass, Ivan te enseñará eso también.
Así es como va a funcionar. Tomaremos una aplicación lenta → la depuraremos (usando herramientas como Chrome DevTools, React Profiler, y why-did-you-render) → identificaremos el cuello de botella → y luego repetiremos, varias veces más. No hablaremos de las soluciones (en el 90% de los casos, es simplemente el viejo y regular useMemo() o memo()). Pero hablaremos de todo lo que viene antes - y aprenderemos a analizar cualquier problema de rendimiento de React, paso a paso.
(Nota: Esta masterclass es más adecuada para ingenieros que ya están familiarizados con cómo funcionan useMemo() y memo() - pero quieren mejorar en el uso de las herramientas de rendimiento alrededor de React. Además, estaremos cubriendo el rendimiento de la interacción, no la velocidad de carga, por lo que no escucharás una palabra sobre Lighthouse 🤐)

react performance best practices advanced debug react debugger react performance react profiler

Next.js para Desarrolladores de React.js

React Day Berlin 2023

157 min

Next.js para Desarrolladores de React.js

Top Content

Featured WorkshopFree

Adrian Hajdin

En esta avanzada masterclass de Next.js, profundizaremos en conceptos clave y técnicas que permiten a los desarrolladores de React.js aprovechar al máximo Next.js. Exploraremos temas avanzados y prácticas prácticas, equipándote con las habilidades necesarias para construir aplicaciones web de alto rendimiento y tomar decisiones arquitectónicas informadas.
Al final de esta masterclass, serás capaz de:1. Comprender los beneficios de los Componentes del Servidor React y su papel en la construcción de aplicaciones React interactivas, renderizadas por el servidor.2. Diferenciar entre el tiempo de ejecución de Edge y Node.js en Next.js y saber cuándo usar cada uno en función de los requisitos de tu proyecto.3. Explorar técnicas avanzadas de Renderizado del Lado del Servidor (SSR), incluyendo streaming, fetching paralelo vs. secuencial, y sincronización de datos.4. Implementar estrategias de caché para mejorar el rendimiento y reducir la carga del servidor en las aplicaciones Next.js.5. Utilizar Acciones React para manejar la mutación compleja del servidor.6. Optimizar tus aplicaciones Next.js para SEO, compartir en redes sociales, y rendimiento general para mejorar la descubrabilidad y la participación del usuario.

react nextjs react

Aventuras de Renderizado Concurrente en React 18

React Advanced 2021

132 min

Aventuras de Renderizado Concurrente en React 18

Top Content

Featured Workshop

Maurice de Beijer

Con el lanzamiento de React 18 finalmente obtenemos el tan esperado renderizado concurrente. Pero, ¿cómo va a afectar eso a tu aplicación? ¿Cuáles son los beneficios del renderizado concurrente en React? ¿Qué necesitas hacer para cambiar al renderizado concurrente cuando actualices a React 18? ¿Y qué pasa si no quieres o no puedes usar el renderizado concurrente todavía?

¡Hay algunos cambios de comportamiento de los que debes estar al tanto! En esta masterclass cubriremos todos esos temas y más.

Acompáñame con tu portátil en esta masterclass interactiva. Verás lo fácil que es cambiar al renderizado concurrente en tu aplicación React. Aprenderás todo sobre el renderizado concurrente, SuspenseList, la API startTransition y más.

react concurrent rendering react 18 react concurrent mode react suspense

Consejos sobre React Hooks que solo los profesionales conocen

React Summit Remote Edition 2021

177 min

Consejos sobre React Hooks que solo los profesionales conocen

Top Content

Featured Workshop

Maurice de Beijer

La adición de la API de hooks a React fue un cambio bastante importante. Antes de los hooks, la mayoría de los componentos tenían que ser basados en clases. Ahora, con los hooks, estos son a menudo componentes funcionales mucho más simples. Los hooks pueden ser realmente simples de usar. Casi engañosamente simples. Porque todavía hay muchas formas en las que puedes equivocarte con los hooks. Y a menudo resulta que hay muchas formas en las que puedes mejorar tus componentes con una mejor comprensión de cómo se puede usar cada hook de React.Aprenderás todo sobre los pros y los contras de los diversos hooks. Aprenderás cuándo usar useState() versus useReducer(). Veremos cómo usar useContext() de manera eficiente. Verás cuándo usar useLayoutEffect() y cuándo useEffect() es mejor.

react best practices react hooks deep dive react 18 hooks react profiler

Presentando FlashList: Construyamos juntos una lista performante en React Native

React Advanced 2022

81 min

Presentando FlashList: Construyamos juntos una lista performante en React Native

Top Content

Featured Workshop

3 authors

En esta masterclass aprenderás por qué creamos FlashList en Shopify y cómo puedes usarlo en tu código hoy. Te mostraremos cómo tomar una lista que no es performante en FlatList y hacerla performante usando FlashList con mínimo esfuerzo. Usaremos herramientas como Flipper, nuestro propio código de benchmarking, y te enseñaremos cómo la API de FlashList puede cubrir casos de uso más complejos y aún así mantener un rendimiento de primera categoría.Sabrás:- Breve presentación sobre qué es FlashList, por qué lo construimos, etc.- Migrando de FlatList a FlashList- Enseñando cómo escribir una lista performante- Utilizando las herramientas proporcionadas por la biblioteca FlashList (principalmente el hook useBenchmark)- Usando los plugins de Flipper (gráfico de llamas, nuestro perfilador de listas, perfilador de UI & JS FPS, etc.)- Optimizando el rendimiento de FlashList utilizando props más avanzados como `getType`- 5-6 tareas de muestra donde descubriremos y solucionaremos problemas juntos- Preguntas y respuestas con el equipo de Shopify

react react native react native flashlist

React, TypeScript y TDD

React Advanced 2021

174 min

React, TypeScript y TDD

Top Content

Featured Workshop

Paul Everitt

ReactJS es extremadamente popular y, por lo tanto, ampliamente soportado. TypeScript está ganando popularidad y, por lo tanto, cada vez más soportado.

¿Los dos juntos? No tanto. Dado que ambos cambian rápidamente, es difícil encontrar materiales de aprendizaje precisos.

¿React+TypeScript, con los IDEs de JetBrains? Esa combinación de tres partes es el tema de esta serie. Mostraremos un poco sobre mucho. Es decir, los pasos clave para ser productivo, en el IDE, para proyectos de React utilizando TypeScript. En el camino, mostraremos el desarrollo guiado por pruebas y enfatizaremos consejos y trucos en el IDE.

react best practices typescript devtools web development test driven development react