Versión en EspañolES

ML en el Edge

El mundo está lleno de miles de millones de teléfonos inteligentes pequeños, conectados, inteligentes y eficientes en el cálculo. ¿Qué pasaría si pudiéramos aprovechar este poder y hacer más en el edge? Resulta que el aprendizaje automático encaja perfectamente aquí. Vamos a explorar la biblioteca MLKit para incorporar inteligencia en aplicaciones de react-native.

This talk has been presented at React Summit Remote Edition 2020, check out the latest edition of this React Conference.

FAQ

El aprendizaje automático en el edge, o ML en el edge, se refiere a la capacidad de procesar y realizar análisis de datos directamente en los dispositivos móviles utilizando su capacidad de cómputo, sin necesidad de enviar datos a servidores remotos en la nube.

Los principales beneficios de usar ML en el edge incluyen menor latencia, reducción en el uso del ancho de banda, mayor seguridad de los datos, resultados en tiempo real y una mejor experiencia de usuario en entornos sin conexión.

ML Kit es un SDK de Google que integra su tecnología de aprendizaje automático en un paquete simple y poderoso. Está basado en TensorFlow Lite y está diseñado para facilitar la integración de funciones de ML en aplicaciones móviles, tanto para Android como para iOS.

Las API de ML Kit se clasifican en dos tipos: base y personalizadas. Las API base cubren funciones comunes como reconocimiento de texto, detección de rostros y escaneo de códigos de barras, mientras que las personalizadas permiten a los desarrolladores construir y utilizar sus propios modelos TensorFlow Lite.

Para integrar ML Kit en un proyecto de React Native, primero es necesario configurar el proyecto como uno de Firebase, instalar el módulo de la aplicación Firebase de React Native y luego instalar los modelos de ML Kit necesarios según el caso de uso.

Un desarrollador puede utilizar ML Kit, que abstrae la complejidad del aprendizaje automático y proporciona APIs listas para usar, permitiendo la integración de soluciones de ML con solo unas pocas líneas de código.

machine learning

Sangeetha KP

7 min

02 Aug, 2021

Comments

Video Summary and Transcription

Esta charla discute el aprendizaje automático en el edge y sus beneficios para aplicaciones móviles. ML en el edge utiliza la potencia de cálculo de los dispositivos móviles para el procesamiento seguro y en tiempo real, así como para capacidades sin conexión. ML Kit, el SDK de Google, proporciona una integración sencilla de soluciones de ML en aplicaciones móviles sin necesidad de tener amplios conocimientos de ML. La charla cubre la configuración de Firebase y la integración de ML Kit en proyectos de React Native, mostrando las posibilidades de aplicar filtros y generar avatares con ML en el edge.

Available in English: ML on the Edge

1. Introducción a ML en el Edge

Short description:

Me complace hablar sobre el aprendizaje automático en el edge y cómo puede mejorar las aplicaciones móviles. ML en el edge aprovecha la capacidad de cómputo de los dispositivos móviles, lo que hace que el procesamiento sea más seguro, en tiempo real y brinde una mejor experiencia sin conexión. ML Kit, el SDK de Google, ofrece API base y personalizadas para tareas de visión y lenguaje, lo que facilita a los desarrolladores móviles integrar soluciones de ML sin una amplia experiencia en ML. La integración de ML Kit en un proyecto de React Native implica configurar el proyecto como uno de Firebase y actualizar el archivo de compilación o gradle.

Entonces, empecemos. Me complace hablarles a todos sobre el tema, el aprendizaje automático en el edge. Soy Sangeeta y trabajo como desarrollador en Amazon. Durante los últimos cuatro años, he estado construyendo aplicaciones móviles profesionalmente y como proyectos secundarios. Naturalmente, siempre estoy buscando formas de hacer que las aplicaciones sean más rápidas, más inteligentes, más seguras y poder brindar mejores experiencias al cliente.

Como tal, cuando Google lanzó ML Kit como parte de su ION, que prometía aprendizaje automático en el edge, tuve que probarlo. Ahora, ¿qué es el ML en el edge y por qué debería importarnos? Tradicionalmente, construir soluciones de ML requería que los desarrolladores recopilaran datos, construyeran modelos, los entrenaran, los ajustaran, los implementaran en algún servidor remoto en la nube y los sirvieran en dispositivos móviles en los llamados bordes de Internet.

Ahora, como todos sabemos, con el paso del tiempo, los dispositivos móviles se han vuelto mucho más eficientes en sus capacidades de cómputo. ¿Por qué no aprovechar la capacidad de cómputo de los dispositivos localmente, en lugar de hacer el procesamiento en algún lugar remoto en la nube? Eso es el ML en el edge. Ahora, ¿cuáles son los beneficios de hacerlo? No tener que transferir datos de un lado a otro del mundo significa una latencia y un ancho de banda más fáciles. Localizar todo el procesamiento que ocurre en el dispositivo significa que los datos son más seguros, los resultados son más en tiempo real y puedes brindar una mejor experiencia sin conexión a tus clientes. Y finalmente, esto reduce en gran medida la barrera para que cualquier desarrollador móvil con poca o ninguna experiencia en ML integre soluciones de ML en sus aplicaciones.

Espero que ahora estén convencidos de que el ML en el edge es interesante y tengan curiosidad por saber más al respecto. Ahora, intentemos entender cómo lograr esto. ML Kit es el SDK de Google, que engloba toda su experiencia en aprendizaje automático en un SDK simple pero poderoso. Esto se basa en TensorFlow Lite, que es una versión optimizada para dispositivos móviles de TensorFlow y se puede utilizar tanto para el desarrollo de Android como de iOS. Las API que ofrece ML Kit se pueden clasificar en dos tipos, base y personalizadas. La idea es que si una de tus necesidades no se satisface con las API base disponibles, puedes construir tus propios modelos de TensorFlow Lite personalizados y hacer que se rendericen en dispositivos móviles. Las API base disponibles se pueden clasificar aún más según su uso en visión y lenguaje. Por ejemplo, respuestas inteligentes, escaneo de códigos de barras, detección de rostros, detección e identificación de imágenes, y más. Nuevamente, los desarrolladores móviles no necesariamente necesitan entender la magia del aprendizaje automático que ocurre bajo el capó. Todo eso se abstrae de manera limpia y está disponible como API listas para usar, que se pueden aprovechar con solo unas pocas líneas de código.

Hablando de código, a continuación, entendamos qué se necesita para integrar ML Kit en un proyecto de React Native. Debemos saber que ML Kit se puede utilizar tanto para desarrollo nativo como para desarrollo de React Native, pero para este taller, me centraré en el flujo de trabajo de React Native para Android, aunque el proceso debería ser bastante similar para iOS también. El primer paso para integrar ML Kit es configurar tu proyecto como uno de Firebase. Firebase proporciona un conjunto de herramientas que facilitan mucho el desarrollo de aplicaciones. Herramientas como registro, autenticación, todo este proceso pesado está disponible como parte de Firebase. Entonces, los desarrolladores de Google pensaron, ¿por qué el aprendizaje automático debería ser diferente? Y es por eso que ML Kit también está disponible como parte de Firebase. Para comenzar con Firebase, ingresas a la consola de Firebase e ingresas el nombre de tu paquete. Esto genera un archivo de configuración de Firebase que se coloca en la raíz de la carpeta de tu proyecto. Luego, actualizamos el archivo de compilación o gradle para declarar los servicios de Google como una de nuestras dependencias y ejecutamos el complemento.

2. Configuración de Firebase e Integración de ML Kit

Short description:

Esta sección cubre la configuración de Firebase y React Native Firebase, la instalación del modelo de visión de ML y el uso de las API de ML Kit para el reconocimiento de texto y la detección de rostros. Las posibilidades de ML en el edge son infinitas, incluyendo la aplicación de filtros y la generación de avatares. En general, aprendimos sobre los beneficios del aprendizaje automático en el edge e integrando ML Kit en proyectos de React Native.

Esto nos permite utilizar los productos de Firebase en nuestro proyecto. Con la configuración de Firebase, pasemos a la sección de código base de React Native. Firebase para React Native es la biblioteca oficialmente recomendada para el desarrollo de Firebase en React Native. Para usar esto, primero instalamos el módulo de la aplicación Firebase de React Native utilizando npm o Yarn. Después de esto, según nuestro caso de uso, instalamos el modelo requerido. En este caso, estoy instalando el modelo de visión de ML y actualizando mi archivo firebase.json para habilitar true.

Ahora viene la parte divertida, con Firebase conectado y los modelos de ML requeridos instalados, utilizamos las API para procesar nuestra entrada. En este caso, estoy esperando la descarga del modelo de visión y luego proporciono la ruta de mi imagen local a la API de procesamiento de reconocimiento de texto de la imagen. Lo que esto hace es procesar la imagen y devolver una matriz de bloques de texto para cada texto en la imagen. Cada uno de estos bloques de texto contiene información como ¿cuál es el texto real dentro de él? ¿Cuáles son los límites? ¿Cuáles son las coordenadas? ¿Y cuál es el idioma del texto? Esto es una acción. Vemos que se ha determinado con precisión caminar sobre el césped y diferentes bloques de texto en la salida se han utilizado para superponer en la imagen. Este es otro ejemplo de la API de detección de rostros de ML Kit. Aquí he dado la imagen y ha sido capaz de determinar con precisión los contornos del rostro y darnos coordenadas. Considera esto como un punto de partida para aplicar filtros a esto o generar avatares para esta imagen y así sucesivamente. Las posibilidades son simplemente infinitas.

Eso es prácticamente lo que quería cubrir como parte de esta charla. Hoy aprendimos, ¿qué es el aprendizaje automático en el edge? ¿Cuáles son sus beneficios? ¿Qué es ML Kit y qué se necesita para integrar ML Kit como parte de tu proyecto de React Native? Espero haberte inspirado con la idea de usar ML en el edge en tu próxima aplicación móvil. Si tienes alguna pregunta, no dudes en enviarme un mensaje directo en mi Twitter o enviarme un correo. Muchas gracias por ver. Adiós.

Available in other languages:

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

TensorFlow.js 101: Aprendizaje automático en el navegador y más allá

ML conf EU 2020

41 min

TensorFlow.js 101: Aprendizaje automático en el navegador y más allá

Jason Mayes

Web AI Lead at Google.

TensorFlow.js enables machine learning in the browser and beyond, with features like face mesh, body segmentation, and pose estimation. It offers JavaScript prototyping and transfer learning capabilities, as well as the ability to recognize custom objects using the Image Project feature. TensorFlow.js can be used with Cloud AutoML for training custom vision models and provides performance benefits in both JavaScript and Python development. It offers interactivity, reach, scale, and performance, and encourages community engagement and collaboration between the JavaScript and machine learning communities.

tensorflow machine learning innovation tensorflow react

Transformers.js: Machine Learning de Última Generación para la Web

JSNation 2025

27 min

Transformers.js: Machine Learning de Última Generación para la Web

Joshua Lochner

Hugging Face

Joshua introduces Transformers JS and Hugging Face, emphasizing community collaboration and pre-trained models. Transformers JS evolution led to 1.4 million monthly users, supporting 155 architectures. The library's browser-based capabilities offer real-time processing, cost-efficiency, and scalability. Integration enhancements include native web GPU execution and React Native implementation. Web ML implementation focuses on Onyx Runtime for device execution and web GPU for resource optimization. Browser-based ML applications cover vision, speech recognition, and text-to-speech. Advanced implementations include multimodal applications and educational tools. Interactive AI demonstrations showcase semantic search and conversational AI scenarios. Model licensing transitions to ECMAScript for efficiency and model redownloading factors are discussed.

machine learning webgpu

Uso de MediaPipe para Crear Aplicaciones de Aprendizaje Automático Multiplataforma con React

React Advanced 2021

21 min

Uso de MediaPipe para Crear Aplicaciones de Aprendizaje Automático Multiplataforma con React

Workshops on related topic

¿Pueden los LLM aprender? Personalicemos un LLM para chatear con tus propios datos

C3 Dev Festival 2024

48 min

¿Pueden los LLM aprender? Personalicemos un LLM para chatear con tus propios datos

WorkshopFree

Andreia Ocanoaia

Sientes las limitaciones de los LLMs? Pueden ser creativos, pero a veces carecen de precisión o se basan en información desactualizada. En esta masterclass, desglosaremos el proceso de construir y desplegar fácilmente un sistema de Generación con Recuperación Mejorada. Este enfoque te permite aprovechar el poder de los LLMs con el beneficio adicional de precisión factual e información actualizada.

machine learning artificial intelligence openai

Aprovechando LLMs para Construir Experiencias de IA Intuitivas con JavaScript

JSNation 2024

108 min

Aprovechando LLMs para Construir Experiencias de IA Intuitivas con JavaScript

Workshop

2 authors

Hoy en día, todos los desarrolladores están utilizando LLMs en diferentes formas y variantes, desde ChatGPT hasta asistentes de código como GitHub CoPilot. Siguiendo esto, muchos productos han introducido capacidades de IA integradas, y en este masterclass haremos que los LLMs sean comprensibles para los desarrolladores web. Y nos adentraremos en la codificación de tu propia aplicación impulsada por IA. No se necesita experiencia previa en trabajar con LLMs o aprendizaje automático. En su lugar, utilizaremos tecnologías web como JavaScript, React que ya conoces y amas, al mismo tiempo que aprendemos sobre algunas nuevas bibliotecas como OpenAI, Transformers.js

machine learning artificial intelligence openai

Deja que la IA sea tu Documentación

JSNation 2024

69 min

Deja que la IA sea tu Documentación

Workshop

Jesse Hall

Únete a nuestro masterclass dinámico para crear un portal de documentación impulsado por IA. Aprende a integrar ChatGPT de OpenAI con Next.js 14, Tailwind CSS y tecnología de vanguardia para ofrecer soluciones de código e resúmenes instantáneos. Esta sesión práctica te equipará con el conocimiento para revolucionar la forma en que los usuarios interactúan con la documentación, convirtiendo las búsquedas tediosas en descubrimientos eficientes e inteligentes.
Aspectos destacados:
- Experiencia práctica en la creación de un sitio de documentación impulsado por IA.- Comprensión de la integración de la IA en las experiencias de usuario.- Habilidades prácticas con las últimas tecnologías de desarrollo web.- Estrategias para implementar y mantener recursos de documentación inteligente.
Tabla de contenidos:- Introducción a la IA en la documentación- Configuración del entorno- Construcción de la estructura de documentación- Integración de ChatGPT para documentación interactiva

frameworks machine learning artificial intelligence

Prácticas con TensorFlow.js

ML conf EU 2020

160 min

Prácticas con TensorFlow.js

Workshop

Jason Mayes

Ven y descubre nuestro masterclass que te guiará a través de 3 recorridos comunes al usar TensorFlow.js. Comenzaremos demostrando cómo usar uno de nuestros modelos predefinidos, clases de JS muy fáciles de usar para trabajar rápidamente con ML. Luego veremos cómo volver a entrenar uno de estos modelos en minutos utilizando el aprendizaje por transferencia en el navegador a través de Teachable Machine y cómo se puede usar en tu propio sitio web personalizado. Finalmente, terminaremos con un hola mundo escribiendo tu propio código de modelo desde cero para hacer una regresión lineal simple y predecir los precios ficticios de las casas en función de sus metros cuadrados.

tensorflow machine learning

La Guía del Autoestopista de la Galaxia de Ingeniería de Aprendizaje Automático

ML conf EU 2020

112 min

La Guía del Autoestopista de la Galaxia de Ingeniería de Aprendizaje Automático

Workshop

Alyona Galyeva

¿Eres un Ingeniero de Software al que se le asignó la tarea de implementar un modelo de aprendizaje automático o aprendizaje profundo por primera vez en tu vida? ¿Te preguntas qué pasos seguir y cómo se diferencia el software impulsado por IA del software tradicional? Entonces este es el masterclass adecuado al que asistir.
Internet ofrece miles de artículos y cursos gratuitos que muestran lo fácil que es entrenar e implementar un modelo de IA simple. Al mismo tiempo, en la realidad es difícil integrar un modelo real en la infraestructura actual, depurarlo, probarlo, implementarlo y monitorearlo correctamente. En este masterclass, te guiaré a través de este proceso compartiendo consejos, trucos y herramientas de código abierto favoritas que te facilitarán mucho la vida. Así que al final del masterclass, sabrás por dónde empezar tu viaje de implementación, qué herramientas utilizar y qué preguntas hacer.

machine learning

Introducción al Aprendizaje Automático en la Nube

ML conf EU 2020

146 min

Introducción al Aprendizaje Automático en la Nube

Workshop

Dmitry Soshnikov

Este masterclass será tanto una introducción suave al Aprendizaje Automático, como un ejercicio práctico de uso de la nube para entrenar modelos de aprendizaje automático simples y no tan simples. Comenzaremos utilizando ML Automático para entrenar el modelo para predecir la supervivencia en el Titanic, y luego pasaremos a tareas de aprendizaje automático más complejas como la optimización de hiperparámetros y la programación de series de experimentos en el clúster de cómputo. Finalmente, mostraré cómo Azure Machine Learning se puede utilizar para generar pinturas artificiales utilizando Redes Generativas Adversarias, y cómo entrenar un modelo de preguntas y respuestas de lenguaje en documentos de COVID para responder preguntas relacionadas con COVID.

azure machine learning