Crear Filtros de Rostro AR con la API de Detección de Rostros de Chrome

Rate this content
Bookmark

En el rápido espacio de las aplicaciones de redes sociales, algunas funcionalidades también podrían ser utilizadas para aplicaciones web. Voy a mostrarte cómo puedes utilizar la API de Detección de Rostros con la función de bandera en Chrome. Con una demostración, exploraremos las posibilidades de implementar filtros de rostro en tus proyectos futuros. Con el acceso a la cámara web de un dispositivo, agregamos gafas procesando una transmisión de video y usándola para divertirnos, encontrando ese punto dulce donde la diversión y el aprendizaje se unen.

This talk has been presented at JSNation 2023, check out the latest edition of this JavaScript Conference.

FAQ

La API de Detección Facial de Chrome es parte de la API de detección de formas más grande de Chrome, que incluye detección de texto y códigos de barras. Esta API permite detectar rostros en imágenes o medios, pero no realiza reconocimiento facial, es decir, no identifica a las personas, solo detecta la presencia de rostros.

No, la API de Detección Facial todavía está en desarrollo y no está disponible para uso directo general. Está detrás de una bandera de características, lo que significa que los desarrolladores deben habilitar esta función específicamente en su navegador Chrome para poder usarla.

Para habilitar la API de Detección Facial en Chrome, es necesario activar la función experimental a través de una URL específica en el navegador, que permite modificar las configuraciones de características experimentales de Chrome.

La API permite detectar la ubicación de rostros en un medio y proporciona datos sobre puntos de referencia facial, como la posición de los ojos, nariz y boca. Esto puede ser útil para aplicaciones de realidad aumentada o para funciones que necesiten detectar la presencia de un rostro en una imagen.

Sí, es posible detectar múltiples rostros usando esta API, aunque la eficiencia puede depender de la cantidad de rostros y del hardware del dispositivo, ya que puede afectar el tiempo de procesamiento y la precisión de la detección.

Mientras que la detección de códigos de barras ya está disponible para todos los usuarios y es completamente funcional, la detección facial y de texto aún están en desarrollo. La principal diferencia es que los códigos de barras se pueden usar de manera productiva, mientras que la detección facial aún está limitada a pruebas y desarrollos experimentales.

Una de las principales limitaciones es que no puede realizar reconocimiento facial, solo detecta la presencia y posición de los rostros. Además, está en fase de desarrollo y solo disponible bajo una bandera de funciones, lo que restringe su uso en aplicaciones de producción.

Jorrik Klijnsma
Jorrik Klijnsma
30 min
01 Jun, 2023

Comments

Sign in or register to post your comment.

Video Summary and Transcription

La API de Detección de Rostros de Chrome es parte de la API de detección de formas más grande e incluye la detección de texto y la detección de códigos de barras. Habilitar la API es tan simple como abrir una URL específica y habilitar la función experimental. La API proporciona características como la detección de rostros y el procesamiento de puntos de referencia, la representación de gafas en los rostros y la aplicación de filtros faciales. Puede manejar múltiples rostros e imágenes en videos, pero el rendimiento depende del hardware y la velocidad de procesamiento del dispositivo. La API está actualmente en progreso y se solicita retroalimentación para posibles capacidades de producción.

1. Introducción a la API de detección facial de Chrome

Short description:

Bienvenidos. Mi nombre es Jorrik Leijnsma. Soy un desarrollador creativo de front-end y voy a compartir algo sobre la API de detección facial de Chrome. Los desarrolladores vienen con algún tipo de imagen. A veces somos un poco nerds, pero también somos solucionadores de problemas. El código puede ser divertido y lo que creas con código a menudo se ve como divertido. La IA se introduce en la escena y hay usuarios más exigentes que esperan más características. La API de detección facial de Chrome es parte de la API de detección de formas más grande.

Bienvenidos. Mi nombre es Jorrik Leijnsma. Como dijo Caroline, soy un desarrollador creativo de front-end y voy a compartir algo sobre la API de detección facial de Chrome. Es un poco largo, pero logré decirlo bien. Entonces, soy un desarrollador de front-end y he trabajado durante más de seis años como desarrollador de front-end. Los últimos dos años en una empresa llamada Ordina. Y, lo que tenemos, somos desarrolladores. Creo que la mayoría de nosotros estamos aquí. Y los desarrolladores vienen con algún tipo de imagen. A veces somos un poco, como, nerds, y... Pero también somos solucionadores de problemas. Pero también hay este cambio donde el código puede ser divertido, y también lo que creas con código se ve cada vez más como divertido. Pero la parte del código sigue siendo aburrida. Y ahí es donde a veces hay esta cosa interesante donde también quieres crear código no aburrido. Pero tampoco el gran resultado final. Entonces tal vez la gente pueda levantar la mano si ha visto código aburrido en algún momento de su vida. Sí. Creo que la mayoría de nosotros lo hemos visto. ¿O has visto código que no es aburrido y era más interesante? Tal vez también levanten la mano. Así que tal vez un poco menos, pero aún hay. Y la última pregunta, tal vez la gente ha visto código que no era funcional en absoluto, pero era puramente por diversión. También algunas manos allí. Con los últimos años, todos estos desarrollos, la IA se introduce en la escena. Hay usuarios más exigentes. Esperan más y más características. Y tienes el problema de tal vez no ser notado si no tienes estas características increíbles en tu aplicación o servicio o lo que sea. Así que necesitas ser divergente y mostrar lo que puedes hacer y lo que es posible. Esta API de detección facial de Chrome es algo que está detrás de la bandera de características, lo que significa que no se puede usar directamente. Hay un proceso para esta API de detección de formas.

2. Habilitando la API de Detección Facial de Chrome

Short description:

La API de Detección Facial de Chrome incluye detección de texto y detección de códigos de barras. Es importante tener en cuenta que la detección facial no implica reconocimiento facial. Habilitar la función de Chrome es tan simple como abrir una URL específica y activar la función experimental. Luego puedes usar el detector facial llamando a un nuevo detector facial y configurando las propiedades de detección máxima de caras y modo rápido.

La API de Detección Facial de Chrome es parte de la API de detección de formas más grande. Incluye detección de texto y también detección de códigos de barras. Y la detección de códigos de barras ya está lista para usar por todos. Pero la detección facial y la detección de texto aún están en desarrollo. Para esto, es importante tener en cuenta que la detección facial no implica reconocimiento facial. Por lo tanto, detecta tu cara, pero no puede reconocer si eres esta persona o aquel usuario que está iniciando sesión. Solo muestra que hay una cara en este tipo de medio.

¿Entonces, cómo habilitas la función de Chrome? Hay este enlace, cuando lo abres, déjame intentar si funciona. No, eso necesita abrirse. Déjame copiar y pegarlo entonces. No es no no un enlace normal válido, elige aplicación y luego muestra opciones. No estás viendo esto. Tengo que seleccionar Chrome para que se abra. Navegador Google Chrome. Entonces aquí, déjame deslizar hacia acá. Ahora debería ser visible. Esta es la parte si abres esa URL. Estás viendo esta función experimental. Y solo necesitas habilitarla. Viene con algunas otras características también. Así que ten eso en cuenta. Recientemente tuve problemas para seleccionar, por ejemplo, texto en GitHub, que no se muestra correctamente, así que eso también parece ser parte de algo defectuoso en esta plataforma web. Así es como habilitas esta función. Así. Eso fue mucho más fácil. Ahora lo has habilitado en tu navegador y ahora puedes usarlo. Para usarlo, comienzas llamando a un nuevo detector facial. Es tan simple como eso. Puede manejar dos propiedades. Puede manejar la detección máxima de caras, que se puede configurar a cualquier número, pero en cierto punto, tu máquina no será lo suficientemente rápida.

QnA

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Instalar Nada: Interfaces de Aplicación con APIs Nativas del Navegador
JSNation 2024JSNation 2024
31 min
Instalar Nada: Interfaces de Aplicación con APIs Nativas del Navegador
This Talk introduces real demos using HTML, CSS, and JavaScript to showcase new or underutilized browser APIs, with ship scores provided for each API. The dialogue element allows for the creation of modals with minimal JavaScript and is supported by 96% of browsers. The web animations API is a simple and well-supported solution for creating animations, while the view transitions API offers easy animation workarounds without CSS. The scroll snap API allows for swipers without JavaScript, providing a smooth scrolling experience.
Ampliando los límites de la codificación de video en navegadores con WebCodecs
JSNation 2023JSNation 2023
25 min
Ampliando los límites de la codificación de video en navegadores con WebCodecs
Top Content
This Talk explores the challenges and solutions in video encoding with web codecs. It discusses drawing and recording video on the web, capturing and encoding video frames, and introduces the WebCodecs API. The Talk also covers configuring the video encoder, understanding codecs and containers, and the video encoding process with muxing using ffmpeg. The speaker shares their experience in building a video editing tool on the browser and showcases Slantit, a tool for making product videos.
Visualización de Cuellos de Botella de Rendimiento Front-End
React Summit 2020React Summit 2020
34 min
Visualización de Cuellos de Botella de Rendimiento Front-End
React's web-based tools allow for independent learning. Dazzone, a sports streaming service, faces challenges with low memory and CPU targets. Measuring, analyzing, and fixing performance issues is crucial. Virtualization improves rendering efficiency and performance. The application is now much faster with significantly less jank.
API WebHID: Controla Todo a través de USB
JSNation 2022JSNation 2022
23 min
API WebHID: Controla Todo a través de USB
Today's Talk introduces the webHID API, which allows developers to control real devices from the browser via USB. The HID interface, including keyboards, mice, and gamepads, is explored. The Talk covers device enumeration, input reports, feature reports, and output reports. The use of HID in the browser, especially in Chrome, is highlighted. Various demos showcase working with different devices, including a DualShock controller, microphone, gamepad, and Stream Deck drum pad. The Talk concludes with recommendations and resources for further exploration.
Automatiza el Navegador con la API de Renderizado del Navegador de Workers
JSNation 2024JSNation 2024
20 min
Automatiza el Navegador con la API de Renderizado del Navegador de Workers
The Talk discusses browser automation using the Worker's Browser Rendering API, which allows tasks like navigating websites, taking screenshots, and creating PDFs. Cloudflare integrated Puppeteer with their workers to automate browser tasks, and their browser rendering API combines remote browser isolation with Puppeteer. Use cases for the API include taking screenshots, generating PDFs, automating web applications, and gathering performance metrics. The Talk also covers extending sessions and performance metrics using Durable Objects. Thank you for attending!
¡MIDI en el Navegador... ¡Vamos a Rockear la Web!
JSNation 2022JSNation 2022
28 min
¡MIDI en el Navegador... ¡Vamos a Rockear la Web!
MIDI is a versatile communication protocol that extends beyond music and opens up exciting possibilities. The Web MIDI API allows remote access to synths and sound modules from web browsers, enabling various projects like music education systems and web audio-based instruments. Developers can connect and use MIDI devices easily, and the Web MIDI API provides raw MIDI messages without semantics. The WebMidi.js library simplifies working with the Web MIDI API and offers a user-friendly interface for musicians and web developers. MIDI on the web has generated significant interest, with potential for commercial growth and endless possibilities for web developers.

Workshops on related topic

Escribiendo Módulos Universales para Deno, Node y el Navegador
Node Congress 2022Node Congress 2022
57 min
Escribiendo Módulos Universales para Deno, Node y el Navegador
Workshop
Luca Casonato
Luca Casonato
En este masterclass te guiaré en la escritura de un módulo en TypeScript que pueda ser utilizado por usuarios de Deno, Node y los navegadores. Explicaré cómo configurar el formato, linting y pruebas en Deno, y luego cómo publicar tu módulo en deno.land/x y npm. Comenzaremos con una breve introducción sobre qué es Deno.