Esto tiene solo 3 megabytes de tamaño y puede reconocer 468 puntos de referencia faciales en el rostro humano. Y esta es una característica realmente genial, y voy a mostrarte cómo usarla en la diapositiva ahora mismo.
Ahora, las personas están comenzando a utilizar esto para casos de uso del mundo real, como L'Oreal, y han creado una prueba de maquillaje de realidad aumentada, que te permite probar lápiz labial en este caso en realtime sin siquiera tener que estar físicamente presente en la tienda. Así que debes tener en cuenta que la mujer del lado derecho no está usando lápiz labial. Estamos utilizando la malla facial para comprender dónde están sus labios, y cómo aplicar el lápiz labial que ella desea en su rostro en realtime. Así que esto es súper genial, y estoy seguro de que vamos a ver más cosas como esta en el futuro.
Veamos la malla facial en acción para ver cómo funciona en el mundo real. Cambiemos a la demostración. Bien, ahora puedes verme hablando contigo con la malla facial funcionando en realtime en el navegador web al mismo tiempo. En el lado izquierdo aquí, puedes ver el aprendizaje automático en acción, y de hecho hay una malla de mi rostro superpuesta en el navegador web, y puedo mover mi rostro y es bastante robusto. Puedo abrir y cerrar la boca y los ojos, y puedes ver que todo eso sucede en realtime. Y estamos obteniendo aproximadamente 25 cuadros por segundo mientras se ejecuta en mi GPU a través de WebGL.
Ahora, por supuesto, también estoy transmitiendo esto en vivo, así que estoy utilizando algunos de mis recursos de GPU en este momento. Podría obtener más cuadros por segundo si quisiera, pero también puedo cambiar como desarrollador a Wasm, que es WebAssembly, para ejecutar en una CPU, o puedo elegir ejecutar en la CPU por sí misma, que es la forma más lenta de ejecución. Así que hay varias opciones de implementación. Y debido a que esto es JavaScript, no solo estoy haciendo el aprendizaje automático en el lado izquierdo, también puedo representar esta nube de puntos 3D de los resultados en el lado derecho utilizando 3.js. Y JavaScript desde el primer día ha sido diseñado para la presentación y visualización de información, por lo que tienes muchas bibliotecas, especialmente para gráficos 3D, para poder hacer esto de manera muy, muy fácil. Y puedes ver que puedo moverlo y ahora inspeccionar mi rostro desde diferentes ángulos, que se está construyendo en tiempo real en el navegador.
Bien, volvamos a las diapositivas. A continuación está la segmentación corporal. Esto te permite distinguir 24 áreas corporales en múltiples cuerpos, todo en realtime. Puedes ver esto en acción en la diapositiva, y en el lado derecho tenemos varias líneas que representan diferentes partes de cada cuerpo. Aún mejor, también tenemos la estimación de postura, esas líneas azules claras contenidas en cada uno de los cuerpos del lado derecho, que nos permiten estimar dónde está el esqueleto humano. Y con eso, se pueden crear demostraciones realmente poderosas, como la capacidad de reconocer cuando estás en una cierta postura o un gesto, o algo así. Y tenemos muchos datos geniales de nuestros instructores de yoga y este tipo de cosas, así que es súper genial ver el potencial creativo de este modelo. Y de hecho, con un poco de creatividad, podemos usar cosas como imágenes corporales de varias formas encantadoras. Aquí hay solo dos ejemplos que creé en mi tiempo libre. En el lado izquierdo, puedes ver cómo me vuelvo invisible mientras camino en mi cama, y observa cuando camino en la cama, la cama todavía se deforma. Y con esta imagen estática, puedo calcular las actualizaciones del fondo en tiempo real y solo eliminar mi cuerpo de las partes donde realmente está mi cuerpo. Y, por supuesto, no es perfecto, pero son los primeros pasos, y esto se hizo en solo un día.
Comments