Eye Tracking & a11y on the Edge: ¡Construye un Seguimiento Ocular con AI Ejecutándose en tu Dispositivo!

Bookmark
Rate this content

Hoy en día es posible crear sistemas avanzados de seguimiento ocular sin hardware especializado, simplemente usando una cámara web estándar y la inevitable AI. Pero la verdadera diferencia la hace el modelo que ya está completamente en el edge y, por lo tanto, en el dispositivo o navegador, ¡permitiéndote trabajar incluso sin conexión!

Con tecnologías de 'AI on the edge' para la detección facial y ocular, un poco de regresión lineal y un sistema de calibración en tiempo real que se adapta al usuario y al entorno, mostraré, usando solo JavaScript y modelos de AI en el dispositivo, los resultados del experimento, discutiendo la precisión, las limitaciones actuales y las posibles mejoras.

Los desafíos enfrentados en la optimización en el dispositivo son muchos para equilibrar precisión y rendimiento, pero este experimento abre nuevas posibilidades para aplicaciones accesibles en la interacción humano-máquina, estudios de comportamiento y sistemas de accesibilidad, ¡todo creado con tecnologías de código abierto y hardware común!

This talk has been presented at JSNation US 2025, check out the latest edition of this JavaScript Conference.

Francesco Sciuti
Francesco Sciuti
23 min
20 Nov, 2025

Comments

Sign in or register to post your comment.
Video Summary and Transcription
El orador profundiza en la integración de AI y la tecnología de seguimiento ocular para mejorar las interacciones y experiencias del usuario, enfatizando la necesidad de soluciones rentables con hardware estándar. Se destaca el avance de los modelos de AI para la ejecución en dispositivos locales, lo que permite la privacidad de datos multiplataforma y el uso sin conexión. MediaPipe Solutions, particularmente Face Landmark Detection, ofrece información facial detallada en tiempo real, y la extracción de características del iris se utiliza para una predicción precisa de la mirada. Se discuten técnicas de calibración y mapeo de modelos para mejorar la precisión y confiabilidad de la interacción visual.

1. Insights on Accessibility and Eye Tracking

Short description:

El orador discute la accesibilidad, la IA y el seguimiento ocular para mejorar las interacciones y experiencias del usuario. Se describen los beneficios y desafíos de la tecnología de seguimiento ocular, enfatizando la necesidad de soluciones asequibles con hardware estándar.

¡Hola a todos! Estoy emocionado por la oportunidad de compartir algunas ideas sobre este tema específico, y espero que lo que discutamos despierte su interés y les brinde conclusiones valiosas. Así que, vamos a sumergirnos. Pero una rápida advertencia antes de comenzar. La accesibilidad es un tema muy candente, es importante, y debe manejarse con mucho cuidado. Pero quiero decir, no soy un experto en accesibilidad. Y tampoco soy un ingeniero de IA. Pero, ¿qué demonios? No, solo soy un tipo curioso y un viejo desarrollador, y este es un momento increíble para mejorar nuestro conocimiento con un montón de cosas de IA.

Así que, cuando hablamos de accesibilidad en conferencias de desarrolladores, a menudo discutimos la usabilidad, atributos de jugadores, o pautas de accesibilidad de contenido web, reglas, y así sucesivamente, y no sobre la interacción. Esta vez, vamos a hablar sobre cómo podemos crear una interacción de accesibilidad experimental. Me inspiré hace unos meses por un software de Windows llamado Playability, un mapeador entre controladores de juegos y gestos faciales. Así que pensé, necesitamos un rastreador ocular dentro de nuestro navegador. El seguimiento ocular es una tecnología que detecta y registra los movimientos oculares, permitiéndonos entender dónde está mirando el usuario, por cuánto tiempo, y en qué secuencia. Resuelve problemas relacionados con la usabilidad de la interfaz o el análisis de procesos cognitivos.

El seguimiento ocular ha ganado atención en los últimos años por su utilidad en la interacción humano-computadora, en particular para personas con discapacidades como EM o ELA. Por un lado, es esencial para la interacción humano-computadora, especialmente para individuos con discapacidades físicas, permitiendo una comunicación efectiva. Pero, por otro lado, actualmente es intrusivo. Es más invasivo que los métodos convencionales, electrodos, lentes de contacto, cámaras especializadas, y es incómodo. El equipo puede ser engorroso de montar en la estación de trabajo o en la cabeza, y es costoso. Es realmente costoso con opciones comerciales limitadas.

2. Affordable Eye Tracking and AI Integration

Short description:

Abordando el alto costo de la tecnología de seguimiento ocular, se propone un sistema de interacción humano-computadora rentable utilizando el seguimiento del iris y una cámara web estándar para una calibración precisa y control ocular. La integración de la IA permite el reconocimiento de características faciales y la identificación de coordenadas del iris, destacando la tendencia hacia modelos de IA más pequeños y eficientes para la ejecución en dispositivos locales.

A menudo emocionantes $10,000 o más. Entonces, ¿qué tipo de experimento que probablemente funcione pensé? El objetivo es crear un sistema de interacción humano-computadora barato y fácil de usar basado en el seguimiento del iris y una cámara web estándar.

El seguimiento ocular, como dijimos, es una tecnología que detecta y registra los movimientos de nuestros ojos, nuestra mirada, y mapea las coordenadas de esta con nuestra pantalla. Así que mi necesidad era implementar una calibración en tiempo real del movimiento natural del puntero guiado por los ojos del usuario, ofrecer una experiencia de interacción natural a través del control ocular, y lograr buena precisión y exactitud sin hardware especializado. Pero, ¿qué queremos decir con buena precisión?

Necesitamos dos términos para identificarlo. La exactitud en el seguimiento ocular es la desviación entre la posición real de la mirada y la posición de la mirada registrada por el rastreador ocular, simplificando cuánto de los datos de seguimiento ocular registrados corresponde a los datos reales de seguimiento ocular. Precisión que se refiere a la medida de variación en los datos registrados.

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Construyendo un Asistente AI Activado por Voz con Javascript
JSNation 2023JSNation 2023
21 min
Construyendo un Asistente AI Activado por Voz con Javascript
Top Content
This Talk discusses building a voice-activated AI assistant using web APIs and JavaScript. It covers using the Web Speech API for speech recognition and the speech synthesis API for text to speech. The speaker demonstrates how to communicate with the Open AI API and handle the response. The Talk also explores enabling speech recognition and addressing the user. The speaker concludes by mentioning the possibility of creating a product out of the project and using Tauri for native desktop-like experiences.
El Flujo de Trabajo del Desarrollador Asistido por IA: Construye Más Rápido e Inteligente Hoy
JSNation US 2024JSNation US 2024
31 min
El Flujo de Trabajo del Desarrollador Asistido por IA: Construye Más Rápido e Inteligente Hoy
Top Content
AI is transforming software engineering by using agents to help with coding. Agents can autonomously complete tasks and make decisions based on data. Collaborative AI and automation are opening new possibilities in code generation. Bolt is a powerful tool for troubleshooting, bug fixing, and authentication. Code generation tools like Copilot and Cursor provide support for selecting models and codebase awareness. Cline is a useful extension for website inspection and testing. Guidelines for coding with agents include defining requirements, choosing the right model, and frequent testing. Clear and concise instructions are crucial in AI-generated code. Experienced engineers are still necessary in understanding architecture and problem-solving. Energy consumption insights and sustainability are discussed in the Talk.
El Ascenso del Ingeniero de IA
React Summit US 2023React Summit US 2023
30 min
El Ascenso del Ingeniero de IA
Top Content
The rise of AI engineers is driven by the demand for AI and the emergence of ML research and engineering organizations. Start-ups are leveraging AI through APIs, resulting in a time-to-market advantage. The future of AI engineering holds promising results, with a focus on AI UX and the role of AI agents. Equity in AI and the central problems of AI engineering require collective efforts to address. The day-to-day life of an AI engineer involves working on products or infrastructure and dealing with specialties and tools specific to the field.
IA y Desarrollo Web: ¿Exageración o Realidad?
JSNation 2023JSNation 2023
24 min
IA y Desarrollo Web: ¿Exageración o Realidad?
Top Content
This talk explores the use of AI in web development, including tools like GitHub Copilot and Fig for CLI commands. AI can generate boilerplate code, provide context-aware solutions, and generate dummy data. It can also assist with CSS selectors and regexes, and be integrated into applications. AI is used to enhance the podcast experience by transcribing episodes and providing JSON data. The talk also discusses formatting AI output, crafting requests, and analyzing embeddings for similarity.
Aplicaciones Web del Futuro con Web AI
JSNation 2024JSNation 2024
32 min
Aplicaciones Web del Futuro con Web AI
Web AI in JavaScript allows for running machine learning models client-side in a web browser, offering advantages such as privacy, offline capabilities, low latency, and cost savings. Various AI models can be used for tasks like background blur, text toxicity detection, 3D data extraction, face mesh recognition, hand tracking, pose detection, and body segmentation. JavaScript libraries like MediaPipe LLM inference API and Visual Blocks facilitate the use of AI models. Web AI is in its early stages but has the potential to revolutionize web experiences and improve accessibility.
El Ingeniero de Software Nativo de AI
JSNation US 2025JSNation US 2025
35 min
El Ingeniero de Software Nativo de AI
Software engineering is evolving with AI and VIBE coding reshaping work, emphasizing collaboration and embracing AI. The future roadmap includes transitioning from augmented to AI-first and eventually AI-native developer experiences. AI integration in coding practices shapes a collaborative future, with tools evolving for startups and enterprises. AI tools aid in design, coding, and testing, offering varied assistance. Context relevance, spec-driven development, human review, and AI implementation challenges are key focus areas. AI boosts productivity but faces verification challenges, necessitating human oversight. The impact of AI on code reviews, talent development, and problem-solving evolution in coding practices is significant.

Workshops on related topic

IA a demanda: IA sin servidor
DevOps.js Conf 2024DevOps.js Conf 2024
163 min
IA a demanda: IA sin servidor
Top Content
Featured WorkshopFree
Nathan Disidore
Nathan Disidore
En esta masterclass, discutimos los méritos de la arquitectura sin servidor y cómo se puede aplicar al espacio de la IA. Exploraremos opciones para construir aplicaciones RAG sin servidor para un enfoque más lambda-esque a la IA. A continuación, nos pondremos manos a la obra y construiremos una aplicación CRUD de muestra que te permite almacenar información y consultarla utilizando un LLM con Workers AI, Vectorize, D1 y Cloudflare Workers.
AI para Desarrolladores de React
React Advanced 2024React Advanced 2024
142 min
AI para Desarrolladores de React
Top Content
Featured Workshop
Eve Porcello
Eve Porcello
El conocimiento de las herramientas de AI es fundamental para preparar el futuro de las carreras de los desarrolladores de React, y la suite de herramientas de AI de Vercel es una vía de acceso accesible. En este curso, examinaremos más de cerca el Vercel AI SDK y cómo esto puede ayudar a los desarrolladores de React a construir interfaces de transmisión con JavaScript y Next.js. También incorporaremos APIs de terceros adicionales para construir y desplegar una aplicación de visualización de música.
Temas:- Creación de un Proyecto de React con Next.js- Elección de un LLM- Personalización de Interfaces de Transmisión- Construcción de Rutas- Creación y Generación de Componentes - Uso de Hooks (useChat, useCompletion, useActions, etc)
Building Full Stack Apps With Cursor
JSNation 2025JSNation 2025
46 min
Building Full Stack Apps With Cursor
Featured Workshop
Mike Mikula
Mike Mikula
En esta masterclass cubriré un proceso repetible sobre cómo iniciar aplicaciones full stack en Cursor. Espere comprender técnicas como el uso de GPT para crear requisitos de producto, esquemas de base de datos, hojas de ruta y usarlos en notas para generar listas de verificación que guíen el desarrollo de aplicaciones. Profundizaremos más en cómo solucionar alucinaciones/errores que ocurren, indicaciones útiles para hacer que su aplicación se vea y se sienta moderna, enfoques para conectar cada capa y más. Al final, ¡espere poder ejecutar su propia aplicación full stack generada por IA en su máquina!
Por favor, encuentre las preguntas frecuentes aquí
How to 9,2x Your Development Speed with Cline
JSNation 2025JSNation 2025
64 min
How to 9,2x Your Development Speed with Cline
Featured Workshop
Nik Pash
Nik Pash
La forma en que escribimos código está cambiando fundamentalmente. En lugar de quedar atrapado en bucles anidados y detalles de implementación, imagine enfocarse puramente en la arquitectura y la resolución creativa de problemas mientras su programador de pares de IA maneja la ejecución. En esta masterclass práctica, te mostraré cómo aprovechar Cline (un agente de codificación autónomo que recientemente alcanzó 1M de descargas en VS Code) para acelerar drásticamente tu flujo de trabajo de desarrollo a través de una práctica que llamamos "vibe coding" - donde los humanos se enfocan en el pensamiento de alto nivel y la IA maneja la implementación.Descubrirás:Los principios fundamentales del "vibe coding" y cómo se diferencia del desarrollo tradicionalCómo diseñar soluciones a un alto nivel y hacer que la IA las implemente con precisiónDemostración en vivo: Construcción de un sistema de almacenamiento en caché de grado de producción en Go que nos ahorró $500/semanaTécnicas para usar IA para entender bases de código complejas en minutos en lugar de horasMejores prácticas para solicitar a los agentes de IA que obtengan exactamente el código que deseasErrores comunes a evitar al trabajar con asistentes de codificación de IAEstrategias para usar IA para acelerar el aprendizaje y reducir la dependencia de ingenieros seniorCómo combinar efectivamente la creatividad humana con las capacidades de implementación de IAYa sea que seas un desarrollador junior que busca acelerar tu aprendizaje o un ingeniero senior que desea optimizar tu flujo de trabajo, saldrás de esta masterclass con experiencia práctica en desarrollo asistido por IA que puedes aplicar inmediatamente a tus proyectos. A través de demostraciones de codificación en vivo y ejercicios prácticos, aprenderás cómo aprovechar Cline para escribir mejor código más rápido mientras te enfocas en lo que importa: resolver problemas reales.
Webinar gratuito: Construyendo aplicaciones Full Stack con Cursor
Productivity Conf for Devs and Tech LeadersProductivity Conf for Devs and Tech Leaders
71 min
Webinar gratuito: Construyendo aplicaciones Full Stack con Cursor
Top Content
WorkshopFree
Mike Mikula
Mike Mikula
Para asistir al webinar, por favor regístrate aquí.En este webinar cubriré un proceso repetible sobre cómo iniciar aplicaciones Full Stack en Cursor. Espera entender técnicas como usar GPT para crear requisitos de producto, esquemas de base de datos, hojas de ruta y usar esos en notas para generar listas de verificación que guíen el desarrollo de la aplicación. Profundizaremos más en cómo corregir alucinaciones/errores que ocurren, indicaciones útiles para hacer que tu aplicación se vea y se sienta moderna, enfoques para conectar cada capa y más. Al final, ¡espera poder ejecutar tu propia aplicación Full Stack generada por IA en tu máquina!
Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React
React Advanced 2023React Advanced 2023
98 min
Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React
Top Content
Workshop
Richard Moss
Richard Moss
En esta masterclass daremos un recorrido por la IA aplicada desde la perspectiva de los desarrolladores de front end, enfocándonos en las mejores prácticas emergentes cuando se trata de trabajar con LLMs para construir grandes productos. Esta masterclass se basa en los aprendizajes obtenidos al trabajar con la API de OpenAI desde su debut en noviembre pasado para construir un MVP funcional que se convirtió en PowerModeAI (una herramienta de creación de ideas y presentaciones orientada al cliente).
En la masterclass habrá una mezcla de presentación y ejercicios prácticos para cubrir temas que incluyen:
- Fundamentos de GPT- Trampas de los LLMs- Mejores prácticas y técnicas de ingeniería de prompts- Uso efectivo del playground- Instalación y configuración del SDK de OpenAI- Enfoques para trabajar con la API y la gestión de prompts- Implementación de la API para construir una aplicación orientada al cliente potenciada por IA- Ajuste fino y embeddings- Mejores prácticas emergentes en LLMOps