Versión en EspañolES

[EN] Forget Polygons – Gaussian Splats, the New Approach to Photorealistic 3D Graphics
[ES] Olvida los Polígonos: Gaussian Splats, el Nuevo Enfoque para Gráficos 3D Fotorealistas

Olvida los Polígonos: Gaussian Splats, el Nuevo Enfoque para Gráficos 3D Fotorealistas

gsplat.js es una biblioteca de código abierto fácil de usar y de propósito general para el splatting gaussiano. En esta charla se explicará cómo funciona, para qué se utiliza y los planes para el futuro.

This talk has been presented at JSNation 2024, check out the latest edition of this JavaScript Conference.

machine learning artificial intelligence

Dylan Ebert

5 min

17 Jun, 2024

Comments

Video Summary and Transcription

Hoy hablaré sobre GspotJS y Gaussian Splatting, un revolucionario pipeline de gráficos que puede renderizar escenas de alta fidelidad a 144 FPS. Gaussian Splatting es una técnica que convierte datos directamente en una imagen utilizando gaussianas. GspotJS es una biblioteca ligera de JavaScript para el renderizado de splats gaussianos, con características como el renderizado en 4D. La biblioteca tiene como objetivo proporcionar una forma sencilla y rápida de ver Splats en la web, mientras que aplicaciones más avanzadas pueden utilizar Mackellog Gaussian Splats 3D. Tanto Gaussian Splatting como gSplotJS son de código abierto.

Available in English: Forget Polygons – Gaussian Splats, the New Approach to Photorealistic 3D Graphics

1. Introducción a GspotJS

Short description:

Hoy hablaré sobre GspotJS y Gaussian Splatting. GspotJS es una tubería gráfica revolucionaria que puede renderizar escenas de alta fidelidad a 144 FPS. Gaussian Splatting es la técnica detrás de esto, donde se utilizan múltiples imágenes para estimar una nube de puntos en 3D, que luego se representa como Gaussians en una matriz. Estas Gaussians se rasterizan en una imagen y se entrenan para producir imágenes que se asemejen a las originales. El conjunto entrenado de Gaussians se puede rasterizar desde cualquier ángulo para generar una imagen.

Hola a todos, hoy hablaré sobre GspotJS. ¿Qué es? ¿Su historia? ¿Cómo funciona? Y ¿hacia dónde se dirige? Pero primero, ¿quién soy yo? Mi nombre es Dylan. Soy un defensor del desarrollo en Hugging Face, donde build tools y creo contenido educativo, a veces bajo mi nombre y a veces bajo keks individuales. Hablando de eso, para responder a la pregunta, ¿qué es GspotJS? Primero necesito responder, ¿qué es Gaussian Splatting? Tengo un video de 2 minutos sobre eso, aquí está. Gaussian Splatting. ¿Qué es eso? Es una forma de renderizar cosas con una alta fidelidad, muy rápido. Es importante porque es totalmente diferente de cualquier tubería gráfica existente y es capaz de renderizar escenas que se ven así, a 144 FPS. El artículo de investigación original es 3D Gaussian Splatting para renderización de campos de radiación en tiempo real. ¿Qué significa eso? Explicaré cómo funciona. Paso uno, tomar un montón de fotos de cosas desde diferentes ángulos, luego usar un antiguo algoritmo llamado Estructura a partir del movimiento para estimar una nube de puntos a partir de las imágenes en diferentes ángulos. Paso dos, tomar cada punto en la nube de puntos y decir que ahora eres un Gaussian. ¿Un qué? Una distribución que se ve como esto, pero en 3D, y también puede estar sesgada, lo que me gusta llamar multivariada. Multivariada. Todos lo llaman así. También asignamos un color y un alfa. Ahora podemos poner todas estas Gaussians en una matriz gigante, con 16 columnas y filas, una para cada Gaussian. Esto es toda la data que necesitamos para representar la escena. ¿Hemos terminado? No. Paso tres, rasterización, lo que significa convertir todas estas Gaussians en una imagen. ¿Cómo? La versión simplificada es, según la perspectiva de tu cámara, proyecta las Gaussians en 2D, luego ordénalas por profundidad, luego para cada píxel, itera sobre cada Gaussian, de adelante hacia atrás, calcula su contribución a ese píxel, luego mézclalos todos juntos. Ahora tenemos una imagen. ¿Hemos terminado? No. Parte cuatro, entrenamiento. Estas Gaussians no tienen los valores correctos, así que necesitamos entrenar ellas. Es decir, ajustar los valores de las Gaussians para que produzcan imágenes que se parezcan a las imágenes originales. Esto es muy parecido a entrenar una red neuronal, pero sin capas, lo cual es por qué es tan rápido. El entrenamiento también utiliza densificación y poda automatizadas. Es decir, cuando una Gaussian tiene dificultades para ajustarse a una parte detallada de la escena, se divide en dos Gaussians. Y cuando el alfa de una Gaussian se vuelve demasiado bajo, se elimina. Ahora tenemos un conjunto entrenado

2. Descripción general de Gaussian Splatting y G-Splat JS

Short description:

Gaussian Splatting es una técnica revolucionaria de rasterización que convierte los datos directamente en una imagen. G-Splat JS es una biblioteca ligera de JavaScript para renderizar Gaussian Splats, similar a otras bibliotecas de renderizado pero con características adicionales como renderizado 4D. La historia de G-Splat JS involucra el uso de Spaces, una aplicación de aprendizaje automático en HuggingFace, y el desarrollo de una biblioteca de JavaScript para simplificar la visualización de los resultados de Splats en demostraciones de aprendizaje automático.

de millones de Gaussians que se pueden rasterizar desde cualquier ángulo para producir una imagen. Bueno, ¿y ahora qué? Bueno, esto es extremadamente nuevo. Es como cuando se inventó la rasterización tradicional por primera vez, y luego llegó Doom y agregó sombras. Y todos dijeron, wow, agregaste sombras. Y luego vinieron los reflejos, los mapas de normales, la iluminación indirecta, ya sabes, Y este artículo básicamente está reinventando el primer paso. Ahora podrías pensar, ¿esto no es lo mismo que la fotogrametría? No, porque esta es una técnica de rasterización, lo que significa que convierte los datos subyacentes directamente en una imagen, sin necesidad de trazado de rayos, trazado de rutas, o difusión. Entonces, ¿por qué no existía hasta ahora? Porque aunque es una operación simple, para que se vea tan bien como lo hace, necesitas millones de Gaussians. Lo cual requiere varios gigas de VRAM. ¿Está a punto de cambiar por completo la gráfica? ¿O es una aplicación de nicho como la fotogrametría? Hazme saber lo que piensas.

Eso es Gaussian Splatting. ¿Y qué es G-Splat JS? Es una biblioteca de JavaScript para renderizar Gaussian Splats. Tiene mucho en común con otras bibliotecas de renderizado, como 3JS o BabylonJS, donde puedes renderizar una escena, con este código, donde configuras una escena, una cámara, un renderizador y controles. Y luego, en un bucle de actualización, actualizas los controles y renderizas la escena. Bastante simple. También tiene algunas características adicionales, como el renderizado 4D. Básicamente, un video en el que puedes mirar alrededor. También es muy ligero, menos de 1MB, mucho más pequeño que otras bibliotecas de renderizado. Ahora, sobre la historia. No soy un programador de gráficos ni un desarrollador de JavaScript. Pero algo realmente genial que tenemos en HuggingFace son los Spaces. Estas son aplicaciones de aprendizaje automático creadas por la comunidad, generalmente utilizando Gradio, una biblioteca de Python que facilita mucho la creación de aplicaciones web de aprendizaje automático. Uno de los componentes de esto es Model 3D, que facilita la visualización de los resultados de mallas 3D. Y cuando apareció Gaussian Splatting, quería habilitar la visualización de los resultados de Splats. Así que encontré este renderizador de código abierto de JavaScript, Antimatter15-Splat, creado por Kevin Kwok. Y estaba reimplementándolo en Spaces. Fue realmente doloroso. Y pensé que sería bueno si hubiera una biblioteca de JavaScript que hiciera esto más fácil. Así que la hice. Espero que ahorre tiempo a otros Por cierto, antes mencioné que Gradio Model 3D podía visualizar resultados de mallas. Bueno, ahora también puede visualizar resultados de Splats, lo que permite

3. Trabajo y futuro de gSplotJS

Short description:

Puedes cargar una imagen y generar una escena de Gaussian Splatting 3D con gSplotJS. El renderizador en gSplotJS utiliza CountingSort con un Web Worker asíncrono en WebAssembly para un renderizado rápido. La biblioteca tiene como objetivo proporcionar una forma simple y rápida de ver Splats en la web. Para aplicaciones más avanzadas, se recomienda Mackellog Gaussian Splats 3D, construido sobre 3JS. Gaussian Splatting y gSplotJS son de código abierto.

Demostraciones de aprendizaje automático como esta. Donde puedes cargar una imagen y generar una escena de Gaussian Splatting 3D. Esa es la historia. ¿Y ahora, cómo funciona? Si observas los archivos del proyecto, la mayoría de las cosas como cámaras, controles, matemáticas, son bastante estándar en el mundo 3D. La parte de Gaussian Splatting es el renderizador. Aquí está la mayor parte del código de renderizado. No voy a explicarlo en detalle. Pero hay algo que vale la pena mencionar. El mayor cuello de botella del renderizado de Gaussian Splats es la clasificación de los Splats. Para esto, estoy utilizando CountingSort, con un Web Worker asíncrono en WebAssembly. Esto hace que gSplotJS sea muy rápido. Pero teóricamente, podría ser aún más rápido con un Parallel Radix Sort basado en GPU, utilizando tecnologías más nuevas como WebGPU. Y si tienes experiencia en eso, todo esto es de código abierto. Así que ven y contribuye.

¿Y qué hay del futuro de gSplotJS? El objetivo de esta biblioteca es ver fácilmente Splats en la web, con un enfoque en velocidad y simplicidad. Si estás interesado en aplicaciones más pesadas, como juegos o renderizado híbrido de mallas y Splats, te recomiendo Mackellog Gaussian Splats 3D. Un renderizador de Gaussian Splats construido sobre 3JS. En conclusión, Gaussian Splatting es bastante genial. Y gSplotJS facilita el renderizado en la web. Y la mejor parte, es de código abierto. Gracias por ver.

Available in other languages:

Check out more articles and videos

We constantly think of articles and videos that might spark Git people interest / skill us up or help building a stellar career

Construyendo un Asistente AI Activado por Voz con Javascript

JSNation 2023

21 min

Construyendo un Asistente AI Activado por Voz con Javascript

Top Content

Tejas Kumar

Author of the "Fluent React" bestselling book, software engineer with 23 years of experience, and host of the developer-loved ConTejas Code podcast.

This Talk discusses building a voice-activated AI assistant using web APIs and JavaScript. It covers using the Web Speech API for speech recognition and the speech synthesis API for text to speech. The speaker demonstrates how to communicate with the Open AI API and handle the response. The Talk also explores enabling speech recognition and addressing the user. The speaker concludes by mentioning the possibility of creating a product out of the project and using Tauri for native desktop-like experiences.

case study artificial intelligence

El Flujo de Trabajo del Desarrollador Asistido por IA: Construye Más Rápido e Inteligente Hoy

JSNation US 2024

31 min

El Flujo de Trabajo del Desarrollador Asistido por IA: Construye Más Rápido e Inteligente Hoy

Top Content

Addy Osmani

Engineering Leader Working on Google Chrome

AI is transforming software engineering by using agents to help with coding. Agents can autonomously complete tasks and make decisions based on data. Collaborative AI and automation are opening new possibilities in code generation. Bolt is a powerful tool for troubleshooting, bug fixing, and authentication. Code generation tools like Copilot and Cursor provide support for selecting models and codebase awareness. Cline is a useful extension for website inspection and testing. Guidelines for coding with agents include defining requirements, choosing the right model, and frequent testing. Clear and concise instructions are crucial in AI-generated code. Experienced engineers are still necessary in understanding architecture and problem-solving. Energy consumption insights and sustainability are discussed in the Talk.

artificial intelligence

El Ascenso del Ingeniero de IA

React Summit US 2023

30 min

El Ascenso del Ingeniero de IA

Top Content

Shawn Swyx Wang

Latent.Space Editor & Smol.ai Founder

The rise of AI engineers is driven by the demand for AI and the emergence of ML research and engineering organizations. Start-ups are leveraging AI through APIs, resulting in a time-to-market advantage. The future of AI engineering holds promising results, with a focus on AI UX and the role of AI agents. Equity in AI and the central problems of AI engineering require collective efforts to address. The day-to-day life of an AI engineer involves working on products or infrastructure and dealing with specialties and tools specific to the field.

web development artificial intelligence builders and founders future of development

IA y Desarrollo Web: ¿Exageración o Realidad?

JSNation 2023

24 min

IA y Desarrollo Web: ¿Exageración o Realidad?

Top Content

Wes Bos

Full Stack Developer, Speaker & Teacher, Co-host of Syntax.fm podcast.

This talk explores the use of AI in web development, including tools like GitHub Copilot and Fig for CLI commands. AI can generate boilerplate code, provide context-aware solutions, and generate dummy data. It can also assist with CSS selectors and regexes, and be integrated into applications. AI is used to enhance the podcast experience by transcribing episodes and providing JSON data. The talk also discusses formatting AI output, crafting requests, and analyzing embeddings for similarity.

productivity artificial intelligence

TensorFlow.js 101: Aprendizaje automático en el navegador y más allá

ML conf EU 2020

41 min

TensorFlow.js 101: Aprendizaje automático en el navegador y más allá

Jason Mayes

Web AI Lead at Google.

TensorFlow.js enables machine learning in the browser and beyond, with features like face mesh, body segmentation, and pose estimation. It offers JavaScript prototyping and transfer learning capabilities, as well as the ability to recognize custom objects using the Image Project feature. TensorFlow.js can be used with Cloud AutoML for training custom vision models and provides performance benefits in both JavaScript and Python development. It offers interactivity, reach, scale, and performance, and encourages community engagement and collaboration between the JavaScript and machine learning communities.

tensorflow machine learning innovation tensorflow react

Aplicaciones Web del Futuro con Web AI

JSNation 2024

32 min

Aplicaciones Web del Futuro con Web AI

Jason Mayes

Web AI Lead at Google.

Web AI in JavaScript allows for running machine learning models client-side in a web browser, offering advantages such as privacy, offline capabilities, low latency, and cost savings. Various AI models can be used for tasks like background blur, text toxicity detection, 3D data extraction, face mesh recognition, hand tracking, pose detection, and body segmentation. JavaScript libraries like MediaPipe LLM inference API and Visual Blocks facilitate the use of AI models. Web AI is in its early stages but has the potential to revolutionize web experiences and improve accessibility.

artificial intelligence

Workshops on related topic

IA a demanda: IA sin servidor

DevOps.js Conf 2024

163 min

IA a demanda: IA sin servidor

Top Content

Featured WorkshopFree

Nathan Disidore

En esta masterclass, discutimos los méritos de la arquitectura sin servidor y cómo se puede aplicar al espacio de la IA. Exploraremos opciones para construir aplicaciones RAG sin servidor para un enfoque más lambda-esque a la IA. A continuación, nos pondremos manos a la obra y construiremos una aplicación CRUD de muestra que te permite almacenar información y consultarla utilizando un LLM con Workers AI, Vectorize, D1 y Cloudflare Workers.

serverless architecture artificial intelligence

AI para Desarrolladores de React

React Advanced 2024

142 min

AI para Desarrolladores de React

Top Content

Featured Workshop

Eve Porcello

El conocimiento de las herramientas de AI es fundamental para preparar el futuro de las carreras de los desarrolladores de React, y la suite de herramientas de AI de Vercel es una vía de acceso accesible. En este curso, examinaremos más de cerca el Vercel AI SDK y cómo esto puede ayudar a los desarrolladores de React a construir interfaces de transmisión con JavaScript y Next.js. También incorporaremos APIs de terceros adicionales para construir y desplegar una aplicación de visualización de música.
Temas:- Creación de un Proyecto de React con Next.js- Elección de un LLM- Personalización de Interfaces de Transmisión- Construcción de Rutas- Creación y Generación de Componentes - Uso de Hooks (useChat, useCompletion, useActions, etc)

react next.js artificial intelligence

Building Full Stack Apps With Cursor

JSNation 2025

46 min

Building Full Stack Apps With Cursor

Featured Workshop

Mike Mikula

En esta masterclass cubriré un proceso repetible sobre cómo iniciar aplicaciones full stack en Cursor. Espere comprender técnicas como el uso de GPT para crear requisitos de producto, esquemas de base de datos, hojas de ruta y usarlos en notas para generar listas de verificación que guíen el desarrollo de aplicaciones. Profundizaremos más en cómo solucionar alucinaciones/errores que ocurren, indicaciones útiles para hacer que su aplicación se vea y se sienta moderna, enfoques para conectar cada capa y más. Al final, ¡espere poder ejecutar su propia aplicación full stack generada por IA en su máquina!
Por favor, encuentre las preguntas frecuentes aquí

artificial intelligence

How to 9,2x Your Development Speed with Cline

JSNation 2025

64 min

How to 9,2x Your Development Speed with Cline

Featured Workshop

Nik Pash

La forma en que escribimos código está cambiando fundamentalmente. En lugar de quedar atrapado en bucles anidados y detalles de implementación, imagine enfocarse puramente en la arquitectura y la resolución creativa de problemas mientras su programador de pares de IA maneja la ejecución. En esta masterclass práctica, te mostraré cómo aprovechar Cline (un agente de codificación autónomo que recientemente alcanzó 1M de descargas en VS Code) para acelerar drásticamente tu flujo de trabajo de desarrollo a través de una práctica que llamamos "vibe coding" - donde los humanos se enfocan en el pensamiento de alto nivel y la IA maneja la implementación.Descubrirás:Los principios fundamentales del "vibe coding" y cómo se diferencia del desarrollo tradicionalCómo diseñar soluciones a un alto nivel y hacer que la IA las implemente con precisiónDemostración en vivo: Construcción de un sistema de almacenamiento en caché de grado de producción en Go que nos ahorró $500/semanaTécnicas para usar IA para entender bases de código complejas en minutos en lugar de horasMejores prácticas para solicitar a los agentes de IA que obtengan exactamente el código que deseasErrores comunes a evitar al trabajar con asistentes de codificación de IAEstrategias para usar IA para acelerar el aprendizaje y reducir la dependencia de ingenieros seniorCómo combinar efectivamente la creatividad humana con las capacidades de implementación de IAYa sea que seas un desarrollador junior que busca acelerar tu aprendizaje o un ingeniero senior que desea optimizar tu flujo de trabajo, saldrás de esta masterclass con experiencia práctica en desarrollo asistido por IA que puedes aplicar inmediatamente a tus proyectos. A través de demostraciones de codificación en vivo y ejercicios prácticos, aprenderás cómo aprovechar Cline para escribir mejor código más rápido mientras te enfocas en lo que importa: resolver problemas reales.

artificial intelligence

Webinar gratuito: Construyendo aplicaciones Full Stack con Cursor

Productivity Conf for Devs and Tech Leaders

71 min

Webinar gratuito: Construyendo aplicaciones Full Stack con Cursor

Top Content

WorkshopFree

Mike Mikula

Para asistir al webinar, por favor regístrate aquí.En este webinar cubriré un proceso repetible sobre cómo iniciar aplicaciones Full Stack en Cursor. Espera entender técnicas como usar GPT para crear requisitos de producto, esquemas de base de datos, hojas de ruta y usar esos en notas para generar listas de verificación que guíen el desarrollo de la aplicación. Profundizaremos más en cómo corregir alucinaciones/errores que ocurren, indicaciones útiles para hacer que tu aplicación se vea y se sienta moderna, enfoques para conectar cada capa y más. Al final, ¡espera poder ejecutar tu propia aplicación Full Stack generada por IA en tu máquina!

fullstack artificial intelligence

Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React

React Advanced 2023

98 min

Trabajando con OpenAI y la Ingeniería de Prompts para Desarrolladores de React

Top Content

Workshop

Richard Moss

En esta masterclass daremos un recorrido por la IA aplicada desde la perspectiva de los desarrolladores de front end, enfocándonos en las mejores prácticas emergentes cuando se trata de trabajar con LLMs para construir grandes productos. Esta masterclass se basa en los aprendizajes obtenidos al trabajar con la API de OpenAI desde su debut en noviembre pasado para construir un MVP funcional que se convirtió en PowerModeAI (una herramienta de creación de ideas y presentaciones orientada al cliente).
En la masterclass habrá una mezcla de presentación y ejercicios prácticos para cubrir temas que incluyen:
- Fundamentos de GPT- Trampas de los LLMs- Mejores prácticas y técnicas de ingeniería de prompts- Uso efectivo del playground- Instalación y configuración del SDK de OpenAI- Enfoques para trabajar con la API y la gestión de prompts- Implementación de la API para construir una aplicación orientada al cliente potenciada por IA- Ajuste fino y embeddings- Mejores prácticas emergentes en LLMOps

artificial intelligence openai react and ai