L’évolution du rendu de scènes 3D : de NeRF, ADOP et Gaussian Splatting à TRIPS

Catégorisé comme 3D, AI/ML Étiqueté , , , ,
Save and Share:

Le domaine des graphismes 3D a connu une évolution remarquable, en particulier dans les techniques utilisées pour le rendu de scènes complexes. Cet article se penche sur les subtilités de trois technologies cruciales qui ont façonné ce paysage : NeRF (Neural Radiance Fields), ADOP (Approximate Differentiable One-Pixel Point Rendering), Gaussian Splatting, et TRIPS (Trilinear Point Splatting for Real-Time Radiance Field Rendering). Chacune représente un pas en avant dans notre quête pour créer des mondes virtuels toujours plus réalistes.

Neural Radiance Fields (NeRF)

NeRF a émergé comme une approche révolutionnaire, transformant une collection d’images 2D en une scène 3D navigable. Il utilise un réseau neuronal pour apprendre une représentation 3D haute résolution d’une scène, permettant le rendu d’images à partir de différents points de vue avec un niveau de détail et un photoréalisme étonnants. Cette technologie a trouvé des applications dans divers domaines, de la réalité virtuelle à la navigation autonome.

Instant NeRF : L’étape suivante

Une avancée notable dans la technologie NeRF est Instant NeRF. Développé par NVIDIA, il accélère considérablement le processus, s’entraînant sur quelques dizaines de photos en quelques secondes et effectuant le rendu de la scène 3D en millisecondes. Cette capacité de rendu rapide ouvre de nouvelles possibilités pour les applications en temps réel et pourrait révolutionner la création de contenu 3D.

ADOP : Approximate Differentiable One-Pixel Point Rendering

ADOP, qui signifie Approximate Differentiable One-Pixel Point Rendering, est un pipeline de rendu neuronal différentiable basé sur des points, introduit par Darius Rückert, Linus Franke et Marc Stamminger. Ce système est conçu pour prendre en entrée des images de caméra calibrées et une géométrie proxy de la scène, typiquement un nuage de points. Le nuage de points est ensuite rasterisé avec des vecteurs de caractéristiques appris en tant que couleurs, et un réseau neuronal profond est utilisé pour combler les lacunes et ombrager chaque pixel de sortie.

Le rasteriseur d’ADOP effectue le rendu des points sous forme de « splats » d’un pixel, ce qui est non seulement très rapide, mais permet également un calcul efficace des gradients par rapport à tous les paramètres d’entrée pertinents. Cela le rend particulièrement adapté aux applications qui nécessitent des fréquences de rendu en temps réel, même pour des modèles comptant largement plus de 100 millions de points.

De plus, ADOP inclut un modèle de caméra photométrique physiquement réaliste et entièrement différentiable, qui englobe l’exposition, la balance des blancs et une fonction de réponse de la caméra. En suivant les principes du rendu inverse, ADOP affine ses entrées pour minimiser les incohérences et optimiser la qualité de sa sortie. Cela comprend l’optimisation de paramètres structurels tels que la pose de la caméra, les distorsions de l’objectif, les positions des points et les caractéristiques, ainsi que des paramètres photométriques tels que la fonction de réponse de la caméra, le vignettage, et l’exposition et la balance des blancs par image.

Grâce à sa capacité à gérer en douceur des images d’entrée avec une exposition et une balance des blancs variables, et à sa capacité à générer une sortie à plage dynamique élevée, ADOP représente une avancée significative dans le domaine du rendu neuronal. Si vous vous intéressez à l’infographie, en particulier aux alternatives à Gaussian Splatting, l’approche d’ADOP en matière de rastérisation de points et d’affinage de scène pourrait être tout à fait pertinente pour votre travail ou vos recherches.

Gaussian Splatting

En passant aux méthodes traditionnelles, Gaussian Splatting se présente comme une technique éprouvée pour le rendu volumétrique et les graphismes basés sur des points. Il projette des données 3D sur un plan 2D en utilisant des distributions gaussiennes, créant des transitions douces et effectuant le rendu de données volumétriques telles que des scans médicaux avec une clarté impressionnante.

Développements récents

Des avancées récentes ont introduit le 3D Gaussian Splatting (3DGS), qui accélère les vitesses de rendu et fournit une représentation explicite des scènes. Cela facilite la reconstruction dynamique et les tâches d’édition, repoussant les limites de ce qui peut être réalisé avec les méthodes de splatting traditionnelles.

TRIPS : La frontière du rendu en temps réel

TRIPS représente la pointe de la technologie, combinant les forces de Gaussian Splatting et d’ADOP (Adaptive Density Point Clouds). Il rastérise les points dans une pyramide d’images en espace écran, permettant le rendu de grands points avec une seule écriture trilinéaire. Un réseau neuronal léger reconstruit ensuite une image détaillée et sans trous.

Pourquoi TRIPS se distingue

  • Performance en temps réel : TRIPS maintient une fréquence de 60 fps sur du matériel standard, ce qui le rend adapté aux applications en temps réel.
  • Pipeline de rendu différentiable : La différentiabilité du pipeline signifie que les tailles et les positions des points peuvent être optimisées automatiquement, améliorant la qualité de la scène rendue.
  • Qualité dans des scénarios complexes : TRIPS excelle dans le rendu de géométries complexes et de paysages étendus, offrant une meilleure stabilité temporelle et plus de détails que les méthodes précédentes.

Pipeline TRIPS

TRIPS effectue un rendu trilinéaire d’un nuage de points sous forme de splats 2x2x2 dans des cartes de caractéristiques multicouches, les résultats étant transmis à un petit réseau neuronal, contenant une seule convolution « gated » par couche. Ce pipeline est entièrement différentiable, permettant l’optimisation des descripteurs de points (couleurs) et des positions, ainsi que des paramètres de la caméra, par descente de gradient.
Trilinear Point Splatting (Splatting de points trilinéaire) : (gauche) Tous les points et leurs tailles respectives sont projetés sur l’image cible. En fonction de cette taille en espace écran, chaque point est écrit dans la couche correcte de la pyramide d’images en utilisant l’écriture trilinéaire (droite). Les grands points sont écrits dans des couches de résolution inférieure et couvrent donc plus d’espace dans l’image finale.

Ressources TRIPS

Conclusion

Le parcours de NeRF à TRIPS résume les progrès rapides réalisés dans le rendu de scènes 3D. À mesure que nous avançons vers des méthodes plus efficaces et de haute fidélité, le potentiel de création d’expériences virtuelles immersives devient de plus en plus tangible. Ces technologies ne se contentent pas de repousser les limites des graphismes, mais ouvrent également la voie à des innovations dans divers secteurs, du divertissement à l’urbanisme.

Pour ceux qui cherchent à approfondir ces technologies, une multitude de ressources sont disponibles, notamment des revues complètes et des plateformes open-source qui facilitent le développement de projets NeRF. L’avenir du rendu 3D est prometteur, et ce sont des technologies comme NeRF, Gaussian Splatting et TRIPS qui éclaireront la voie à suivre.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *