Utvecklingen av 3D-scenrendering: Från NeRF, ADOP och Gaussian Splatting till TRIPS

Kategoriserat som 3D, AI/ML Märkt , , , ,
Save and Share:

Inom 3D-grafik har vi sett en anmärkningsvärd utveckling, särskilt i teknikerna som används för att rendera komplexa scener. Den här artikeln fördjupar sig i detaljerna kring tre centrala tekniker som har format landskapet: NeRF (Neural Radiance Fields), ADOP (Approximate Differentiable One-Pixel Point Rendering), Gaussian Splatting och TRIPS (Trilinear Point Splatting for Real-Time Radiance Field Rendering). Var och en representerar ett stort steg framåt i vår strävan att skapa alltmer realistiska virtuella världar.

Neural Radiance Fields (NeRF)

NeRF framträdde som ett banbrytande tillvägagångssätt som transformerar en samling 2D-bilder till en navigerbar 3D-scen. Den använder ett neuralt nätverk för att lära sig en scens högupplösta 3D-representation, vilket möjliggör rendering av bilder från olika synvinklar med enastående detaljrikedom och fotorealism. Tekniken har funnit användningsområden inom olika domäner, från virtuell verklighet till autonom navigering.

Instant NeRF: Nästa steg

En anmärkningsvärd vidareutveckling inom NeRF-tekniken är Instant NeRF. Utvecklad av NVIDIA, den påskyndar processen avsevärt, tränar på ett par dussin foton på några sekunder och renderar 3D-scenen på millisekunder. Denna snabba rendering öppnar upp nya möjligheter för realtidsapplikationer och kan revolutionera skapandet av 3D-innehåll.

ADOP: Approximate Differentiable One-Pixel Point Rendering

ADOP, som står för Approximate Differentiable One-Pixel Point Rendering, är en punktbaserad, differentierbar neural renderingspipeline som introducerades av Darius Rückert, Linus Franke och Marc Stamminger. Systemet är utformat för att ta kalibrerade kamerabilder och en proxygeometri av scenen, vanligtvis ett punktmoln, som indata. Punktmolnet rastreras sedan med inlärda vektoriserade egenskaper som färger, och ett djupt neuralt nätverk används för att fylla i luckorna och skugga varje utdatapixel.

Rastreraren i ADOP renderar punkter som enpixelssplats, vilket inte bara är mycket snabbt utan också möjliggör effektiv beräkning av gradienter med avseende på alla relevanta inparametrar. Detta gör det särskilt lämpligt för applikationer som kräver rendering i realtid, även för modeller med långt över 100 miljoner punkter.

Dessutom inkluderar ADOP en fullständigt differentierbar, fysikaliskt baserad fotometrisk kameramodell, som omfattar exponering, vitbalans och en kameraresponsfunktion. Genom att följa principerna för invers rendering förfinar ADOP sin indata för att minimera inkonsekvenser och optimera kvaliteten på sin utdata. Detta inkluderar optimering av strukturparametrar som kameraposition, linsförvrängningar, punktpositioner och -egenskaper, samt fotometriska parametrar som kameraresponsfunktion, vinjettering och per-bilds exponering och vitbalans.

På grund av sin förmåga att smidigt hantera indatabilder med varierande exponering och vitbalans, och sin kapacitet att generera utdata med högt dynamiskt omfång, representerar ADOP ett betydande framsteg inom neural rendering. Om du är intresserad av datorgrafik, särskilt alternativ till Gaussian splatting, kan ADOP:s tillvägagångssätt för punktrasterisering och scenförfining vara mycket relevant för ditt arbete eller din forskning.

Gaussian Splatting

Övergår vi till traditionella metoder, står Gaussian Splatting som en beprövad teknik för volymrendering och punktbaserad grafik. Den projicerar 3D-data på ett 2D-plan med hjälp av Gaussiska fördelningar, vilket skapar mjuka övergångar och renderar volymetrisk data som medicinska skanningar med imponerande tydlighet.

Senaste utvecklingen

Nyligen har framsteg introducerat 3D Gaussian Splatting (3DGS), vilket accelererar renderingshastigheter och ger en explicit representation av scener. Detta underlättar dynamisk rekonstruktion och redigeringsuppgifter, vilket flyttar fram gränserna för vad som kan uppnås med traditionella splattingmetoder.

TRIPS: Frontlinjen inom realtidsrendering

TRIPS representerar det allra senaste och kombinerar styrkorna hos Gaussian Splatting och ADOP (Adaptive Density Point Clouds). Den rastrerar punkter till en bildpyramid i skärmrymd, vilket möjliggör rendering av stora punkter med en enda trilineär skrivning. Ett lättviktigt neuralt nätverk rekonstruerar sedan en detaljerad och hålfri bild.

Varför TRIPS sticker ut

  • Realtidsprestanda: TRIPS upprätthåller en frekvens på 60 fps på standardhårdvara, vilket gör den lämplig för realtidsapplikationer.
  • Differentierbar renderingspipeline: Pipeline:ns differentierbarhet innebär att punktstorlekar och -positioner kan optimeras automatiskt, vilket förbättrar kvaliteten på den renderade scenen.
  • Kvalitet i utmanande scenarier: TRIPS utmärker sig i rendering av komplexa geometrier och vidsträckta landskap och ger bättre temporal stabilitet och detaljrikedom än tidigare metoder.

TRIPS Pipeline

TRIPS renderar ett punktmoln trilineärt som 2x2x2 splats i flerskiktade funktionskartor, där resultaten skickas genom ett litet neuralt nätverk som endast innehåller en enda gated convolution per lager. Denna pipeline är helt differentierbar, vilket möjliggör optimering av punktbeskrivare (färger) och positioner, samt kameraparametrar, via gradientnedstigning.
Trilineär punkt-splatting: (vänster) Alla punkter och deras respektive storlekar projiceras på målbilden. Baserat på denna skärmrums-storlek skrivs varje punkt till rätt lager i bildpyramiden med hjälp av trilineär skrivning (höger). Stora punkter skrivs till lager med lägre upplösning och täcker därför mer utrymme i den slutliga bilden.

TRIPS Resurser

Sammanfattning

Resan från NeRF till TRIPS sammanfattar de snabba framstegen inom 3D-scenrendering. I takt med att vi rör oss mot effektivare metoder med högre kvalitet, blir potentialen att skapa engagerande virtuella upplevelser alltmer påtaglig. Dessa tekniker flyttar inte bara fram gränserna inom grafik utan banar också väg för innovationer inom olika branscher, från underhållning till stadsplanering.

För de som vill fördjupa sig ytterligare i dessa tekniker finns en mängd resurser tillgängliga, inklusive omfattande recensioner och plattformar med öppen källkod som underlättar utvecklingen av NeRF-projekt. Framtiden för 3D-rendering är ljus, och det är tekniker som NeRF, Gaussian Splatting och TRIPS som kommer att lysa upp vägen framåt.

Lämna en kommentar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *