Vývoj 3D renderingu scén: Od NeRF, ADOP a Gaussian Splatting po TRIPS

V rubrikách 3D, AI/ML Štítky , , , ,
Save and Share:

Oblast 3D grafiky zažila pozoruhodný vývoj, a to zejména v technikách používaných pro rendering komplexních scén. Tento článek se ponoří do složitostí tří klíčových technologií, které utvářely tuto oblast: NeRF (Neural Radiance Fields, Neuronové sítě pro zářivost), ADOP (Approximate Differentiable One-Pixel Point Rendering, Přibližný diferencovatelný jednopixelový bodový rendering), Gaussian Splatting (Gaussovské rozstřikování) a TRIPS (Trilinear Point Splatting for Real-Time Radiance Field Rendering, Trilineární bodové rozstřikování pro real-time rendering polí zářivosti). Každá z nich představuje skok vpřed v naší snaze vytvářet stále realističtější virtuální světy.

Neural Radiance Fields (NeRF)

NeRF se objevila jako průlomový přístup, který transformuje kolekci 2D obrázků do navigovatelné 3D scény. Využívá neuronovou síť k učení 3D reprezentace scény ve vysokém rozlišení, což umožňuje rendering obrázků z různých úhlů pohledu s ohromujícím detailem a fotorealismem. Tato technologie našla uplatnění v různých oblastech, od virtuální reality po autonomní navigaci.

Instant NeRF: Další krok

Významným pokrokem v technologii NeRF je Instant NeRF. Byla vyvinuta společností NVIDIA a výrazně urychluje proces, trénuje se na několika desítkách fotografií během sekund a renderuje 3D scénu v milisekundách. Tato rychlá renderingová schopnost otevírá nové možnosti pro aplikace v reálném čase a mohla by způsobit revoluci ve vytváření 3D obsahu.

ADOP: Approximate Differentiable One-Pixel Point Rendering

ADOP, což je zkratka pro Approximate Differentiable One-Pixel Point Rendering, je bodově orientovaný, diferencovatelný neuronový renderingový pipeline představený Dariusem Rückertem, Linusem Frankem a Marcem Stammingerem. Tento systém je navržen tak, aby jako vstup přijímal kalibrované snímky z kamery a proxy geometrii scény, typicky point cloud (mračna bodů). Mračno bodů je poté rasterizováno s naučenými vektory vlastností jako barvami a pro vyplnění mezer a stínování každého výstupního pixelu je použita hluboká neuronová síť.

Rasterizér v ADOPu renderuje body jako jednopixelové splaty, což je nejen velmi rychlé, ale také to umožňuje efektivní výpočet gradientů vzhledem ke všem relevantním vstupním parametrům. Díky tomu je obzvláště vhodný pro aplikace, které vyžadují real-time renderingové frekvence, a to i pro modely s více než 100 miliony bodů.

Navíc ADOP zahrnuje plně diferencovatelný fotometrický model kamery založený na fyzikálních principech, který zahrnuje expozici, vyvážení bílé a funkci odezvy kamery. ADOP se řídí principy inverzního renderingu a upřesňuje svůj vstup, aby minimalizoval nekonzistence a optimalizoval kvalitu svého výstupu. To zahrnuje optimalizaci strukturálních parametrů, jako je poloha kamery, zkreslení objektivu, pozice bodů a vlastnosti, a také fotometrických parametrů, jako je funkce odezvy kamery, vinětace a expozice a vyvážení bílé pro každý snímek.

Díky své schopnosti plynule zpracovávat vstupní snímky s proměnlivou expozicí a vyvážením bílé a své schopnosti generovat výstup s vysokým dynamickým rozsahem představuje ADOP významný pokrok v oblasti neuronového renderingu. Pokud se zajímáte o počítačovou grafiku, zejména o alternativy ke Gaussian splattingu, mohl by být přístup ADOPu k bodové rasterizaci a upřesňování scén docela relevantní pro vaši práci nebo výzkum.

Gaussian Splatting

Přesuňme se k tradičním metodám, Gaussian Splatting představuje osvědčenou techniku pro objemový rendering a grafiku založenou na bodech. Promítá 3D data na 2D rovinu pomocí Gaussových distribucí, čímž vytváří plynulé přechody a renderuje objemová data, jako jsou lékařské skeny, s působivou čistotou.

Nedávný vývoj

Nedávné pokroky představily 3D Gaussian Splatting (3DGS), které urychluje rychlost renderingu a poskytuje explicitní reprezentaci scén. To usnadňuje dynamickou rekonstrukci a editační úkoly, a posouvá hranice toho, čeho lze dosáhnout s tradičními metodami splattingu.

TRIPS: Hranice real-time renderingu

TRIPS představuje nejmodernější technologii, která kombinuje silné stránky Gaussian Splatting a ADOP (Adaptive Density Point Clouds, Adaptivní mračna bodů hustoty). Rasterizuje body do obrazové pyramidy v obrazovém prostoru, což umožňuje rendering velkých bodů jediným trilineárním zápisem. Lehká neuronová síť poté rekonstruuje detailní obraz bez děr.

Proč TRIPS vyniká

  • Real-Time výkon: TRIPS udržuje 60 fps frekvenci na standardním hardwaru, což ho činí vhodným pro aplikace v reálném čase.
  • Diferencovatelný renderingový pipeline: Diferencovatelnost pipeline znamená, že velikosti a pozice bodů mohou být automaticky optimalizovány, což zvyšuje kvalitu renderované scény.
  • Kvalita v náročných scénářích: TRIPS vyniká v renderingu komplexních geometrií a rozsáhlých krajin, poskytuje lepší časovou stabilitu a detaily než předchozí metody.

TRIPS Pipeline

TRIPS trilineárně renderuje mračna bodů jako 2x2x2 splaty do vícevrstvých map vlastností, přičemž výsledky procházejí malou neuronovou sítí, obsahující pouze jednu gated konvoluci na vrstvu. Tento pipeline je kompletně diferencovatelný, což umožňuje optimalizaci deskriptorů bodů (barev) a pozic, stejně jako parametrů kamery, pomocí gradientního sestupu.
Trilineární bodové rozstřikování: (vlevo) Všechny body a jejich příslušné velikosti se promítají na cílový obraz. Na základě této velikosti v obrazovém prostoru se každý bod zapisuje do správné vrstvy obrazové pyramidy pomocí trilineárního zápisu (vpravo). Velké body se zapisují do vrstev s nižším rozlišením, a proto pokrývají více prostoru v konečném obraze.

TRIPS Zdroje

Závěrem

Cesta od NeRF k TRIPS shrnuje rychlý pokrok v oblasti 3D renderingu scén. Jak se posouváme k efektivnějším metodám s vyšší věrností, potenciál pro vytváření pohlcujících virtuálních zážitků se stává stále hmatatelnějším. Tyto technologie nejen posouvají hranice v grafice, ale také otevírají cestu pro inovace v různých průmyslových odvětvích, od zábavy po urbanistické plánování.

Pro ty, kteří se chtějí do těchto technologií ponořit hlouběji, je k dispozici bohatství zdrojů, včetně komplexních recenzí a open-source platforem, které usnadňují vývoj NeRF projektů. Budoucnost 3D renderingu je světlá a právě technologie jako NeRF, Gaussian Splatting a TRIPS osvětlují cestu vpřed.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *