Еволюцията на 3D рендирането на сцени: от NeRF, ADOP и Gaussian Splatting до TRIPS

Categorized as 3D, AI/ML Tagged , , , ,
Save and Share:

Сферата на 3D графиката е свидетел на забележителна еволюция, особено в техниките, използвани за рендиране на сложни сцени. Тази статия се задълбочава в тънкостите на три ключови технологии, които оформиха пейзажа: NeRF (Neural Radiance Fields – Невронни лъчисти полета), ADOP (Approximate Differentiable One-Pixel Point Rendering – Приблизително диференцируемо точково рендиране с един пиксел), Gaussian Splatting (Гаусово разпръскване) и TRIPS (Trilinear Point Splatting for Real-Time Radiance Field Rendering – Трилинейно точково разпръскване за рендиране на лъчисти полета в реално време). Всяка от тях представлява скок напред в стремежа ни да създаваме все по-реалистични виртуални светове.

Neural Radiance Fields (NeRF)

NeRF се появи като революционен подход, трансформиращ колекция от 2D изображения в 3D сцена, достъпна за навигация. Той използва невронна мрежа, за да изучи 3D представяне с висока разделителна способност на дадена сцена, позволявайки рендиране на изображения от различни гледни точки с изумителна детайлност и фотореализъм. Технологията намери приложение в различни области, от виртуална реалност до автономна навигация.

Instant NeRF: Следващата стъпка

Забележителен напредък в NeRF технологията е Instant NeRF. Разработен от NVIDIA, той значително ускорява процеса, като се обучава върху няколко десетки снимки за секунди и рендира 3D сцената за милисекунди. Тази бърза способност за рендиране отваря нови възможности за приложения в реално време и би могла да революционизира създаването на 3D съдържание.

ADOP: Approximate Differentiable One-Pixel Point Rendering

ADOP, което е съкращение от Approximate Differentiable One-Pixel Point Rendering, е базиран на точки, диференцируем конвейер за невронно рендиране, представен от Дариус Рюкерт, Линус Франке и Марк Щамингер. Тази система е проектирана да приема калибрирани изображения от камера и прокси геометрия на сцената, обикновено облак от точки, като вход. След това облакът от точки се растеризира с научени вектори на характеристики като цветове и се използва дълбока невронна мрежа, за да запълни празнините и да засенчи всеки изходен пиксел.

Растеризаторът в ADOP рендира точки като еднопикселни „петна“, което е не само много бързо, но и позволява ефективно изчисляване на градиенти по отношение на всички съответни входни параметри. Това го прави особено подходящ за приложения, които изискват честота на рендиране в реално време, дори за модели с над 100 милиона точки.

Освен това ADOP включва напълно диференцируем, физически обоснован фотометричен модел на камера, който обхваща експозиция, баланс на бялото и функция за реакция на камерата. Следвайки принципите на обратното рендиране, ADOP прецизира своя вход, за да минимизира несъответствията и да оптимизира качеството на своя изход. Това включва оптимизиране на структурни параметри като поза на камерата, изкривявания на обектива, позиции на точки и характеристики, както и фотометрични параметри като функция за реакция на камерата, винетиране и експозиция и баланс на бялото за всяко изображение.

Благодарение на способността си да обработва входни изображения с променлива експозиция и баланс на бялото гладко и способността си да генерира изход с висок динамичен обхват, ADOP представлява значителен напредък в областта на невронното рендиране. Ако се интересувате от компютърна графика, особено от алтернативи на гаусовото разпръскване, подходът на ADOP към точкова растеризация и прецизиране на сцената може да бъде доста релевантен за вашата работа или изследвания.

Gaussian Splatting

Преминавайки към традиционните методи, Gaussian Splatting се откроява като изпитана и доказана техника за обемно рендиране и базирана на точки графика. Тя проектира 3D данни върху 2D равнина, използвайки гаусови разпределения, създавайки плавни преходи и рендирайки обемни данни като медицински сканирания с впечатляваща яснота.

Скорошни разработки

Скорошни постижения въведоха 3D Gaussian Splatting (3DGS), което ускорява скоростите на рендиране и осигурява изрично представяне на сцени. Това улеснява задачите за динамична реконструкция и редактиране, разширявайки границите на това, което може да се постигне с традиционни методи за разпръскване.

TRIPS: Границата на рендирането в реално време

TRIPS представлява върха на технологиите, комбинирайки силните страни на Gaussian Splatting и ADOP (Adaptive Density Point Clouds – Адаптивни облаци от точки с плътност). Той растеризира точки в образцова пирамида в екранното пространство, позволявайки рендиране на големи точки с едно-единствено трилинейно записване. След това лека невронна мрежа реконструира детайлно изображение без дупки.

Защо TRIPS се отличава

  • Производителност в реално време: TRIPS поддържа честота от 60 кадъра в секунда на стандартен хардуер, което го прави подходящ за приложения в реално време.
  • Диференцируем конвейер за рендиране: Диференцируемостта на конвейера означава, че размерите и позициите на точките могат да бъдат оптимизирани автоматично, подобрявайки качеството на рендираната сцена.
  • Качество в предизвикателни сценарии: TRIPS се отличава с рендиране на сложни геометрии и обширни пейзажи, осигурявайки по-добра времева стабилност и детайлност от предишни методи.

Конвейер на TRIPS

TRIPS рендира облак от точки трилинейно като 2x2x2 петна в многослойни карти на характеристиките, като резултатите се предават през малка невронна мрежа, съдържаща само една затворена конволюция на слой. Този конвейер е напълно диференцируем, което позволява оптимизация на точкови дескриптори (цветове) и позиции, както и параметри на камерата, чрез градиентно спускане.
Трилинейно точково разпръскване: (ляво) Всички точки и съответните им размери се проектират върху целевото изображение. Въз основа на този размер в екранното пространство, всяка точка се записва в правилния слой на пирамидата от изображения, използвайки трилинейно записване (дясно). Големите точки се записват в слоеве с по-ниска разделителна способност и следователно покриват повече пространство в крайното изображение.

Ресурси за TRIPS

В заключение

Пътят от NeRF до TRIPS обхваща бързия напредък в 3D рендирането на сцени. Докато се движим към по-ефективни и висококачествени методи, потенциалът за създаване на поглъщащи виртуални преживявания става все по-осезаем. Тези технологии не само разширяват границите в графиката, но и проправят пътя за иновации в различни индустрии, от развлечения до градоустройство.

За тези, които искат да се задълбочат в тези технологии, е налично богатство от ресурси, включително изчерпателни обзори и платформи с отворен код, които улесняват разработването на NeRF проекти. Бъдещето на 3D рендирането е светло и именно технологии като NeRF, Gaussian Splatting и TRIPS ще осветят пътя напред.

Leave a comment

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *