A Evolução da Renderização de Cenas 3D: De NeRF, ADOP e Gaussian Splatting a TRIPS

Categorizado como 3D, AI/ML Etiquetas: , , , ,
Save and Share:

O domínio dos gráficos 3D tem assistido a uma evolução notável, particularmente nas técnicas usadas para renderizar cenas complexas. Este artigo aprofunda as complexidades de três tecnologias cruciais que moldaram o panorama: NeRF (Neural Radiance Fields), ADOP (Approximate Differentiable One-Pixel Point Rendering), Gaussian Splatting e TRIPS (Trilinear Point Splatting for Real-Time Radiance Field Rendering). Cada uma representa um salto em frente na nossa busca para criar mundos virtuais cada vez mais realistas.

Neural Radiance Fields (NeRF)

NeRF surgiu como uma abordagem inovadora, transformando uma coleção de imagens 2D numa cena 3D navegável. Utiliza uma rede neural para aprender a representação 3D de alta resolução de uma cena, permitindo a renderização de imagens de diferentes pontos de vista com detalhes e fotorrealismo surpreendentes. A tecnologia encontrou aplicações em vários domínios, desde a realidade virtual à navegação autónoma.

Instant NeRF: O Próximo Passo

Um avanço notável na tecnologia NeRF é o Instant NeRF. Desenvolvido pela NVIDIA, acelera significativamente o processo, treinando com algumas dezenas de fotos em segundos e renderizando a cena 3D em milissegundos. Esta capacidade de renderização rápida abre novas possibilidades para aplicações em tempo real e pode revolucionar a criação de conteúdo 3D.

ADOP: Approximate Differentiable One-Pixel Point Rendering

ADOP, que significa Approximate Differentiable One-Pixel Point Rendering, é um pipeline de renderização neural diferenciável baseado em pontos, introduzido por Darius Rückert, Linus Franke e Marc Stamminger. Este sistema foi concebido para receber como entrada imagens de câmara calibradas e uma geometria proxy da cena, tipicamente uma nuvem de pontos. A nuvem de pontos é então rasterizada com vetores de características aprendidas como cores, e uma rede neural profunda é utilizada para preencher as lacunas e sombrear cada pixel de saída.

O rasterizador no ADOP renderiza pontos como splats de um pixel, o que não é apenas muito rápido, mas também permite o cálculo eficiente de gradientes em relação a todos os parâmetros de entrada relevantes. Isto torna-o particularmente adequado para aplicações que exigem taxas de renderização em tempo real, mesmo para modelos com bem mais de 100 milhões de pontos.

Além disso, o ADOP inclui um modelo de câmara fotométrica totalmente diferenciável e baseado em princípios físicos, que engloba a exposição, o balanço de brancos e uma função de resposta da câmara. Ao seguir os princípios da renderização inversa, o ADOP refina a sua entrada para minimizar inconsistências e otimizar a qualidade da sua saída. Isto inclui a otimização de parâmetros estruturais como a pose da câmara, distorções da lente, posições dos pontos e características, bem como parâmetros fotométricos, tais como a função de resposta da câmara, vinhetagem e exposição e balanço de brancos por imagem.

Devido à sua capacidade de lidar suavemente com imagens de entrada com exposição e balanço de brancos variáveis, e à sua capacidade de gerar saída de alta gama dinâmica, o ADOP representa um avanço significativo no campo da renderização neural. Se tem interesse em computação gráfica, especialmente alternativas ao Gaussian splatting, a abordagem do ADOP à rasterização de pontos e ao refinamento de cenas pode ser bastante relevante para o seu trabalho ou investigação.

Gaussian Splatting

Passando para métodos tradicionais, o Gaussian Splatting destaca-se como uma técnica comprovada para renderização volumétrica e gráficos baseados em pontos. Projeta dados 3D num plano 2D utilizando distribuições Gaussianas, criando transições suaves e renderizando dados volumétricos como exames médicos com impressionante clareza.

Desenvolvimentos Recentes

Avanços recentes introduziram o 3D Gaussian Splatting (3DGS), que acelera as velocidades de renderização e fornece uma representação explícita de cenas. Isto facilita tarefas dinâmicas de reconstrução e edição, expandindo os limites do que pode ser alcançado com métodos tradicionais de splatting.

TRIPS: A Fronteira da Renderização em Tempo Real

TRIPS representa a vanguarda, combinando os pontos fortes do Gaussian Splatting e do ADOP (Adaptive Density Point Clouds). Rasteriza pontos numa pirâmide de imagens no espaço do ecrã, permitindo a renderização de pontos grandes com uma única escrita trilinear. Uma rede neural leve reconstrói então uma imagem detalhada e sem falhas.

Por que razão o TRIPS se Destaca

  • Desempenho em Tempo Real: O TRIPS mantém uma taxa de 60 fps em hardware padrão, tornando-o adequado para aplicações em tempo real.
  • Pipeline de Renderização Diferenciável: A diferenciabilidade do pipeline significa que os tamanhos e posições dos pontos podem ser otimizados automaticamente, melhorando a qualidade da cena renderizada.
  • Qualidade em Cenários Desafiantes: O TRIPS destaca-se na renderização de geometrias complexas e paisagens extensas, proporcionando melhor estabilidade temporal e detalhe do que os métodos anteriores.

Pipeline do TRIPS

O TRIPS renderiza uma nuvem de pontos trilinearmente como splats 2x2x2 em mapas de características multicamadas, com os resultados a serem passados através de uma pequena rede neural, contendo apenas uma única convolução gated por camada. Este pipeline é completamente diferenciável, permitindo a otimização de descritores de pontos (cores) e posições, bem como parâmetros da câmara, através de descida de gradiente.
Trilinear Point Splatting: (esquerda) Todos os pontos e os seus respetivos tamanhos são projetados na imagem de destino. Com base neste tamanho no espaço do ecrã, cada ponto é escrito na camada correta da pirâmide de imagens usando escrita trilinear (direita). Pontos grandes são escritos em camadas de menor resolução e, portanto, cobrem mais espaço na imagem final.

Recursos do TRIPS

Concluindo

A jornada do NeRF ao TRIPS encapsula o rápido progresso na renderização de cenas 3D. À medida que avançamos para métodos mais eficientes e de alta fidelidade, o potencial para criar experiências virtuais imersivas torna-se cada vez mais tangível. Estas tecnologias não só expandem os limites nos gráficos, como também abrem caminho para inovações em vários setores, desde o entretenimento ao planeamento urbano.

Para aqueles que procuram aprofundar estas tecnologias, existe uma vasta gama de recursos disponíveis, incluindo revisões abrangentes e plataformas de código aberto que facilitam o desenvolvimento de projetos NeRF. O futuro da renderização 3D é promissor, e são tecnologias como o NeRF, o Gaussian Splatting e o TRIPS que irão iluminar o caminho a seguir.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *