วิวัฒนาการของการเรนเดอร์ฉาก 3 มิติ: จาก NeRF, ADOP และ Gaussian Splatting สู่ TRIPS

Categorized as 3D, AI/ML Tagged , , , ,
Save and Share:

ขอบเขตของกราฟิก 3 มิติได้เห็นวิวัฒนาการที่น่าทึ่ง โดยเฉพาะอย่างยิ่งในเทคนิคที่ใช้สำหรับการเรนเดอร์ฉากที่ซับซ้อน บทความนี้จะเจาะลึกถึงความซับซ้อนของเทคโนโลยีสำคัญสามประการที่ได้หล่อหลอมภูมิทัศน์นี้: NeRF (Neural Radiance Fields), ADOP (Approximate Differentiable One-Pixel Point Rendering), Gaussian Splatting และ TRIPS (Trilinear Point Splatting for Real-Time Radiance Field Rendering) แต่ละเทคโนโลยีแสดงถึงก้าวกระโดดไปข้างหน้าในการแสวงหาของเราเพื่อสร้างโลกเสมือนจริงที่สมจริงยิ่งขึ้น

Neural Radiance Fields (NeRF)

NeRF ปรากฏขึ้นในฐานะแนวทางที่ก้าวล้ำ เปลี่ยนคอลเล็กชันภาพ 2 มิติให้เป็นฉาก 3 มิติที่นำทางได้ โดยใช้โครงข่ายประสาทเทียมเพื่อเรียนรู้การแสดงฉาก 3 มิติที่มีความละเอียดสูง ทำให้สามารถเรนเดอร์ภาพจากมุมมองที่แตกต่างกันด้วยรายละเอียดและความสมจริงดั่งภาพถ่ายที่น่าทึ่ง เทคโนโลยีนี้ได้พบการประยุกต์ใช้ในหลากหลายโดเมน ตั้งแต่ความเป็นจริงเสมือนไปจนถึงการนำทางอัตโนมัติ

Instant NeRF: ขั้นตอนต่อไป

ความก้าวหน้าอย่างเห็นได้ชัดในเทคโนโลยี NeRF คือ Instant NeRF ซึ่งพัฒนาโดย NVIDIA ช่วยเร่งกระบวนการให้เร็วขึ้นอย่างมาก โดยฝึกฝนจากภาพถ่ายเพียงไม่กี่สิบภาพในไม่กี่วินาที และเรนเดอร์ฉาก 3 มิติในหน่วยมิลลิวินาที ความสามารถในการเรนเดอร์ที่รวดเร็วนี้เปิดโอกาสใหม่ๆ สำหรับแอปพลิเคชันแบบเรียลไทม์ และอาจปฏิวัติการสร้างสรรค์คอนเทนต์ 3 มิติ

ADOP: Approximate Differentiable One-Pixel Point Rendering

ADOP ซึ่งย่อมาจาก Approximate Differentiable One-Pixel Point Rendering เป็นไปป์ไลน์การเรนเดอร์โครงข่ายประสาทเทียมแบบดิฟเฟอเรนเชียลที่ใช้จุดเป็นพื้นฐาน ซึ่งเปิดตัวโดย Darius Rückert, Linus Franke และ Marc Stamminger ระบบนี้ได้รับการออกแบบมาเพื่อรับภาพถ่ายจากกล้องที่ปรับเทียบแล้วและเรขาคณิตพร็อกซีของฉาก ซึ่งโดยทั่วไปคือพอยต์คลาวด์ เป็นอินพุต จากนั้นพอยต์คลาวด์จะถูกแรสเตอร์ไรซ์ด้วยฟีเจอร์เวกเตอร์ที่เรียนรู้เป็นสี และโครงข่ายประสาทเทียมเชิงลึกถูกนำมาใช้เพื่อเติมเต็มช่องว่างและให้แสงเงาแก่แต่ละพิกเซลเอาต์พุต

ตัวแรสเตอร์ไรซ์ใน ADOP เรนเดอร์จุดเป็นสแพลตพิกเซลเดียว ซึ่งไม่เพียงแต่รวดเร็วมากเท่านั้น แต่ยังช่วยให้สามารถคำนวณเกรเดียนท์ที่เกี่ยวข้องกับพารามิเตอร์อินพุตที่เกี่ยวข้องทั้งหมดได้อย่างมีประสิทธิภาพอีกด้วย ทำให้เหมาะอย่างยิ่งสำหรับแอปพลิเคชันที่ต้องการอัตราการเรนเดอร์แบบเรียลไทม์ แม้แต่สำหรับโมเดลที่มีจุดมากกว่า 100 ล้านจุด

นอกจากนี้ ADOP ยังรวมถึงโมเดลกล้องถ่ายภาพเชิงแสงแบบฟิสิกส์ที่เป็นดิฟเฟอเรนเชียลอย่างเต็มรูปแบบ ซึ่งครอบคลุมถึงค่าแสง สมดุลแสงขาว และฟังก์ชันการตอบสนองของกล้อง ด้วยการปฏิบัติตามหลักการของการเรนเดอร์แบบผกผัน ADOP จะปรับปรุงอินพุตเพื่อลดความไม่สอดคล้องกันและปรับคุณภาพของเอาต์พุตให้เหมาะสม ซึ่งรวมถึงการปรับพารามิเตอร์โครงสร้างให้เหมาะสม เช่น โพสของกล้อง การบิดเบี้ยวของเลนส์ ตำแหน่งจุด และคุณสมบัติ รวมถึงพารามิเตอร์การถ่ายภาพ เช่น ฟังก์ชันการตอบสนองของกล้อง วิกเน็ตติ้ง และค่าแสงและความสมดุลแสงขาวต่อภาพ

ด้วยความสามารถในการจัดการภาพอินพุตที่มีค่าแสงและความสมดุลแสงขาวที่แตกต่างกันได้อย่างราบรื่น และความสามารถในการสร้างเอาต์พุตช่วงไดนามิกสูง ADOP แสดงถึงความก้าวหน้าที่สำคัญในด้านการเรนเดอร์โครงข่ายประสาทเทียม หากคุณสนใจในคอมพิวเตอร์กราฟิก โดยเฉพาะอย่างยิ่งทางเลือกอื่นนอกเหนือจาก Gaussian splatting แนวทางการแรสเตอร์ไรซ์จุดและการปรับปรุงฉากของ ADOP อาจมีความเกี่ยวข้องอย่างมากต่องานวิจัยหรือการทำงานของคุณ

Gaussian Splatting

เมื่อย้ายไปสู่ระเบียบวิธีดั้งเดิม Gaussian Splatting ถือเป็นเทคนิคที่ผ่านการทดลองและทดสอบแล้วสำหรับการเรนเดอร์ปริมาตรและกราฟิกแบบจุด โดยจะฉายข้อมูล 3 มิติลงบนระนาบ 2 มิติโดยใช้การกระจายแบบ Gaussian สร้างการเปลี่ยนภาพที่ราบรื่นและเรนเดอร์ข้อมูลปริมาตร เช่น การสแกนทางการแพทย์ด้วยความคมชัดที่น่าประทับใจ

ความก้าวหน้าล่าสุด

ความก้าวหน้าล่าสุดได้นำเสนอ 3D Gaussian Splatting (3DGS) ซึ่งช่วยเร่งความเร็วในการเรนเดอร์และให้การแสดงฉากที่ชัดเจน สิ่งนี้อำนวยความสะดวกในการสร้างใหม่แบบไดนามิกและงานแก้ไข ซึ่งผลักดันขอบเขตของสิ่งที่เป็นไปได้ด้วยระเบียบวิธี splatting แบบดั้งเดิม

TRIPS: แนวหน้าของการเรนเดอร์แบบเรียลไทม์

TRIPS แสดงถึงความล้ำสมัย ผสมผสานจุดแข็งของ Gaussian Splatting และ ADOP (Adaptive Density Point Clouds) โดยจะแรสเตอร์ไรซ์จุดลงในพีระมิดภาพในปริภูมิหน้าจอ ทำให้สามารถเรนเดอร์จุดขนาดใหญ่ด้วยการเขียนแบบไตรลิเนียร์ครั้งเดียว จากนั้นโครงข่ายประสาทเทียมน้ำหนักเบาจะสร้างภาพที่มีรายละเอียดและปราศจากรูใหม่

เหตุผลที่ TRIPS โดดเด่น

  • ประสิทธิภาพแบบเรียลไทม์: TRIPS รักษาอัตรา 60 fps บนฮาร์ดแวร์มาตรฐาน ทำให้เหมาะสำหรับแอปพลิเคชันแบบเรียลไทม์
  • ไปป์ไลน์การเรนเดอร์แบบดิฟเฟอเรนเชียล: ความสามารถในการหาอนุพันธ์ของไปป์ไลน์หมายถึงขนาดและตำแหน่งจุดสามารถปรับให้เหมาะสมโดยอัตโนมัติ ซึ่งช่วยเพิ่มคุณภาพของฉากที่เรนเดอร์
  • คุณภาพในสถานการณ์ที่ท้าทาย: TRIPS โดดเด่นในการเรนเดอร์เรขาคณิตที่ซับซ้อนและภูมิประเทศที่กว้างใหญ่ ให้ความเสถียรตามเวลาและรายละเอียดที่ดีกว่าระเบียบวิธีก่อนหน้านี้

ไปป์ไลน์ TRIPS

TRIPS เรนเดอร์พอยต์คลาวด์แบบไตรลิเนียร์เป็นสแพลต 2x2x2 ลงในแผนที่ฟีเจอร์หลายชั้น โดยผลลัพธ์จะถูกส่งผ่านโครงข่ายประสาทเทียมขนาดเล็ก ซึ่งมีเพียงคอนโวลูชันแบบเกทเดียวต่อชั้น ไปป์ไลน์นี้เป็นดิฟเฟอเรนเชียลอย่างสมบูรณ์ ทำให้สามารถปรับตัวอธิบายจุด (สี) และตำแหน่ง รวมถึงพารามิเตอร์ของกล้องให้เหมาะสมผ่าน gradient descent
Trilinear Point Splatting: (ซ้าย) จุดทั้งหมดและขนาดที่เกี่ยวข้องจะถูกฉายภาพลงบนภาพเป้าหมาย จากขนาดปริภูมิหน้าจอนี้ แต่ละจุดจะถูกเขียนไปยังชั้นที่ถูกต้องของพีระมิดภาพโดยใช้การเขียนแบบไตรลิเนียร์ (ขวา) จุดขนาดใหญ่จะถูกเขียนไปยังชั้นที่มีความละเอียดต่ำกว่า และด้วยเหตุนี้จึงครอบคลุมพื้นที่มากขึ้นในภาพสุดท้าย

แหล่งข้อมูล TRIPS

สรุป

การเดินทางจาก NeRF ไปสู่ TRIPS รวบรวมความก้าวหน้าอย่างรวดเร็วในการเรนเดอร์ฉาก 3 มิติ ในขณะที่เราก้าวไปสู่ระเบียบวิธีที่มีประสิทธิภาพและความเที่ยงตรงสูงมากขึ้น ศักยภาพในการสร้างประสบการณ์เสมือนจริงที่ดื่มด่ำก็กลายเป็นรูปธรรมมากขึ้น เทคโนโลยีเหล่านี้ไม่เพียงแต่ผลักดันขอบเขตในด้านกราฟิกเท่านั้น แต่ยังปูทางไปสู่นวัตกรรมในอุตสาหกรรมต่างๆ ตั้งแต่ความบันเทิงไปจนถึงการวางผังเมืองอีกด้วย

สำหรับผู้ที่ต้องการเจาะลึกลงไปในเทคโนโลยีเหล่านี้ มีแหล่งข้อมูลมากมายให้ศึกษา รวมถึงบทวิจารณ์ที่ครอบคลุมและแพลตฟอร์มโอเพนซอร์สที่อำนวยความสะดวกในการพัฒนาโครงการ NeRF อนาคตของการเรนเดอร์ 3 มิตินั้นสดใส และเทคโนโลยีต่างๆ เช่น NeRF, Gaussian Splatting และ TRIPS จะส่องสว่างนำทางไปข้างหน้า

Leave a comment

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *