تطور تجسيد المشاهد ثلاثية الأبعاد: من NeRF و ADOP و Gaussian Splatting إلى TRIPS

مصنف كـ 3D، AI/ML موسوم كـ ، ، ، ،
Save and Share:

شهد عالم الرسوميات ثلاثية الأبعاد تطورًا ملحوظًا، خاصة في التقنيات المستخدمة لتجسيد المشاهد المعقدة. تتعمق هذه المقالة في تعقيدات ثلاث تقنيات محورية شكلت المشهد: NeRF (مجالات الإشعاع العصبي)، و ADOP (تجسيد النقاط التقريبي التفاضلي أحادي البكسل)، و Gaussian Splatting (توزيع غاوسي)، و TRIPS (توزيع النقاط ثلاثي الخطوط لتجسيد مجالات الإشعاع في الوقت الفعلي). يمثل كل منها قفزة إلى الأمام في سعينا لإنشاء عوالم افتراضية أكثر واقعية من أي وقت مضى.

مجالات الإشعاع العصبي (NeRF)

ظهرت NeRF كنهج رائد، حيث حولت مجموعة من الصور ثنائية الأبعاد إلى مشهد ثلاثي الأبعاد قابل للتصفح. تستخدم شبكة عصبية لتعلم تمثيل ثلاثي الأبعاد عالي الدقة للمشهد، مما يتيح تجسيد الصور من وجهات نظر مختلفة بتفاصيل مذهلة وواقعية ضوئية. وجدت هذه التقنية تطبيقات في مجالات متنوعة، من الواقع الافتراضي إلى الملاحة الذاتية.

Instant NeRF: الخطوة التالية

يعد Instant NeRF تطورًا ملحوظًا في تقنية NeRF. تم تطويره بواسطة NVIDIA، وهو يسرع العملية بشكل كبير، ويتدرب على بضعة عشرات من الصور في ثوانٍ ويجسد المشهد ثلاثي الأبعاد في أجزاء من الثانية. تفتح قدرة التجسيد السريع هذه إمكانيات جديدة للتطبيقات في الوقت الفعلي ويمكن أن تحدث ثورة في إنشاء المحتوى ثلاثي الأبعاد.

ADOP: تجسيد النقاط التقريبي التفاضلي أحادي البكسل

ADOP، الذي يرمز إلى Approximate Differentiable One-Pixel Point Rendering، هو مسار تجسيد عصبي تفاضلي قائم على النقاط قدمه داريوس روكرت ولينوس فرانك ومارك ستامينجر. تم تصميم هذا النظام لأخذ صور الكاميرا المعايرة وهندسة تقريبية للمشهد، وعادةً ما تكون سحابة نقطية، كمدخلات. ثم يتم تنقيط السحابة النقطية بمتجهات الميزات المتعلمة كألوان، ويتم استخدام شبكة عصبية عميقة لملء الفجوات وتظليل كل بكسل إخراج.

يقوم الراستر في ADOP بتجسيد النقاط كتوزيعات نقطية أحادية البكسل، وهو ليس سريعًا جدًا فحسب، بل يسمح أيضًا بالحساب الفعال للتدرجات فيما يتعلق بجميع معلمات الإدخال ذات الصلة. هذا يجعله مناسبًا بشكل خاص للتطبيقات التي تتطلب معدلات تجسيد في الوقت الفعلي، حتى بالنسبة للنماذج التي تحتوي على ما يزيد عن 100 مليون نقطة.

علاوة على ذلك، يشتمل ADOP على نموذج كاميرا ضوئي قائم على الفيزياء وقابل للتفاضل بالكامل، والذي يشمل التعريض الضوئي وتوازن اللون الأبيض ووظيفة استجابة الكاميرا. من خلال اتباع مبادئ التجسيد العكسي، يقوم ADOP بتحسين مدخلاته لتقليل التناقضات وتحسين جودة إخراجه. يتضمن ذلك تحسين المعلمات الهيكلية مثل وضعية الكاميرا وتشوهات العدسة ومواضع النقاط والميزات، بالإضافة إلى المعلمات الضوئية مثل وظيفة استجابة الكاميرا والتظليل والتعريض الضوئي وتوازن اللون الأبيض لكل صورة.

نظرًا لقدرة ADOP على التعامل مع الصور المدخلة بتعريض ضوئي وتوازن لون أبيض متفاوتين بسلاسة، وقدرته على توليد إخراج نطاق ديناميكي عالي، يمثل ADOP تقدمًا كبيرًا في مجال التجسيد العصبي. إذا كنت مهتمًا بالرسوميات الحاسوبية، وخاصة البدائل لتوزيع غاوسي، فإن نهج ADOP لتنقيط النقاط وتحسين المشهد قد يكون ذا صلة كبيرة بعملك أو بحثك.

توزيع غاوسي (Gaussian Splatting)

بالانتقال إلى الأساليب التقليدية، يقف توزيع غاوسي كتقنية مجربة ومختبرة لتجسيد الحجم والرسوميات القائمة على النقاط. يقوم بإسقاط البيانات ثلاثية الأبعاد على مستوى ثنائي الأبعاد باستخدام توزيعات غاوسية، مما يخلق انتقالات سلسة ويجسد البيانات الحجمية مثل الفحوصات الطبية بوضوح مثير للإعجاب.

التطورات الأخيرة

أدخلت التطورات الأخيرة توزيع غاوسي ثلاثي الأبعاد (3DGS)، مما يسرع من سرعات التجسيد ويوفر تمثيلًا صريحًا للمشاهد. يسهل ذلك إعادة الإعمار الديناميكية ومهام التحرير، مما يدفع حدود ما يمكن تحقيقه باستخدام طرق التوزيع التقليدية.

TRIPS: أفق التجسيد في الوقت الفعلي

يمثل TRIPS الطليعة، حيث يجمع بين نقاط القوة في توزيع غاوسي و ADOP (سحب النقاط الكثافة التكيفية). يقوم بتنقيط النقاط في هرم صور مساحة الشاشة، مما يسمح بتجسيد النقاط الكبيرة بكتابة ثلاثية الخطوط واحدة. ثم تقوم شبكة عصبية خفيفة الوزن بإعادة بناء صورة مفصلة وخالية من الثقوب.

لماذا يبرز TRIPS

  • أداء في الوقت الفعلي: يحافظ TRIPS على معدل 60 إطارًا في الثانية على الأجهزة القياسية، مما يجعله مناسبًا للتطبيقات في الوقت الفعلي.
  • مسار تجسيد تفاضلي: تعني قابلية تفاضل المسار إمكانية تحسين أحجام ومواضع النقاط تلقائيًا، مما يعزز جودة المشهد المجسد.
  • جودة في السيناريوهات الصعبة: يتفوق TRIPS في تجسيد الهندسات المعقدة والمناظر الطبيعية الشاسعة، مما يوفر استقرارًا زمنيًا وتفاصيل أفضل من الطرق السابقة.

مسار عمل TRIPS

يقوم TRIPS بتجسيد سحابة نقطية بشكل ثلاثي الخطوط كتوزيعات 2x2x2 في خرائط ميزات متعددة الطبقات، مع تمرير النتائج عبر شبكة عصبية صغيرة، تحتوي فقط على التفاف بوابة واحد لكل طبقة. مسار العمل هذا قابل للتفاضل تمامًا، مما يسمح بتحسين واصفات النقاط (الألوان) والمواضع، بالإضافة إلى معلمات الكاميرا، عبر هبوط التدرج.
توزيع النقاط ثلاثي الخطوط: (يسار) يتم إسقاط جميع النقاط وأحجامها النسبية على الصورة الهدف. بناءً على حجم مساحة الشاشة هذا، تتم كتابة كل نقطة إلى الطبقة الصحيحة من هرم الصورة باستخدام الكتابة ثلاثية الخطوط (يمين). تتم كتابة النقاط الكبيرة إلى طبقات ذات دقة أقل، وبالتالي، تغطي مساحة أكبر في الصورة النهائية.

مصادر TRIPS

خلاصة

تلخص الرحلة من NeRF إلى TRIPS التقدم السريع في تجسيد المشاهد ثلاثية الأبعاد. بينما نتحرك نحو طرق أكثر كفاءة وعالية الدقة، يصبح احتمال إنشاء تجارب افتراضية غامرة ملموسًا بشكل متزايد. لا تدفع هذه التقنيات حدود الرسوميات فحسب، بل تمهد الطريق أيضًا للابتكارات في مختلف الصناعات، من الترفيه إلى التخطيط الحضري.

بالنسبة لأولئك الذين يسعون إلى التعمق أكثر في هذه التقنيات، تتوفر ثروة من الموارد، بما في ذلك المراجعات الشاملة والمنصات مفتوحة المصدر التي تسهل تطوير مشاريع NeRF. مستقبل التجسيد ثلاثي الأبعاد مشرق، وتقنيات مثل NeRF وتوزيع غاوسي و TRIPS هي التي ستنير الطريق إلى الأمام.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *