فناوری جدید NeRF انویدیا می تواند به راه انداز در متاورس کمک کند

2024 نویسنده: Abigail Brown | [email protected]. آخرین اصلاح شده: 2023-12-17 06:46

موارد مهم

Nvidia اخیراً تکنیکی را به نمایش گذاشت که عکس‌های دو بعدی را در عرض چند ثانیه به صحنه‌های سه بعدی تبدیل می‌کند.
این روش از نیروی رایانه برای تقریبی نحوه رفتار نور در دنیای واقعی استفاده می کند.
متافوره منطقه ای است که در آن صحنه های سه بعدی مفید هستند زیرا می توان آنها را از هر منظر دوربین مشاهده کرد.

فناوری جدید هوش مصنوعی (AI) انویدیا به زودی می‌تواند عکس‌های دو بعدی را در عرض چند ثانیه به صحنه‌های سه بعدی تبدیل کند و ایجاد فضاهای مجازی فراگیر مانند متاورس را به اندازه پردازش کلمه بی‌اهمیت کند.

Nvidia اخیراً روش عکسی به نام Instant NeRF را نشان داده است که از قدرت محاسباتی برای تقریب نحوه رفتار نور در دنیای واقعی استفاده می کند. می‌تواند عکس‌های قدیمی شما را به صحنه بازی‌های ویدیویی تبدیل کند، یا می‌تواند برای آموزش ربات‌ها و ماشین‌های خودران برای درک اندازه و شکل اشیاء دنیای واقعی استفاده شود.

اورن دبی، مدیر عامل Visionary.ai، یک شرکت بینایی کامپیوتری که الگوریتم های سه بعدی خود را بر روی پلتفرم انویدیا اجرا می کند، در مصاحبه ای با Lifewire به Lifewire گفت "تصویربرداری سه بعدی دنیای جدیدی از تحول را به ارمغان می آورد." با استفاده از سه بعدی، عمق دنیای واقعی را در صحنه تقلید می‌کنید و تصویر را زنده‌تر و واقعی‌تر نشان می‌دهید. علاوه بر دوربین‌های واقعیت مجازی و واقعیت مجازی و دوربین‌های صنعتی، که در آن‌ها سه بعدی بسیار رایج است، اکنون شاهد استفاده از آن در تقریباً هر گوشی هوشمند بدون نیاز به دوربین هستیم. کاربر حتی می داند."

افزودن ابعاد

اولین عکس فوری که 75 سال پیش با دوربین پولاروید گرفته شد، با هدف ثبت سریع دنیای سه بعدی در یک تصویر دوبعدی بود. اکنون، محققان هوش مصنوعی بر عکس آن کار می کنند: تبدیل مجموعه ای از تصاویر ثابت به یک صحنه دیجیتالی سه بعدی در چند ثانیه.

این فرآیند که به عنوان رندر معکوس شناخته می‌شود، از هوش مصنوعی برای تقریبی نحوه رفتار نور در دنیای واقعی استفاده می‌کند و محققان را قادر می‌سازد تا یک صحنه سه‌بعدی را از تعداد انگشت شماری از تصاویر دوبعدی گرفته‌شده در زوایای مختلف بازسازی کنند. Nvidia ادعا می کند که رویکردی را توسعه داده است که این کار را تقریباً بلافاصله انجام می دهد.

Nvidia از این رویکرد با فناوری جدیدی به نام میدان‌های تابشی عصبی یا NeRF استفاده کرد. این شرکت می‌گوید این نتیجه که Instant NeRF نام دارد، سریع‌ترین تکنیک NeRF تا به امروز است. این مدل تنها به چند ثانیه زمان نیاز دارد تا روی چند ده عکس ثابت آموزش داده شود و سپس می‌تواند صحنه سه بعدی حاصل را در عرض ده‌ها میلی‌ثانیه ارائه دهد.

"اگر بازنمایی های سه بعدی سنتی مانند مش های چند ضلعی شبیه به تصاویر برداری باشد، NeRF ها مانند تصاویر بیت مپ هستند: آنها به طور متراکم نحوه تابش نور از یک شی یا داخل یک صحنه را ثبت می کنند." دیوید لوبکه، معاون تحقیقات گرافیکی در Nvidia در بیانیه‌ای اعلام کرد: «از این نظر، Instant NeRF می‌تواند برای سه بعدی به همان اندازه مهم باشد که دوربین‌های دیجیتال و فشرده‌سازی JPEG برای عکاسی دوبعدی مهم بوده است - سرعت، سهولت و دسترسی به عکس‌برداری و اشتراک‌گذاری سه بعدی را به شدت افزایش می‌دهد."

جمع آوری داده برای تغذیه یک NeRF به شبکه عصبی نیاز دارد که چند ده تصویر گرفته شده از موقعیت های مختلف اطراف صحنه و همچنین موقعیت دوربین هر یک از آن عکس ها را بگیرد.

NeRF یک شبکه عصبی کوچک را آموزش می دهد تا با پیش بینی رنگ نور تابش شده در هر جهت و از هر نقطه در فضای سه بعدی، صحنه را بازسازی کند.

درخواست تجدیدنظر 3D

براد کوینتون، بنیانگذار پلتفرم Perceptus برای واقعیت افزوده (AR)، در مصاحبه ای با Lifewire به Lifewire گفت: متاوره منطقه ای است که در آن صحنه های سه بعدی مفید هستند زیرا می توان آنها را از هر منظر دوربین مشاهده کرد. درست همانطور که می‌توانیم در یک اتاق در زندگی واقعی قدم بزنیم و محتویات آن را از زوایای مختلف ببینیم، با یک صحنه سه‌بعدی بازسازی‌شده، می‌توانیم عملاً در یک فضا حرکت کنیم و آن را از هر منظری ببینیم.

"این می تواند به ویژه برای ایجاد محیط هایی برای استفاده در واقعیت مجازی مفید باشد." کوینتون گفت.

برنامه هایی مانند Apple's Object Capture از تکنیکی به نام فتوگرامتری برای ایجاد اشیاء سه بعدی مجازی از مجموعه ای از تصاویر دو بعدی استفاده می کنند. کوینتون پیش بینی کرد که مدل های سه بعدی به طور گسترده در برنامه های واقعیت مجازی و AR مورد استفاده قرار خواهند گرفت. برای مثال، برخی از هوش مصنوعی‌ها، مانند آنچه در پلتفرم Perceptus AR وجود دارد، از مدل‌های سه بعدی برای ایجاد درکی از دنیای واقعی استفاده می‌کنند که امکان استفاده از برنامه‌های واقعیت افزوده را در زمان واقعی فراهم می‌کند.

استفاده از تصاویر سه بعدی همچنین عمق دنیای واقعی را در یک صحنه تقلید می کند و باعث می شود تصویر زنده تر و واقعی تر به نظر برسد. برای ایجاد یک افکت بوکه (معروف به حالت پرتره یا حالت سینمایی)، نگاشت عمق سه بعدی ضروری است. این تکنیک تقریباً در همه گوشی‌های هوشمند استفاده می‌شود.

"این استاندارد برای فیلمبرداران حرفه ای فیلمبرداری فیلم است، و این استاندارد برای هر مصرف کننده است."