موارد مهم
- Nvidia اخیراً تکنیکی را به نمایش گذاشت که عکسهای دو بعدی را در عرض چند ثانیه به صحنههای سه بعدی تبدیل میکند.
- این روش از نیروی رایانه برای تقریبی نحوه رفتار نور در دنیای واقعی استفاده می کند.
- متافوره منطقه ای است که در آن صحنه های سه بعدی مفید هستند زیرا می توان آنها را از هر منظر دوربین مشاهده کرد.
فناوری جدید هوش مصنوعی (AI) انویدیا به زودی میتواند عکسهای دو بعدی را در عرض چند ثانیه به صحنههای سه بعدی تبدیل کند و ایجاد فضاهای مجازی فراگیر مانند متاورس را به اندازه پردازش کلمه بیاهمیت کند.
Nvidia اخیراً روش عکسی به نام Instant NeRF را نشان داده است که از قدرت محاسباتی برای تقریب نحوه رفتار نور در دنیای واقعی استفاده می کند. میتواند عکسهای قدیمی شما را به صحنه بازیهای ویدیویی تبدیل کند، یا میتواند برای آموزش رباتها و ماشینهای خودران برای درک اندازه و شکل اشیاء دنیای واقعی استفاده شود.
اورن دبی، مدیر عامل Visionary.ai، یک شرکت بینایی کامپیوتری که الگوریتم های سه بعدی خود را بر روی پلتفرم انویدیا اجرا می کند، در مصاحبه ای با Lifewire به Lifewire گفت "تصویربرداری سه بعدی دنیای جدیدی از تحول را به ارمغان می آورد." با استفاده از سه بعدی، عمق دنیای واقعی را در صحنه تقلید میکنید و تصویر را زندهتر و واقعیتر نشان میدهید. علاوه بر دوربینهای واقعیت مجازی و واقعیت مجازی و دوربینهای صنعتی، که در آنها سه بعدی بسیار رایج است، اکنون شاهد استفاده از آن در تقریباً هر گوشی هوشمند بدون نیاز به دوربین هستیم. کاربر حتی می داند."
افزودن ابعاد
اولین عکس فوری که 75 سال پیش با دوربین پولاروید گرفته شد، با هدف ثبت سریع دنیای سه بعدی در یک تصویر دوبعدی بود. اکنون، محققان هوش مصنوعی بر عکس آن کار می کنند: تبدیل مجموعه ای از تصاویر ثابت به یک صحنه دیجیتالی سه بعدی در چند ثانیه.
این فرآیند که به عنوان رندر معکوس شناخته میشود، از هوش مصنوعی برای تقریبی نحوه رفتار نور در دنیای واقعی استفاده میکند و محققان را قادر میسازد تا یک صحنه سهبعدی را از تعداد انگشت شماری از تصاویر دوبعدی گرفتهشده در زوایای مختلف بازسازی کنند. Nvidia ادعا می کند که رویکردی را توسعه داده است که این کار را تقریباً بلافاصله انجام می دهد.
Nvidia از این رویکرد با فناوری جدیدی به نام میدانهای تابشی عصبی یا NeRF استفاده کرد. این شرکت میگوید این نتیجه که Instant NeRF نام دارد، سریعترین تکنیک NeRF تا به امروز است. این مدل تنها به چند ثانیه زمان نیاز دارد تا روی چند ده عکس ثابت آموزش داده شود و سپس میتواند صحنه سه بعدی حاصل را در عرض دهها میلیثانیه ارائه دهد.
"اگر بازنمایی های سه بعدی سنتی مانند مش های چند ضلعی شبیه به تصاویر برداری باشد، NeRF ها مانند تصاویر بیت مپ هستند: آنها به طور متراکم نحوه تابش نور از یک شی یا داخل یک صحنه را ثبت می کنند." دیوید لوبکه، معاون تحقیقات گرافیکی در Nvidia در بیانیهای اعلام کرد: «از این نظر، Instant NeRF میتواند برای سه بعدی به همان اندازه مهم باشد که دوربینهای دیجیتال و فشردهسازی JPEG برای عکاسی دوبعدی مهم بوده است - سرعت، سهولت و دسترسی به عکسبرداری و اشتراکگذاری سه بعدی را به شدت افزایش میدهد."
جمع آوری داده برای تغذیه یک NeRF به شبکه عصبی نیاز دارد که چند ده تصویر گرفته شده از موقعیت های مختلف اطراف صحنه و همچنین موقعیت دوربین هر یک از آن عکس ها را بگیرد.
NeRF یک شبکه عصبی کوچک را آموزش می دهد تا با پیش بینی رنگ نور تابش شده در هر جهت و از هر نقطه در فضای سه بعدی، صحنه را بازسازی کند.
درخواست تجدیدنظر 3D
براد کوینتون، بنیانگذار پلتفرم Perceptus برای واقعیت افزوده (AR)، در مصاحبه ای با Lifewire به Lifewire گفت: متاوره منطقه ای است که در آن صحنه های سه بعدی مفید هستند زیرا می توان آنها را از هر منظر دوربین مشاهده کرد. درست همانطور که میتوانیم در یک اتاق در زندگی واقعی قدم بزنیم و محتویات آن را از زوایای مختلف ببینیم، با یک صحنه سهبعدی بازسازیشده، میتوانیم عملاً در یک فضا حرکت کنیم و آن را از هر منظری ببینیم.
"این می تواند به ویژه برای ایجاد محیط هایی برای استفاده در واقعیت مجازی مفید باشد." کوینتون گفت.
برنامه هایی مانند Apple's Object Capture از تکنیکی به نام فتوگرامتری برای ایجاد اشیاء سه بعدی مجازی از مجموعه ای از تصاویر دو بعدی استفاده می کنند. کوینتون پیش بینی کرد که مدل های سه بعدی به طور گسترده در برنامه های واقعیت مجازی و AR مورد استفاده قرار خواهند گرفت. برای مثال، برخی از هوش مصنوعیها، مانند آنچه در پلتفرم Perceptus AR وجود دارد، از مدلهای سه بعدی برای ایجاد درکی از دنیای واقعی استفاده میکنند که امکان استفاده از برنامههای واقعیت افزوده را در زمان واقعی فراهم میکند.
استفاده از تصاویر سه بعدی همچنین عمق دنیای واقعی را در یک صحنه تقلید می کند و باعث می شود تصویر زنده تر و واقعی تر به نظر برسد. برای ایجاد یک افکت بوکه (معروف به حالت پرتره یا حالت سینمایی)، نگاشت عمق سه بعدی ضروری است. این تکنیک تقریباً در همه گوشیهای هوشمند استفاده میشود.
"این استاندارد برای فیلمبرداران حرفه ای فیلمبرداری فیلم است، و این استاندارد برای هر مصرف کننده است."