موارد مهم
- DALL·E یک شبکه عصبی جدید است که می تواند تصاویر را بر اساس متن ترسیم کند.
- این شبکه یکی از تعداد رو به رشد پروژه های هوش مصنوعی است که می تواند خروجی خلاقانه انسان ها را تقلید کند.
- کارشناسان می گویند تصاویری که توسط هوش مصنوعی ترسیم شده اند، ساخته های اصلی نیستند.
حرکت کن، پیکاسو. یک شبکه عصبی جدید می تواند تصاویر را بر اساس متن ترسیم کند.
DALL·E، پورمانتویی از نام های هنرمند سالوادور دالی و WALL·E پیکسار، می تواند هر متنی را بگیرد و از آن تصویر بسازد. این سیستم از یک شبکه عصبی استفاده می کند که بر روی میلیاردها عکس و نمونه متن آموزش داده شده است.این یکی از تعداد رو به رشد پروژههای هوش مصنوعی است که میتواند خروجی خلاقانه انسانها را تقلید کند، اما نمیتواند تکرار کند.
تامارا شوارتز، استاد امنیت سایبری در کالج یورک پنسیلوانیا، "از آنجایی که زبان طبیعی به طور مداوم در حال تکامل است، و بسیار وابسته به ظرایف زمینه است، آموزش یک ماشین برای درک زبان به اندازه کافی برای ترسیم یک تصویر یک دستاورد بسیار مهم است." ، در یک مصاحبه ایمیلی گفت. "تصور کنید یک نقاش طرح پلیسی، این استعداد کمیاب است و توانایی ایجاد یک تصویر بر اساس توضیحات شاهد را دارد."
استفاده از داده های بزرگ برای تولید تصاویر
DALL-E توسط شرکت تحقیقاتی هوش مصنوعی OpenAI ایجاد شده است و با جمع آوری مقادیر زیادی داده از اینترنت کار می کند. سپس داده ها توسط یک مدل زبان طبیعی پردازش شده و برای تولید تصاویر از متن آموزش داده می شود. DALL-E شبیه به GPT-3 که اخیراً منتشر شده است، یک مدل زبان ایجاد شده توسط OpenAI است که می تواند از آن خواسته شود متن متن اصلی تولید کند. GPT-3 با استفاده از نیم تریلیون کلمه متن اینترنتی آموزش داده شد و میتواند متن شگفتآوری واقعی تولید کند.
آموزش یک ماشین برای درک زبان به اندازه کافی برای ترسیم یک تصویر یک دستاورد بسیار مهم است.
Michael Yurushkin، بنیانگذار و مدیر ارشد فناوری BroutonLab، یک شرکت علم داده، در یک مصاحبه ایمیلی گفت که DALL-E "یکی از معدود موفقیت های بشریت در تقلید از خلاقیت و تخیل ما است." او افزود: «پی بردن به اینکه چگونه هوش مصنوعی با بررسی دادههای مربوطه چیزی را پیشبینی میکند آسانتر است، اما درک اینکه چگونه میتواند از چیزهایی که قبلاً درباره آنها «نشنیده» طراحی کند، دشوارتر است.»
Schwartz مراقب است توجه داشته باشد که هوش مصنوعی اطلاعات ایجاد نمی کند، بلکه داده های زبان را می گیرد و آنها را به تصاویر تبدیل می کند.
شوارتز گفت: "خلاقیت اولیه از انسانی ناشی می شود که کار را ساخته است." "خلاقیت" در بخشی از هوش مصنوعی وجود دارد، زیرا ترکیب های مختلفی از داده ها را آزمایش می کند و سپس از تعدادی خروجی بالقوه انتخاب می کند.با این حال، یک انسان در حال بررسی خروجی ها است و به هوش مصنوعی آموزش می دهد که چگونه از بین چندین ترکیب انتخاب کند."
روبات کارآگاه کار می کند؟
یک ماشین می تواند با این داده ها و ترکیب اشیا بسیار سریعتر از یک هنرمند انسانی آزمایش کند. شوارتز خاطرنشان کرد که DALL-E می تواند روزی با کارآگاهی شریک شود که تلاش می کند صحنه جنایت را از طریق یک طرح، بر اساس شهادت شاهدان عینی بازسازی کند.
"همانطور که شاهدان اظهارات خود را ارائه می دهند، رایانه می تواند اطلاعات گفتاری و زبان طبیعی را بگیرد و یک نقاشی از صحنه یا بسیاری از نقاشی های صحنه ایجاد کند." "این تجسمها سپس میتوانند برای ایجاد تصویر دقیقتری از شواهد گمشده ادغام شوند. این تجسم میتواند با ادغام تصاویر قبلی از مکان قبل از جنایت غنی شود."
چندین برنامه دیگر مبتنی بر هوش مصنوعی می توانند هنر تولید کنند. به عنوان مثال، Ai-Da از یک سیستم بازوی رباتیک و فناوری تشخیص چهره همراه با هوش مصنوعی برای خلق آثار هنری استفاده می کند.این سیستم میتواند تصویری را که در جلوی دستگاه قرار میگیرد، تجزیه و تحلیل کند، که به الگوریتمی برای تولید حرکات بازوی ربات وارد میشود.
احمد الگامال، مدیر آزمایشگاه هنر و هوش مصنوعی در دانشگاه راتگرز، در نیویورک تایمز، سال گذشته استدلال کرد: با این حال، هنرمندان انسانی نباید نگران باشند که اربابان رباتیک جایگزین آنها شوند.
«در حالی که تعریف هنر همیشه در حال تحول است، اما در هسته آن شکلی از ارتباط بین انسان ها است. "بدون یک هنرمند انسانی در پشت ماشین، هوش مصنوعی می تواند کاری بیشتر از بازی با فرم انجام دهد، خواه این به معنای دستکاری پیکسل ها روی صفحه باشد یا نت های روی یک دفتر موسیقی. این فعالیت ها می توانند جذاب و از لحاظ ادراکی جذاب باشند، اما بدون تعامل بین آنها معنا ندارند. هنرمند و مخاطب."
پس از نگاهی به آثار DALL-E، متوجه نظر الگامال شدم که تصاویر ایجاد شده توسط هوش مصنوعی هنر نیستند. از سوی دیگر، آنها بهتر از هر هنری هستند که بتوانم خلق کنم. بنابراین، واقعاً، تفاوت چیست؟