آیا این صداهای کتاب صوتی فوق العاده چشمگیر هوش مصنوعی خوب هستند یا بد؟

فهرست مطالب:

آیا این صداهای کتاب صوتی فوق العاده چشمگیر هوش مصنوعی خوب هستند یا بد؟
آیا این صداهای کتاب صوتی فوق العاده چشمگیر هوش مصنوعی خوب هستند یا بد؟
Anonim

موارد مهم

  • DeepZen از هوش مصنوعی (هوش مصنوعی) برای ایجاد کتاب های صوتی شگفت انگیز واقع گرایانه از متن استفاده می کند.
  • تکنولوژی از صداپیشگان واقعی انسان برای ارائه بلوک های سازنده استفاده می کند.
  • Amazon و Audible در حال حاضر کتاب های صوتی تولید شده توسط رایانه را نمی پذیرند.
Image
Image

DeepZen شرکتی است که صداهای رایانه ای مورد استفاده در کتاب های صوتی را بر اساس صدای واقعی بازیگران انسانی ایجاد می کند. کیفیت ترسناک است - به راحتی به اندازه کافی خوب است که می توان ساعت ها در یک زمان به آن گوش داد.ترفند در اینجا مؤلفه هوش مصنوعی (هوش مصنوعی) است که می تواند متن را بخواند و پاسخ عاطفی صحیح را بر اساس زمینه استنباط کند. سپس آن احساس را در صدا قرار می دهد.

چشمگیر و بسیار راحت است. اما آیا واقعاً خواهان یک تجربه کتاب صوتی همگن هستیم؟ و آن صداپیشگان چطور؟

ریک کارلیل، صاحب ناشر مستقل Carlile Media، از طریق ایمیل به Lifewire گفت: "از دیدگاه ناشر مستقل، هر چیزی که هزینه تولید کتاب صوتی را کاهش دهد بسیار جالب است."

"اما این جذابیت فرض را بر این می گذارد که محصول کیفیتی برابر با روایت سنتی داشته باشد. من فکر نمی کنم که ما هنوز صد در صد به آن رسیده ایم. اشتباه نکنید، DeepZen به طرز شگفت آوری خوب است. پیشرفت فوق العاده ای است و سازندگان آن مستحق تحسین و موفقیت بی حد و حصر هستند. اما هنوز کامل نیست."

صدایی که به اندازه کافی خوب است

بهترین راه برای درک کیفیت DeepZen گوش دادن به نمونه هاست.اگر نمی دانستید که آنها توسط کامپیوتر تولید شده اند، ممکن است حتی متوجه نشوید. به هر حال برای مدتی نه. بیایید فرض کنیم که هوش مصنوعی DeepZen بی نقص است و هرگز نت های احساسی را که قرار است به آن برخورد کند، اشتباه تفسیر نمی کند.

Image
Image

حتی در این صورت، یک انسان می تواند تفاسیر ظریف تر و اغلب شگفت انگیزتر را ارائه دهد. یک بازیگر ممکن است تغییر غیرمنتظره ای در کلماتی ایجاد کند که یک کامپیوتر هرگز حتی به آن فکر نمی کند. و در واقع، تعبیر هوش مصنوعی مطمئناً هنوز به خوبی یک صداپیشه حرفه ای نیست.

به‌عنوان کسی که روی فیلم‌ها کار می‌کند و اخیراً در دنیای روایت صوتی کار می‌کند، در حالی که تحت تأثیر هوش مصنوعی هستم، به طور قطع می‌دانم که اعماق معنایی عمیقی وجود دارد که یک ماشین قادر به تفسیر آن نیست، صدای حرفه‌ای پل کرام بازیگر از طریق ایمیل به Lifewire گفت.

"آیا موجی از نویسندگان ناشناس وجود خواهد داشت که از آن استفاده کنند؟ من تضمین می کنم که وجود خواهد داشت زیرا به اندازه کافی خوب است."

به اندازه کافی خوب بودن، همراه با راحتی و صرفه جویی در هزینه، ممکن است برای سوق دادن ناشران مستقل به این سرویس کافی باشد.

«کتاب‌های صوتی می‌توانند تا 500 دلار به ازای هر ساعت پایان صدا هزینه داشته باشند (برای صدای افراد مشهور بسیار بیشتر است)، و این شامل هزینه مدیریت و مدیریت نمی‌شود. "نصف کردن این هزینه با آپلود یک دست نوشته در ارائه دهنده ای مانند DeepZen بسیار جذاب است."

مشکل صحبت کردن

هنوز به آسانی اخراج صداپیشگان و آپلود دست نوشته ها در DeepZen نیست. در حال حاضر یک مانع برای سخنرانی آسان کتاب صوتی هوش مصنوعی وجود دارد و آن از آمازون است.

Image
Image

در حال حاضر، ACX، مسیر خود ناشر برای توزیع کتاب صوتی Audible و آمازون، کتاب‌های صوتی را که انسان ضبط نکرده است، نمی‌پذیرد.

چرا؟ کیفیت. در اینجا ورودی سؤالات متداول از وب سایت است:

"متن به گفتار یا سایر ضبط‌های خودکار مجاز نیستند. شنوندگان شنیداری، کتاب‌های صوتی را برای اجرای مطالب و همچنین داستان انتخاب می‌کنند. برای برآورده کردن این انتظار، کتاب صوتی شما باید توسط انسان ضبط شود."

این بدان معناست که کتاب‌های صوتی تولید شده توسط DeepZen حداقل فعلاً موجود نیستند. این یک حدس و گمان محض است، اما DeepZen خرید بسیار خوبی برای آمازون به نظر می رسد و به آن اجازه می دهد این سرویس را بفروشد و آن را صرفاً برای کتاب های Audible نگه دارد. و حتی اگر این اتفاق نیفتد، اگر کیفیت کتاب‌های صوتی تولید شده توسط رایانه به این خوبی باشد، به نظر می‌رسد دلیل کمی برای استثنا قائل نشدن از این قانون وجود دارد.

آیا از گوش دادن به کتاب های صوتی ساخته شده به این روش خوشحال می شوید؟ وقتی این اتفاق بیفتد، اکثر مردم حتی شک نمی کنند. برخی ممکن است کمال صداهای تولید شده توسط رایانه را ترجیح دهند، زیرا آنها از تیک های صوتی و عاداتی که گاهی اوقات می تواند حواس را پرت می کند، رها باشند. این فناوری همچنین برای بازی‌های ویدیویی، تبلیغات تلویزیونی و رادیویی و هر سناریوی دیگری که در آن صداپیشه استخدام می‌کنید، مناسب است.

فناوری DeepZen همچنین راهی عالی برای ایجاد خودکار پادکست های خبری از مقالات نوشته شده است که می تواند برای رفت و آمد مفید باشد.

و در مورد آن صداپیشه ها چطور؟ خوب، حداقل یک فرصت وجود خواهد داشت: آنها می توانند بروند و برای DeepZen کار کنند.

توصیه شده: