موارد مهم
- DeepZen از هوش مصنوعی (هوش مصنوعی) برای ایجاد کتاب های صوتی شگفت انگیز واقع گرایانه از متن استفاده می کند.
- تکنولوژی از صداپیشگان واقعی انسان برای ارائه بلوک های سازنده استفاده می کند.
- Amazon و Audible در حال حاضر کتاب های صوتی تولید شده توسط رایانه را نمی پذیرند.
DeepZen شرکتی است که صداهای رایانه ای مورد استفاده در کتاب های صوتی را بر اساس صدای واقعی بازیگران انسانی ایجاد می کند. کیفیت ترسناک است - به راحتی به اندازه کافی خوب است که می توان ساعت ها در یک زمان به آن گوش داد.ترفند در اینجا مؤلفه هوش مصنوعی (هوش مصنوعی) است که می تواند متن را بخواند و پاسخ عاطفی صحیح را بر اساس زمینه استنباط کند. سپس آن احساس را در صدا قرار می دهد.
چشمگیر و بسیار راحت است. اما آیا واقعاً خواهان یک تجربه کتاب صوتی همگن هستیم؟ و آن صداپیشگان چطور؟
ریک کارلیل، صاحب ناشر مستقل Carlile Media، از طریق ایمیل به Lifewire گفت: "از دیدگاه ناشر مستقل، هر چیزی که هزینه تولید کتاب صوتی را کاهش دهد بسیار جالب است."
"اما این جذابیت فرض را بر این می گذارد که محصول کیفیتی برابر با روایت سنتی داشته باشد. من فکر نمی کنم که ما هنوز صد در صد به آن رسیده ایم. اشتباه نکنید، DeepZen به طرز شگفت آوری خوب است. پیشرفت فوق العاده ای است و سازندگان آن مستحق تحسین و موفقیت بی حد و حصر هستند. اما هنوز کامل نیست."
صدایی که به اندازه کافی خوب است
بهترین راه برای درک کیفیت DeepZen گوش دادن به نمونه هاست.اگر نمی دانستید که آنها توسط کامپیوتر تولید شده اند، ممکن است حتی متوجه نشوید. به هر حال برای مدتی نه. بیایید فرض کنیم که هوش مصنوعی DeepZen بی نقص است و هرگز نت های احساسی را که قرار است به آن برخورد کند، اشتباه تفسیر نمی کند.
حتی در این صورت، یک انسان می تواند تفاسیر ظریف تر و اغلب شگفت انگیزتر را ارائه دهد. یک بازیگر ممکن است تغییر غیرمنتظره ای در کلماتی ایجاد کند که یک کامپیوتر هرگز حتی به آن فکر نمی کند. و در واقع، تعبیر هوش مصنوعی مطمئناً هنوز به خوبی یک صداپیشه حرفه ای نیست.
بهعنوان کسی که روی فیلمها کار میکند و اخیراً در دنیای روایت صوتی کار میکند، در حالی که تحت تأثیر هوش مصنوعی هستم، به طور قطع میدانم که اعماق معنایی عمیقی وجود دارد که یک ماشین قادر به تفسیر آن نیست، صدای حرفهای پل کرام بازیگر از طریق ایمیل به Lifewire گفت.
"آیا موجی از نویسندگان ناشناس وجود خواهد داشت که از آن استفاده کنند؟ من تضمین می کنم که وجود خواهد داشت زیرا به اندازه کافی خوب است."
به اندازه کافی خوب بودن، همراه با راحتی و صرفه جویی در هزینه، ممکن است برای سوق دادن ناشران مستقل به این سرویس کافی باشد.
«کتابهای صوتی میتوانند تا 500 دلار به ازای هر ساعت پایان صدا هزینه داشته باشند (برای صدای افراد مشهور بسیار بیشتر است)، و این شامل هزینه مدیریت و مدیریت نمیشود. "نصف کردن این هزینه با آپلود یک دست نوشته در ارائه دهنده ای مانند DeepZen بسیار جذاب است."
مشکل صحبت کردن
هنوز به آسانی اخراج صداپیشگان و آپلود دست نوشته ها در DeepZen نیست. در حال حاضر یک مانع برای سخنرانی آسان کتاب صوتی هوش مصنوعی وجود دارد و آن از آمازون است.
در حال حاضر، ACX، مسیر خود ناشر برای توزیع کتاب صوتی Audible و آمازون، کتابهای صوتی را که انسان ضبط نکرده است، نمیپذیرد.
چرا؟ کیفیت. در اینجا ورودی سؤالات متداول از وب سایت است:
"متن به گفتار یا سایر ضبطهای خودکار مجاز نیستند. شنوندگان شنیداری، کتابهای صوتی را برای اجرای مطالب و همچنین داستان انتخاب میکنند. برای برآورده کردن این انتظار، کتاب صوتی شما باید توسط انسان ضبط شود."
این بدان معناست که کتابهای صوتی تولید شده توسط DeepZen حداقل فعلاً موجود نیستند. این یک حدس و گمان محض است، اما DeepZen خرید بسیار خوبی برای آمازون به نظر می رسد و به آن اجازه می دهد این سرویس را بفروشد و آن را صرفاً برای کتاب های Audible نگه دارد. و حتی اگر این اتفاق نیفتد، اگر کیفیت کتابهای صوتی تولید شده توسط رایانه به این خوبی باشد، به نظر میرسد دلیل کمی برای استثنا قائل نشدن از این قانون وجود دارد.
آیا از گوش دادن به کتاب های صوتی ساخته شده به این روش خوشحال می شوید؟ وقتی این اتفاق بیفتد، اکثر مردم حتی شک نمی کنند. برخی ممکن است کمال صداهای تولید شده توسط رایانه را ترجیح دهند، زیرا آنها از تیک های صوتی و عاداتی که گاهی اوقات می تواند حواس را پرت می کند، رها باشند. این فناوری همچنین برای بازیهای ویدیویی، تبلیغات تلویزیونی و رادیویی و هر سناریوی دیگری که در آن صداپیشه استخدام میکنید، مناسب است.
فناوری DeepZen همچنین راهی عالی برای ایجاد خودکار پادکست های خبری از مقالات نوشته شده است که می تواند برای رفت و آمد مفید باشد.
و در مورد آن صداپیشه ها چطور؟ خوب، حداقل یک فرصت وجود خواهد داشت: آنها می توانند بروند و برای DeepZen کار کنند.