چگونه ویژگی Hum to Search Google کار می کند

فهرست مطالب:

چگونه ویژگی Hum to Search Google کار می کند
چگونه ویژگی Hum to Search Google کار می کند
Anonim

موارد مهم

  • Google ابزار جدیدی راه اندازی کرده است که به کاربران امکان می دهد آهنگ ها را با زمزمه کردن، آواز خواندن یا سوت زدن جستجو کنند.
  • ابزار جدید از یادگیری ماشینی برای تطبیق یک آهنگ زمزمه شده با پایگاه داده ای از بیش از نیم میلیون آهنگ که به طور مداوم به روز می شود استفاده می کند.
  • کاربران Google می پرسند کدام آهنگ تقریباً 100 بار در ماه پخش می شود.
Image
Image

Google ویژگی جدیدی به نام "Hum to Search" را برای حل یک مشکل خسته کننده راه اندازی کرده است: داشتن آهنگی در ذهن شما و ناتوانی در تشخیص نام آن.

ایده زمزمه کردن برای یافتن آهنگ بسیار ساده به نظر می رسد، پس چرا گوگل این ویژگی را تنها در سال ۲۰۲۰ راه اندازی می کند؟ خوب، معلوم می شود که شناسایی آهنگ ها از این طریق در واقع بسیار پیچیده است، تا حدی به این دلیل که نسخه های زمزمه شده ما بسیار متفاوت از آهنگ اصلی هستند. گوگل در یک پست اخیر در وبلاگ هوش مصنوعی خود توضیح می دهد که چگونه از یادگیری ماشینی برای رفع این مشکل استفاده کرده است و در نهایت به مردم کمک می کند آهنگی را با زمزمه کردن، سوت زدن یا خواندن ملودی پیدا کنند، حتی زمانی که اجرای آنها از دقت کمتری برخوردار باشد..

سخنگوی Google در ایمیلی به Lifewire گفت: «تمرکز ما برای Hum to Search کمک به افراد برای شناسایی و یافتن موسیقی‌هایی است که در ذهنشان گیر کرده است.»

فقط شروع کن زمزمه کردن

آپارنا چناپراگادا، نایب رئیس و مدیر کل خرید مصرف‌کننده گوگل، ویدیویی گفت که چندین ویژگی جستجوی جدید را معرفی می‌کند. اکنون راهی برای پیدا کردن وجود دارد.

ویژگی "Hum to Search" در برنامه تلفن همراه Google، ویجت جستجوی Google و دستیار Google تعبیه شده است. برای دسترسی به آن از طریق برنامه، روی نماد میکروفون ضربه بزنید و بگویید "What's this song?" انتخاب دکمه "جستجوی آهنگ" نیز کار می کند.

برای اینکه به درستی کار کند، این ویژگی از شما نیاز دارد که حداقل 10-15 ثانیه زمزمه کنید. کاربران اندروید می توانند برای یافتن آهنگ ها به بیش از 20 زبان زمزمه کنند، در حالی که فقط آهنگ های انگلیسی در آیفون کار می کنند. این ابزار همیشه نمی‌تواند آهنگ را فوراً شناسایی کند، اما زمانی که این کار را انجام دهد، نتایج بسیار خوب است.

"بیش از نیمی از آهنگ‌های مجموعه وسیعی از متغیرها (تن، زیر و بم، حجم و غیره) توسط الگوریتم‌های ما تشخیص داده می‌شوند، اما البته، دقت به کیفیت زمزمه و نوع زمزمه بستگی دارد. سخنگوی گوگل در ایمیلی به Lifewire گفت. "اما هنگامی که تشخیص داده شد، تقریباً چهار پاسخ از پنج پاسخ صحیح است."

اما این اولین باری نیست که از زمزمه در یک برنامه شناسایی موسیقی استفاده می شود.همانطور که توسط CNN Business اشاره شده است، SoundHound یک ویژگی مشابه را ارائه می دهد و در اندروید و iOS نیز موجود است. به گفته سخنگوی گوگل، این ویژگی جدید هیچ گونه نگرانی در مورد حفظ حریم خصوصی ایجاد نمی کند، و همچنین "شیوه ای را که گوگل تعاملات مبتنی بر صدا را انجام می دهد، تغییر نمی دهد." آنها در ایمیلی به Lifewire گفتند.

یادگیری ماشین

علی رغم سادگی مفهوم، زمزمه کردن آهنگ برای یافتن ضبط استودیو از نظر فنی بسیار دشوار است. کریستین فرانک از Google Research در یک پست وبلاگ در 12 نوامبر توضیح می دهد که دلایل مختلفی برای این وجود دارد. اول از همه، یک نسخه زمزمه‌شده آهنگ می‌تواند تا حد زیادی با ضبط واقعی متفاوت باشد و تطبیق این دو را دشوار کند. بنابراین، در حالی که Shazam و بسیاری از برنامه‌های دیگر از قبل برای شناسایی آهنگی که در یک رستوران یا مکان عمومی دیگر می‌شنوید وجود دارد، استفاده از یک ملودی زمزمه‌شده به‌عنوان مبنای آن جستجو می‌تواند پیچیده‌تر باشد.

فرانک می نویسد: "با اشعار، آوازهای پس زمینه و سازها، صدای ضبط موزیکال یا استودیو می تواند کاملاً متفاوت از آهنگ زمزمه شده باشد.""به اشتباه یا طراحی، وقتی کسی تفسیر خود را از یک آهنگ زمزمه می کند، اغلب زیر و بم، کلید، تمپو یا ریتم ممکن است کمی یا حتی به طور قابل توجهی متفاوت باشد."

Image
Image

از آنجایی که نسخه‌های زمزمه‌شده آهنگ‌ها می‌توانند بسیار متفاوت از نسخه‌های اصلی باشند، فرانک خاطرنشان می‌کند که بسیاری از روش‌های گذشته مستلزم تطبیق زمزمه یک فرد با نسخه‌ای از آهنگ است که فقط ملودی دارد، یا آهنگی که شامل زمزمه می‌شود. این موارد استفاده در دنیای واقعی را چالش برانگیز کرده است، زیرا پایگاه‌های داده با آن آهنگ‌ها می‌تواند محدود باشد و باید به‌صورت دستی به‌روزرسانی شوند.

Google توضیح می‌دهد که برای ویژگی Hum to Search، از مدل‌های یادگیری ماشینی استفاده می‌کند تا صدا را به یک «توالی مبتنی بر عدد» تبدیل کند که ملودی آهنگ را نشان می‌دهد - آنچه می‌گوید را می‌توان به عنوان یک «اثرانگشت» در نظر گرفت."

کاربرپسندتر

استفاده از یادگیری ماشینی در ویژگی Hum to Search Google در نهایت استفاده از این ابزار را در دنیای واقعی بسیار آسان‌تر می‌کند.از آنجایی که Hum to Search آهنگ زمزمه شده جستجوگر را با آهنگ واقعی مطابقت می‌دهد، این ابزار می‌تواند با آهنگ‌های جدید در حین انتشار به‌جای پایگاه داده‌ای که دائماً باید با نسخه‌های زمزمه‌شده هر آهنگ به‌روزرسانی شود، کار کند. به‌علاوه، برای استفاده از آن نیازی به صدای عالی ندارید.

"گوگل در اعلامیه Hum to Search خود گفت: "سیستم فعلی در پایگاه داده آهنگی که حاوی بیش از نیم میلیون آهنگ است که به طور مداوم در حال به روز رسانی آنها هستیم، به سطح بالایی از دقت می رسد." "این مجموعه آهنگ هنوز جای رشد دارد تا ملودی های بسیاری را در خود جای دهد."

توصیه شده: