موارد مهم
- فناوری های جدید می توانند به رایانه هایی منجر شوند که گفتار انسان را بهتر درک کنند.
- Microsoft و NVIDIA اخیراً یک روش جدید مبتنی بر هوش مصنوعی برای تفسیر زبان را معرفی کردند.
- محاسبات کوانتومی ممکن است راه دیگری برای پیشرفت در زمینه پردازش زبان باشد.
این روزها ابزارهای هوشمند زیادی برای دستور دادن به آنها وجود دارد، اما ما هنوز با رایانه هایی که گفتار مکالمه را درک می کنند فاصله زیادی داریم.
Microsoft و NVIDIA اخیراً روش جدیدی مبتنی بر هوش مصنوعی برای تفسیر گفتار معرفی کردند که می تواند نحوه چت ما با وسایل الکترونیکی خود را تغییر دهد. این بخشی از یک حرکت رو به رشد است که نحوه درک گفتار را توسط رایانهها تغییر میدهد که پردازش زبان طبیعی (NLP) نیز نامیده میشود.
هامیش اوگیلوی، کارشناس هوش مصنوعی در مصاحبه ایمیلی با Lifewire گفت: «مدلهای تقویتکننده NLP بزرگتر و پیشرفتهتر میشوند و به درک انسان نزدیکتر میشوند.»
"یکی از پیشرفتهای بزرگ این است که NLP فراتر از کلمات کلیدی ساده است. ممکن است امروز عادت داشته باشید که یک یا دو کلمه کلیدی را برای به دست آوردن نتایج جستجو تایپ یا صحبت کنید، اما مدلهای پردازش زبان طبیعی جدیدتر از زمینه برای ارائه نتایج غنیتر استفاده میکنند."
رباتهای چت
NVIDIA و مایکروسافت برای ایجاد مدل Megatron-Turing Natural Language Generation (MTNLG) همکاری کرده اند، که این دو ادعا می کنند "قوی ترین مدل زبان ترانسفورماتور یکپارچه ای است که تا به امروز آموزش داده شده است." مدل هوش مصنوعی روی ابر رایانه ها اجرا می شود.
اما محققان دریافتند که مدل MTNLG هنگام بررسی کوههایی از نمونههای گفتار انسان، تعصبات انسانی را تشخیص میدهد.
محققان در یک پست وبلاگ نوشتند: «در حالی که مدلهای زبان غولپیکر در حال پیشرفت در تولید زبان هستند، از مسائلی مانند سوگیری و سمیت نیز رنج میبرند». "مشاهدات ما با MT-NLG این است که مدل کلیشهها و سوگیریها را از دادههایی که بر اساس آن آموزش داده شده است انتخاب میکند."
Ogilvy میگوید: رایانههایی که گفتار را بهتر درک میکنند، فقط بلندگوهای هوشمندی مانند Alexa را بهبود نمیبخشند. وبسایتهای جستجوی مبتنی بر متن مانند آمازون نیز سؤالاتی را که تایپ میشوند بهتر درک میکنند.
"گوگل در اینجا پیشتاز آشکار بوده است، اما فناوری NLP در همه جا وجود خواهد داشت." برای جستجوهای مبتنی بر متن و صدا، کاربران میتوانند توصیفیتر باشند، زیرا NLP بیشتر از متن را میفهمد؛ آن را درک میکند که شما به دنبال آن هستید تا نتایج بهتری به دست آورید."
چت های کوانتومی؟
محاسبات کوانتومی ممکن است یکی از راههای پیشرفت در زمینه NLP باشد. روز چهارشنبه، شرکت کمبریج کوانتوم lambeq را معرفی کرد که ادعا میکند اولین ابزار کوانتومی برای NLP است.
…NLP فراتر از متن را می فهمد. این زمینه را درک می کند که شما به دنبال آن هستید تا نتایج بهتری داشته باشید.
این شرکت می گوید این ابزار امکان ترجمه جملات را به زبان های طبیعی با استفاده از مدارهای کوانتومی اجرا شده بر روی کامپیوترهای کوانتومی فراهم می کند. محاسبات کوانتومی نوعی محاسبات است که از خواص غیرمعمول حالات کوانتومی مانند برهم نهی، تداخل و درهم تنیدگی برای انجام محاسبات استفاده می کند.
باب کوئک، دانشمند ارشد کمبریج کوانتوم، در یک مصاحبه ایمیلی به Lifewire گفت: "روشی که کامپیوترهای کوانتومی NLP را مدیریت می کنند بسیار متفاوت از ماشین های کلاسیک است. در واقع، NLP "بومی کوانتومی" است. "این به دلیل کشفی است که ما چند سال پیش انجام دادیم، که دستور زبان حاکم بر جملات و معنی ساختار بسیار مشابهی با ریاضیات مورد استفاده برای برنامه ریزی کامپیوترهای کوانتومی دارد."
Coecke گفت که NLP کوانتومی می تواند به دستیارهای صوتی و ابزارهای ترجمه بهتر منجر شود.
رویکرد امیدوارکننده دیگری برای بهبود تشخیص گفتار، به نام زک لیو، دانشمند داده در شرکت Hypergiant، در یک مصاحبه ایمیلی به Lifewire گفت. "به طور خلاصه، وقتی دانشمندان داده داده های NLP را بهبود می بخشند، تقریباً تضمین می کند که مدل NLP بهتر و قابلیت NLP بهتری خواهند داشت."
لیو گفت گام بعدی ادغام مدلهای بینایی رایانه با NLP است، مانند آموزش یک مدل هوش مصنوعی برای تماشای ویدیوها و تولید خلاصه متنی از آن ویدیو.
"کاربرد این پیشرفت می تواند بی حد و حصر باشد، از مراقبت های بهداشتی، خواندن فیلم های رادیولوژی و ارائه تشخیص اولیه، طراحی خانه، لباس، جواهرات، یا موارد مشابه." "مشتری می تواند الزامات را به صورت شفاهی یا نوشتاری توضیح دهد و این توضیحات می تواند به طور خودکار برای تجسم بهتر به تصاویر یا فیلم ها تبدیل شود."