چه باید بدانیم
- در Google Books Ngram Viewer، عبارتی را تایپ کنید، محدوده تاریخ و متن را انتخاب کنید، سطح هموارسازی را تنظیم کنید و روی جستجوی تعداد زیادی کتاب کلیک کنید.
- می توانید داده ها را بررسی کنید. به عنوان مثال، برای جستجوی شکل فعل ماهی، به جای اسم ماهی، از یک برچسب استفاده کنید: fish_VERB را جستجو کنید.
- Ngram Viewer نموداری را ارائه می دهد که نشان دهنده استفاده از عبارت در طول زمان است. برای چند عبارت، هر یک با یک خط رنگی نشان داده می شود.
این مقاله نحوه استفاده از ابزار Ngram Viewer در Google Books را برای انجام تحقیقات و جستجوهای قدرتمند توضیح می دهد.
چگونه Ngram Viewer کار می کند
Ngram که N-gram نیز نامیده می شود، تجزیه و تحلیل آماری محتوای متن یا گفتار برای یافتن n (تعداد) نوعی از آیتم در متن است.
موضوع جستجو می تواند همه نوع چیز باشد، از جمله واج ها، پیشوندها، عبارات و حروف. اگرچه یک Ngram در خارج از جامعه تحقیقاتی مبهم است، اما در زمینه های مختلف استفاده می شود و پیامدهای زیادی برای توسعه دهندگانی دارد که برنامه های رایانه ای را کدنویسی می کنند که زبان گفتاری طبیعی را درک می کنند و به آن پاسخ می دهند.
در مورد Google Books Ngram Viewer، متن مورد تجزیه و تحلیل از تعداد زیادی کتاب در دامنه عمومی است که Google برای پر کردن موتور جستجوی Google Books خود اسکن کرده است. برای Google Books Ngram Viewer، Google به متنی که میخواهید جستجو کنید به عنوان پیکره اشاره میکند. نمایشگر Ngram بر اساس زبان جمعآوری میکند، اگرچه میتوانید انگلیسی انگلیسی و آمریکایی را جداگانه تجزیه و تحلیل کنید یا آنها را با هم جمع کنید.
- به Google Books Ngram Viewer در books.google.com/ngrams بروید.
-
هر عبارت یا عبارتی را که می خواهید تحلیل کنید تایپ کنید. هر عبارت را با کاما جدا کنید. گوگل برای شروع به شما «آلبرت انیشتین، شرلوک هلمز، فرانکنشتاین» را پیشنهاد میکند.
در جستجوهای NGram Viewer، موارد برخلاف جستجوهای وب Google، به حروف بزرگ و کوچک حساس هستند.
- محدوده تاریخ را انتخاب کنید. پیش فرض 1800 تا 2000 است.
- یک مجموعه را انتخاب کنید. شما می توانید متون زبان خارجی یا متون انگلیسی را جستجو کنید و علاوه بر انتخاب های استاندارد، ممکن است ورودی هایی مانند "English (2009)" یا "American English (2009)" را در انتهای لیست مشاهده کنید. اینها مجموعههای قدیمیتری هستند که گوگل از آن زمان بهروزرسانی کرده است، اما ممکن است دلیلی برای مقایسه خود با مجموعه دادههای قدیمی داشته باشید. اکثر کاربران می توانند آنها را نادیده بگیرند و روی جدیدترین مجموعه ها تمرکز کنند.
-
سطح صاف کردن را تنظیم کنید. هموارسازی به این اشاره دارد که نمودار در پایان چقدر صاف است. دقیق ترین نمایش سطح هموارسازی 0 را منعکس می کند، اما خواندن آن تنظیم ممکن است دشوار باشد. پیش فرض روی 3 تنظیم شده است. در بیشتر موارد، نیازی به تنظیم آن ندارید.
- را فشار دهید جستجوی تعداد زیادی کتاب.
با استفاده از Google's Ngram Viewer، می توانید داده ها را بررسی کنید. اگر می خواهید فعل ماهی را به جای اسم ماهی جستجو کنید، می توانید با استفاده از برچسب ها این کار را انجام دهید. در این مورد، شما باید fish_VERB را جستجو کنید.
Google فهرست کاملی از دستورات دیگر اسناد پیشرفته را برای استفاده با Ngram Viewer در وب سایت خود ارائه می دهد.
خط پایین
Google Books Ngram Viewer نموداری را ارائه می دهد که نشان دهنده استفاده از یک عبارت خاص در کتاب ها در طول زمان است. اگر بیش از یک کلمه یا عبارت را وارد کرده باشید، هر یک با یک خط رنگی برای تضاد با سایر عبارات جستجو نشان داده می شود.این شبیه به Google Trends است، فقط جستجو دوره طولانی تری را پوشش می دهد.
مطالعه موردی
مطالعه موردی پای سرکه ای را در نظر بگیرید. آنها در خانه کوچک لورا اینگالز وایلدر در مجموعه پریری ذکر شده اند. کاوش با جستجوی وب گوگل برای کسب اطلاعات بیشتر در مورد پای های سرکه نشان می دهد که آنها بخشی از غذاهای جنوبی آمریکا محسوب می شوند و در واقع با سرکه درست می شوند. آنها به زمانهایی گوش میدهند که همه در همه زمانهای سال به محصولات تازه دسترسی نداشتند، اما آیا تمام ماجرا همین است؟
Google Ngram Viewer را برای پای سرکه ای جستجو کنید، در اوایل و اواخر دهه 1800 با مواردی از پای، ذکرهای زیادی در دهه 1940 و تعداد فزاینده ای از موارد ذکر شده در زمان های اخیر مواجه خواهید شد. با این حال، با سطح هموارسازی 3، شما یک فلات بر فراز ذکر در 1800 می بینید. از آنجایی که در آن مدت کتاب های زیادی منتشر نشده بود و به دلیل اینکه داده ها صاف تنظیم شده اند، تصویر مخدوش می شود. احتمالاً فقط در یک کتاب به پای سرکه اشاره شده است، و میانگین آن برای جلوگیری از سنبله بوده است.با تنظیم هموارسازی روی 0، می توانید متوجه شوید که دقیقاً همینطور است. مرکز سنبله در سال 1869 است، و اوج دیگری در سال های 1897 و 1900 وجود دارد.
بعید است که هیچ کس در بقیه زمان ها در مورد پای های سرکه صحبت نکرده باشد: احتمالاً دستور العمل هایی در همه جا شناور بود، اما مردم در مورد آنها در کتاب ها نمی نوشتند، و این یک محدودیت مهم در جستجوهای Ngram است.