একটি নেগ্রাম, যা সাধারণত N-gram নামে পরিচিত, এটি সন্ধান করার জন্য পাঠ্য বা ভাষ্য সামগ্রীটির পরিসংখ্যান বিশ্লেষণ এন (একটি সংখ্যা) টেক্সট কিছু আইটেম আইটেম।
অনুসন্ধান আইটেমটি সব ধরনের জিনিস হতে পারে, যেমন ফোনেম, উপসর্গ, বাক্যাংশ, বা অক্ষর। যদিও N-gram গবেষণা সম্প্রদায়ের বাইরে কিছুটা অস্পষ্ট হলেও এটি বিভিন্ন ক্ষেত্রগুলিতে ব্যবহৃত হয় এবং এটি প্রাকৃতিক বোকাভাষী ভাষা বুঝতে এবং প্রতিক্রিয়া জানাতে কম্পিউটার প্রোগ্রামগুলিকে কোডিংয়ের জন্য অনেকগুলি প্রভাব ফেলে।
গুগল বুকস নেগরাম ভিউয়ারের ক্ষেত্রে, বিশ্লেষণ করা পাঠ্যটি পাবলিক লাইব্রেরির গুগল স্কাই ইঞ্জিনগুলি তাদের গুগল বুকস সার্চ ইঞ্জিন তৈরির জন্য বিপুল সংখ্যক বই থেকে আসে। গুগল বুকস নেগ্রাম ভিউয়ারের জন্য, তারা যে টেক্সটটি সন্ধান করতে যাচ্ছেন তা উল্লেখ করে দেহ । Ngram ভিউয়ার ভাষা দ্বারা সংহত, যদিও আপনি পৃথকভাবে ব্রিটিশ এবং আমেরিকান ইংরেজি বিশ্লেষণ করতে পারেন বা তাদের একসঙ্গে lump।
কিভাবে Ngram কাজ করে
-
Books.google.com/ngrams এ Google Books Ngram Viewer এ যান।
-
আপনি বিশ্লেষণ করতে চান যে কোনো ফ্রেজ বা বাক্যাংশ টাইপ করুন। একটি কমা সঙ্গে প্রতিটি ফ্রেজ আলাদা করুন। গুগলের পরামর্শ, "অ্যালবার্ট আইনস্টাইন, শেরলক হোমস, ফ্রাঙ্কেনস্টাইন" আপনাকে শুরু করতে। আইটেম কেস সংবেদনশীল, গুগল ওয়েব অনুসন্ধানের বিপরীতে।
-
একটি তারিখ পরিসীমা লিখুন। ডিফল্ট 1800 থেকে 2000 হয়।
-
একটি corpus চয়ন করুন। আপনি বিদেশী ভাষার পাঠ্য বা ইংরেজিতে অনুসন্ধান করতে পারেন এবং মানক পছন্দগুলির পাশাপাশি আপনি "ইংলিশ (200 9) বা আমেরিকান ইংরাজি (200 9)" এর মতো বিষয়গুলি লক্ষ্য করতে পারেন। এইগুলি পুরোনো কর্পোরেশার থেকে এসেছে যা Google এর থেকে আপডেট হয়েছে, তবে আপনার পুরোনো ডেটা সেটগুলির তুলনায় আপনার তুলনা করার কিছু কারণ থাকতে পারে। বেশিরভাগ ব্যবহারকারী তাদের উপেক্ষা করতে পারেন এবং সাম্প্রতিকতম কর্পোরেশনের উপর মনোযোগ দিতে পারেন।
-
আপনার মসৃণ স্তর সেট করুন। মসৃণতা গ্রাফটি কত মসৃণ তা বোঝায়। সবচেয়ে সঠিক প্রতিনিধিত্ব 0 এর একটি মসৃণ স্তর হবে, তবে সেটিকে পড়তে অসুবিধা হতে পারে। ডিফল্ট সেট করা হয় 3. বেশিরভাগ ক্ষেত্রে, আপনাকে এটি সামঞ্জস্য করতে হবে না।
-
প্রেস করুন বই প্রচুর অনুসন্ধান করুন বোতাম।
Google আপনাকে Ngram ভিউয়ারের সাথে বেশ কিছুটা ড্রিল করতে দেয়। মাছের পরিবর্তে ক্রিয়াটির পরিবর্তে আপনি মাছ অনুসন্ধান করতে চাইলে ট্যাগ ব্যবহার করে আপনি এটি করতে পারেন। এই ক্ষেত্রে, আপনি "fish_VERB" অনুসন্ধান করবেন
গুগল তাদের ওয়েবসাইটের কমান্ডগুলির সম্পূর্ণ তালিকা এবং অন্যান্য উন্নত ডকুমেন্টেশন সরবরাহ করে।
Ngram দেখাচ্ছে কি?
গুগল বুকস নেগ্রাম ভিউয়ার এমন একটি গ্রাফ আউটপুট করবে যা সময়ের মধ্যে বইয়ের নির্দিষ্ট বাক্যাংশ ব্যবহার করে। আপনি যদি একাধিক শব্দ বা শব্দগুচ্ছ প্রবেশ করিয়ে থাকেন, তবে আপনি বিভিন্ন অনুসন্ধান পদগুলির বিপরীতে রঙ-কোডেড লাইন দেখতে পাবেন। এটি গুগল ট্রেন্ডস এর মতই প্রশংসনীয়, কেবলমাত্র অনুসন্ধানের সময়কালটি আরও বেশি কভার করে।
কেস স্টাডি
ভিনেগার pies কেস অধ্যয়ন বিবেচনা করুন। তারা লাউরা Ingalls Wilder এর উল্লেখ করা হয় বৃক্ষহীন তৃণভূমি উপর সামান্য ঘর সিরিজ। ভিনেগার পিস সম্পর্কে আরও জানতে গুগল এর ওয়েব অনুসন্ধানের সাথে এক্সপ্লোর করার ফলে তারা আমেরিকান সাউদার্ন রান্নার অংশ হিসাবে বিবেচিত হয় এবং সত্যিই ভিনেগার থেকে তৈরি হয়। তারা বারবার যখন তারা সবাই বছরের সেরা সময়ে তাজা উত্পাদন অ্যাক্সেস ছিল না মনোযোগ। কিন্তু পুরো গল্পটা কি?
জন্য গুগল Ngram ভিউয়ার অনুসন্ধান করুন ভিনেগার পাই এবং আপনি 1840 এর দশকের প্রথম দিকে এবং দেরী উভয় দিকেই পাইয়ের কিছু উল্লেখের সম্মুখীন হবেন, 1940-এর দশকে উল্লেখযোগ্য উল্লেখ এবং সাম্প্রতিক সময়ে উল্লেখযোগ্য সংখ্যা উল্লেখ করা হবে। যাইহোক, একটি মসৃণ স্তর 3 সঙ্গে আপনি 1800s মধ্যে উল্লেখ উপর একটি প্লেট দেখতে পাবেন। যে সময় প্রকাশিত অনেক বই নেই কারণ এবং আমাদের তথ্য মসৃণ সেট করা হয়, এটি ছবি distorts। সম্ভবত ভিনেগার পাই উল্লেখ করা একটি বই ছিল, এবং এটি একটি spike এড়ানোর জন্য মাত্র গড় পেয়েছিলাম। 0 থেকে Smoothing সেটিং করে, আমরা দেখতে পারেন যে এই ঠিক ক্ষেত্রে। 1869 সালে স্পাইক কেন্দ্রগুলি ছিল এবং 1897 ও 1900 সালে আরেকটি স্পাইক ছিল।
এটা অসম্ভাব্য যে কেউ ভিনেগার সম্পর্কে বাকি সময় পাকা না: সম্ভবত সব জায়গায় ভাসমান রেসিপি ছিল, কিন্তু মানুষ শুধু না লেখা তাদের সম্পর্কে বই, এবং যে এই Ngram অনুসন্ধান একটি গুরুত্বপূর্ণ সীমাবদ্ধতা।