Skip to main content

আপনার ওয়েবসাইট জন্য নমুনা robots.txt ফাইল

Technology Stacks - Computer Science for Business Leaders 2016 (জুন 2025)

Technology Stacks - Computer Science for Business Leaders 2016 (জুন 2025)

সুচিপত্র:

Anonim

আপনার ওয়েবসাইটের রুটটিতে সংরক্ষিত একটি robots.txt ফাইল ওয়েব ইঞ্জিনগুলিকে সার্চ ইঞ্জিন মাকড়সাগুলিকে বলবে যে কোন ডিরেক্টরি এবং ফাইলগুলিকে ক্রল করার অনুমতি দেওয়া হয়। Robots.txt ফাইলটি ব্যবহার করা সহজ, তবে আপনার মনে রাখা কিছু বিষয় রয়েছে:

  1. ব্ল্যাকহ্যাট ওয়েব রোবটগুলি আপনার robots.txt ফাইলকে উপেক্ষা করবে। সবচেয়ে সাধারণ ধরনের ম্যালওয়ার বট এবং রোবটগুলি ফসলের ইমেল ঠিকানাগুলি সন্ধান করছে।
  2. কিছু নতুন প্রোগ্রামার রোবট লিখবে যা robots.txt ফাইলটি উপেক্ষা করে। এই সাধারণত ভুল দ্বারা সম্পন্ন করা হয়।
  3. যে কেউ আপনার robots.txt ফাইল দেখতে পারেন। তাদের সর্বদা robots.txt বলা হয় এবং সর্বদা ওয়েবসাইটের রুটে সংরক্ষণ করা হয়।
  4. অবশেষে, যদি কেউ এমন কোনও ফাইল বা ডিরেক্টরি লিঙ্ক করে যা আপনার robots.txt ফাইলটি তাদের পৃষ্ঠার থেকে বাদ দেওয়া না হয় তবে তাদের সার্চ ইঞ্জিনগুলি যে কোনওভাবে খুঁজে পেতে পারে।

গুরুত্বপূর্ণ কিছু গোপন করতে robots.txt ফাইল ব্যবহার করবেন না। পরিবর্তে, আপনি নিরাপদ পাসওয়ার্ডগুলির পিছনে গুরুত্বপূর্ণ তথ্য রাখুন বা সম্পূর্ণভাবে ওয়েবটিকে ছেড়ে দিন।

কিভাবে এই নমুনা ফাইল ব্যবহার করবেন

আপনি যা করতে চান তার নিকটতম নমুনা থেকে পাঠ্যটি অনুলিপি করুন এবং এটি আপনার robots.txt ফাইলে আটকে দিন। আপনার পছন্দের কনফিগারেশন মিলতে রোবট, ডিরেক্টরি, এবং ফাইলের নাম পরিবর্তন করুন।

দুটি বেসিক Robots.txt ফাইল

ব্যবহারিক দূত: *নিষিদ্ধ: /

এই ফাইলটি যে কোন রোবট (

ব্যবহারিক দূত: *) যে এটি অ্যাক্সেস করা উচিত সাইটের প্রতিটি পৃষ্ঠায় উপেক্ষা করা উচিত (

নিষিদ্ধ: /).

ব্যবহারিক দূত: *নামঞ্জুর করুন:

এই ফাইলটি যে কোন রোবট (

ব্যবহারিক দূত: *) যেটি অ্যাক্সেস করে তা সাইটের প্রতিটি পৃষ্ঠায় দেখার অনুমতি দেওয়া হয় (

নামঞ্জুর করুন:).

আপনি আপনার robots.txt ফাইলটিকে ফাঁকা রেখে বা আপনার সাইটে এক না রেখে এটিও করতে পারেন।

রোবট থেকে নির্দিষ্ট ডিরেক্টরি রক্ষা করুন

ব্যবহারিক দূত: *নিষিদ্ধ: / cgi-bin /নিষিদ্ধ: / temp /

এই ফাইলটি যে কোন রোবট (

ব্যবহারিক দূত: *) যে এটি অ্যাক্সেস করা উচিত ডিরেক্টরি / cgi-bin / এবং / temp / (

নিষিদ্ধ: / cgi-bin / নিষিদ্ধ: / temp /).

রোবট থেকে নির্দিষ্ট পৃষ্ঠা রক্ষা করুন

ব্যবহারিক দূত: *নিষিদ্ধ: / jenns- স্টাফ.htmনিষিদ্ধ: /private.php

এই ফাইলটি যে কোন রোবট (

ব্যবহারিক দূত: *) যে এটি অ্যাক্সেস করা উচিত ফাইল / jenns- স্টাফ.htm এবং /private.php উপেক্ষা করা উচিত (

নিষিদ্ধ: / jenns- স্টাফ.htm নিষিদ্ধ: / Private.php).

আপনার সাইট অ্যাক্সেস থেকে একটি নির্দিষ্ট রোবট প্রতিরোধ করুন

ব্যবহারকারী এজেন্ট: Lycos / x.xনিষিদ্ধ: /

এই ফাইলটি বলে যে লাইকোস বট (

ব্যবহারকারী এজেন্ট: Lycos / x.x) সাইটে যে কোন জায়গায় প্রবেশ অনুমতি দেওয়া হয় না (

নিষিদ্ধ: /).

শুধুমাত্র একটি নির্দিষ্ট রোবট এক্সেস অনুমতি দিন

ব্যবহারিক দূত: *নিষিদ্ধ: /ব্যবহারকারী এজেন্ট: গুগলবোটনামঞ্জুর করুন:

এই ফাইলটি প্রথমে আমরা যেমন করেছিলাম তেমন সমস্ত রোবটকে অক্ষম করে এবং তারপর স্পষ্টভাবে Googlebot (

ব্যবহারকারী এজেন্ট: গুগলবোট) সবকিছু অ্যাক্সেস আছে (

নামঞ্জুর করুন:).

একাধিক লাইন একত্রিত করুন সঠিকভাবে আপনি চান ব্যতিক্রমগুলি পেতে

যদিও ব্যবহারকারী-এজেন্টের মত একটি অত্যন্ত সমন্বিত ইউজার-এজেন্ট লাইনটি ব্যবহার করা ভালো তবে * আপনি যতটা পছন্দ করেন ততই নির্দিষ্ট হতে পারেন। মনে রাখবেন যে রোবট যাতে ফাইল পড়তে। তাই যদি প্রথম লাইনগুলি বলে যে সমস্ত রোবট সবকিছু থেকে অবরুদ্ধ, এবং তারপরে ফাইলটিতে পরে এটি বলে যে সমস্ত রোবটকে সবকিছুতে অ্যাক্সেসের অনুমতি দেওয়া হয়েছে, রোবটগুলিতে সবকিছু অ্যাক্সেস থাকবে।

আপনি যদি আপনার robots.txt ফাইলটি সঠিকভাবে লিখেছেন কিনা তা নিশ্চিত না হন তবে আপনি আপনার robots.txt ফাইলটি পরীক্ষা করতে বা একটি নতুন লিখতে Google এর ওয়েবমাস্টার সরঞ্জাম ব্যবহার করতে পারেন।