দ্য K- মানে ক্লাস্টারিং অ্যালগরিদম একটি ডেটা মাইনিং এবং মেশিন লার্নিং টুল যা সম্পর্ক সম্পর্কিত কোনও পূর্বের জ্ঞানের সাথে সংশ্লিষ্ট পর্যবেক্ষণের গোষ্ঠীগুলিতে ক্লাস্টার পর্যবেক্ষণগুলিতে ব্যবহৃত হয়। নমুনা দ্বারা, অ্যালগরিদম কোন বিভাগে, বা ক্লাস্টারটি প্রদর্শন করতে চেষ্টা করে, এর সাথে সম্পর্কিত ক্লাস্টারগুলির সংখ্যাটি সংজ্ঞায়িত করে ট।
দ্য K- মানে অ্যালগরিদম সবচেয়ে সহজ ক্লাস্টারিং কৌশল এবং এটি সাধারণত চিকিৎসা ইমেজিং, বায়োমেট্রিক্স এবং সম্পর্কিত ক্ষেত্রগুলিতে ব্যবহৃত হয়। সুবিধা K- মানে ক্লাস্টারিংটি শুরুতে ডেটা সম্পর্কে অ্যালগরিদমটি নির্দেশ করার পরিবর্তে এটি আপনার ডেটা (তার অপ্রয়োজনীয় ফর্ম ব্যবহার করে) সম্পর্কে বলে। (অ্যালগরিদমের তত্ত্বাবধানে থাকা ফর্মটি ব্যবহার করে)।
এটি কখনও কখনও লয়েড এর অ্যালগরিদম হিসাবে উল্লেখ করা হয়, বিশেষত কম্পিউটার বিজ্ঞান বৃত্তগুলিতে, কারণ স্ট্যান্ডার্ড অ্যালগরিদমটি প্রথম স্টুয়ার্ট লয়েড দ্বারা 1957 সালে প্রস্তাবিত হয়েছিল। 1977 সালে জেমস ম্যাককুইন শব্দটি "কে-মিড" শব্দটি প্রণয়ন করা হয়েছিল।
কিভাবে কে-মানে আলগোরিদিম ফাংশন
দ্য K- মানে অ্যালগরিদম একটি বিবর্তনীয় অ্যালগরিদম যা তার ক্রিয়াকলাপের পদ্ধতি থেকে তার নাম অর্জন করে। মধ্যে অ্যালগরিদম ক্লাস্টার পর্যবেক্ষণ ট গ্রুপ, যেখানে ট একটি ইনপুট পরামিতি হিসাবে প্রদান করা হয়। তারপর এটি ক্লাস্টারের মধ্যবর্তী পর্যবেক্ষণের কাছাকাছি থাকা ক্লাস্টারগুলির প্রতিটি পর্যবেক্ষণকে নির্দিষ্ট করে। ক্লাস্টার এর মানে তারপর পুনরায় কম্পম্পট করা হয় এবং প্রক্রিয়া আবার শুরু হয়। এখানে কিভাবে অ্যালগরিদম কাজ করে:
- আলগোরিদিম ইচ্ছাকৃতভাবে নির্বাচন করে ট প্রাথমিক ক্লাস্টার কেন্দ্র হিসাবে (পয়েন্ট) পয়েন্ট।
- প্রতিটি বিন্দু এবং প্রতিটি ক্লাস্টার কেন্দ্রের মধ্যে ইউক্লিডান দূরত্বের উপর ভিত্তি করে, ডেটাসেটের প্রতিটি বিন্দু বন্ধ ক্লাস্টারকে বরাদ্দ করা হয়।
- প্রতিটি ক্লাস্টার কেন্দ্রটি সেই ক্লাস্টারের পয়েন্টগুলির গড় হিসাবে পুনঃপুনিত হয়।
- পদক্ষেপ 2 এবং 3 ক্লাস্টার একত্রিত হওয়া পর্যন্ত পুনরাবৃত্তি। কনভারজেন্সটি বাস্তবায়নের উপর নির্ভর করে আলাদাভাবে সংজ্ঞায়িত করা যেতে পারে, তবে সাধারণত এটির অর্থ হল যে 2 এবং 3 টি পদক্ষেপ পুনরাবৃত্তি করার পরে ক্লিয়ারারগুলি কোনও পরিবর্তনগুলি পরিবর্তন করে না, বা পরিবর্তনগুলি ক্লাস্টারগুলির সংজ্ঞাতে কোন উপাদান পার্থক্য তৈরি করে না।
ক্লাস্টার সংখ্যা নির্বাচন করা হচ্ছে
প্রধান ক্ষতি এক K- মানে ক্লাস্টারিং আপনাকে অবশ্যই অ্যালগরিদমের ইনপুট হিসাবে ক্লাস্টারগুলির সংখ্যা নির্দিষ্ট করতে হবে। পরিকল্পিত হিসাবে, অ্যালগরিদম যথাযথ সংখ্যক ক্লাস্টার নির্ধারণ করতে সক্ষম নয় এবং ব্যবহারকারীকে এটি অগ্রিম সনাক্ত করার উপর নির্ভর করে।
উদাহরণস্বরূপ, যদি আপনার এমন একটি গোষ্ঠী ছিল যা পুরুষ বা মহিলা হিসাবে বাইনারি লিঙ্গ সনাক্তকরণের ভিত্তিতে ক্লাস্টার করা হয় তবে K- ইনপুট ব্যবহার করে আলগোরিদিম মানে ট = 3 মানুষকে তিনটি ক্লাস্টারে বাধ্য করবে যখন কেবল দুটি, বা একটি ইনপুট ট = 2, একটি আরো প্রাকৃতিক ফিট প্রদান করবে।
একইভাবে, যদি ব্যক্তিদের একটি গোষ্ঠীটি সহজেই হোম স্টেটের উপর ভিত্তি করে ক্লাস্টার করা হয় এবং আপনি বলে থাকেন K- ইনপুট সঙ্গে আলগোরিদিম মানে ট = 20, ফলাফল কার্যকর হতে খুব সাধারণ হতে পারে।
এই কারণে, এটি প্রায়ই বিভিন্ন মানের সঙ্গে পরীক্ষা করার জন্য একটি ভাল ধারণা ট আপনার তথ্য যথোপযুক্ত সৃষ্টিকর্তা সনাক্ত করতে। আপনি মেশিন-শিখেছি জ্ঞান আপনার অনুসন্ধানের অন্যান্য ডেটা মাইনিং অ্যালগরিদম ব্যবহার অন্বেষণ করতে পারেন।