কখন কোন মেশিন লার্নিং অ্যালগোরিদম ব্যবহার করব? পর্ব-২

Abu Tareq Rony
2 min readFeb 22, 2023

--

  • K-Nearest Neighbors: Classification বং Regression উভয় ক্ষেত্রে ব্যবহার হয় যখন ডেটাসেট তুলনামুলক ছোট এবং ডেটা পয়েন্ট গুলো কাছাকাছি থাকে। প্রদত্ত দুটি ডেটা পয়েন্ট একে অপরের যত কাছাকাছি, তত বেশি সম্পর্কিত এবং একই ধরনের হবে। এটি মুলত বিভিন্ন Distance based মেথডের সমন্বয়ে গঠিত হয়। যেমন Euclidean Distance, Minkowski distance, Hamming distance ইত্যাদি। Computer Vision, Content Recommendation এ এটি অনেক ব্যবহার হচ্ছে।
  • Support Vector Machines: Classification বং Regression উভয় ক্ষেত্রে linear, Non linear ডেটার ক্ষেত্রে ব্যবহার হয়। তবে যদিও আমরা বলি Regression সমস্যার জন্য এটি ব্যবহার হয় কিন্তু আসলে Classificationজন্য সবচেয়ে উপযুক্ত। Handwriting recognition, Intrusion detection, Face detection, Email classification, Gene classification ইত্যাদি ক্ষেত্রে এটি ব্যপক জনপ্রিয়।
  • K-Means Clustering: এটি ব্যবহার করা হয় যখন আপনার Feature গুলোর একটি সেট থাকে যেগুলোকে আপনি একই বৈশিষ্ট্য অনুযায়ী ভাগ করতে চান৷ এটি জনপ্রিয়, দ্রতগতি সম্পন্ন একটি অ্যালগোরিদম। কিন্তু categorical variables, outliers, number of clusters, high dimensional ডেটা নিয়ে কাজ জন্য এটি উপযোগী নয়। এর কিছু Extensions আপনার চোখে পড়তে পারে। যেমন; K-medians, K-medoids, K-modes, K-prototypes, Mini batch k-means ইত্যাদি। Customer Segmentation, Document Classification,Identifying crime localities, Call record detail analysis, fraud detection, Cyber-Profiling criminals ইত্যাদি ক্ষেত্রে এটি ব্যপক জনপ্রিয়।
  • Hierarchical Clustering: আপনি যদি এমন একটি পরিস্থিতিতে কাজ করেন যেখানে আপনাকে একটি প্রদত্ত observation এর সাথে সবচেয়ে বেশি অনুরূপ observation গুলি সনাক্ত করতে সক্ষম হতে হবে, তখন Hierarchical ক্লাস্টারিং একটি দুর্দান্ত অপশন। Hierarchical ক্লাস্টারিংয়ের জন্য তৈরি করা ডেনড্রোগ্রামটি ঠিক কোন observation গুলি একে অপরের সাথে সবচেয়ে বেশি মিল তা সনাক্ত করতে পারে। এটি দু ধরনের হতে পারে সেগুলো হল যথাক্রমে Agglomerative clustering(bottom-up approach) এবং Divisive clustering(top-down approach)। Bioinformatics, Image processing, Information Retrieval ইত্যাদি ক্ষেত্রে এটি ব্যপক জনপ্রিয়।
  • Association Rule Mining: ডেটা মাইনিংয়ে, Association Rule Mining customer behavior বিশ্লেষণ এবং ভবিষ্যদ্বাণী করার জন্য দরকারী।,Customer analytics,Medical diagnosis,Stock market analysi্‌ market basket analysis, product clustering, catalog design and store layout ইত্যাদি ক্ষেত্রে এটি ব্যপক জনপ্রিয়। এটি যেভাবে ব্যবহার হয়ঃ

প্রথমে frequent itemsets বের করতে হয়

তারপর association rules গঠন করতে হয়

association rules গুলো redundancy, statistical significance ইত্যাদির ভিত্তিতে ফিল্টার করতে হয়।

যে কম্পোনেন্ট গুলো নিয়ে association rules গঠিত সেগুলো হলঃ Support, Confidence এবং lift.

পরবর্তী পর্বে আমরা আর ও অন্য অ্যালগোরিদম গুলো সম্পর্কে জানব। Stay with me.

--

--

Abu Tareq Rony
Abu Tareq Rony

Written by Abu Tareq Rony

Enthusiasts in LLMs, Machine Learning & Deep Learning .

No responses yet