উপাত্ত খনন
উপাত্ত খনন বা ইংরেজি পরিভাষায় ডাটা মাইনিং (ইংরেজি: data mining) পরিগণক বিজ্ঞান তথা কম্পিউটার বিজ্ঞানের একটি ক্ষেত্র হিসেবে বিবেচিত হয়।[১][২][৩] এটি "উপাত্তাধারগুলিতে জ্ঞান আবিষ্কার" (নলেজ ডিসকভারি ইন ডেটাবেসেজ বা সংক্ষেপে কেডিডি)[৩]-এর একটি ধাপ।
![](http://upload.wikimedia.org/wikipedia/commons/thumb/0/0c/Spurious_correlations_-_spelling_bee_spiders.svg/220px-Spurious_correlations_-_spelling_bee_spiders.svg.png)
উপাত্ত খনন কৃত্রিম বুদ্ধিমত্তা, পরিসংখ্যান, ডেটাবেজ ম্যানেজমেন্ট সিস্টেম সমন্বয়ে গঠিত একটি কম্পিউটিং বা পরিগণন কর্মকাণ্ড যার মাধ্যমে বিশালাকার উপাত্ত সংকলন (ডাটা সেট) থেকে নির্দিষ্ট বৈশিষ্টের উপাত্ত আবিষ্কার করা সম্ভব হয়। উপাত্ত খননের লক্ষ্য হল একটি উপাত্ত সংকলন থেকে নির্দিষ্ট বা কাংক্ষিত উপাত্ত খুঁজে বের করা এবং তা নির্দিষ্ট কাজের উপযোগী করে বিন্যাস, শ্রেণীবদ্ধ ও উপস্থাপন করা।
উপাত্তাধারগুলিতে জ্ঞান আবিষ্কারের ধাপগুলো নিম্নরূপঃ
- বাছাইকরণ (সিলেকশন)
- প্রাক-প্রক্রিয়াজাতকরণ (প্রি-প্রোসেসিং)
- রূপান্তর (ট্রান্সফরমেশন)
- উপাত্ত খনন (ডাটা মাইনিং)
- মূল্যায়ন (এভালুয়েশন)[৪]
উপাত্ত খননের অ্যালগরিদম বা পরিগণনা প্রক্রিয়া
- শ্রেণীবদ্ধকরণ (ক্লাসিফিকেশন)
এই প্রক্রিয়ায় পূর্বের উপাত্ত বিশ্লেষণ করে ভবিষ্যতের উপাত্তের চরিত্র সম্পর্কে পূর্ভাবাস দেওয়া যায়। সিদ্ধান্ত বৃক্ষ (ডিসিশন ট্রি), স্নায়বিক জাল [(নিউরাল নেটওয়ার্ক), ইত্যাদি প্রক্রিয়ায় সাধারণত উপাত্ত বিশ্লেষণ করা হয়।
- গুচ্ছকরণ (ক্লাস্টারিং)
এই প্রক্রিয়ায় উপাত্তসমূহকে নির্দিষ্ট বৈশিষ্ট্যের ভিত্তিতে শ্রেণীবদ্ধ করা হয়। একটি নির্দিষ্ট শ্রেণীর উপাত্তগুলির মধ্যে সর্বোচ্চ সাদৃশ্য বজায় রাখা এবং দুইটি ভিন্ন শ্রেণীর উপাত্তগুলির মধ্যে সর্বনিম্ন সাদৃশ্য বজায় রাখা গুচ্ছকরণের উদ্দেশ্য।[৫]
- সম্পর্কস্থাপন (অ্যাসোসিয়েশন)
এই প্রক্রিয়ায় পূর্বের কোন লিখিত নথিবিবণীতে (রেকর্ডে) যেসব উপাত্ত এসাথে অবস্থান করে তাদের মধ্যে সম্পর্কস্থাপন করা হয়।
- অনুক্রম আবিষ্কার (সিকুয়েন্স ডিসকভারি)
এই প্রক্রিয়ায় সময়ের ভিত্তিতে এবং ক্রমানুসারে উপাত্ত শ্রেণীবদ্ধ করা হয়।[৪]
আরও দেখুন
তথ্যসূত্র
বহিঃসংযোগ
![](http://upload.wikimedia.org/wikipedia/commons/thumb/4/4a/Commons-logo.svg/30px-Commons-logo.svg.png)
- কার্লিতে ডেটা মাইনিং সফটওয়্যার (ইংরেজি)