উপাত্ত খনন

বৃহদাকারের উপাত্ত সমষ্টিসমূহ থেকে যে গণনমূলক প্রক্রিয়াতে বিভিন্ন বিন্যাস আবিষ্কার করা হয়

উপাত্ত খনন বা ইংরেজি পরিভাষায় ডাটা মাইনিং (ইংরেজি: data mining) পরিগণক বিজ্ঞান তথা কম্পিউটার বিজ্ঞানের একটি ক্ষেত্র হিসেবে বিবেচিত হয়।[১][২][৩] এটি "উপাত্তাধারগুলিতে জ্ঞান আবিষ্কার" (নলেজ ডিসকভারি ইন ডেটাবেসেজ বা সংক্ষেপে কেডিডি)[৩]-এর একটি ধাপ।

An example of data produced by data dredging through a bot operated by statistician Tyler Vigen, apparently showing a close link between the best word winning a spelling bee competition and the number of people in the United States killed by venomous spiders. The similarity in trends is obviously a coincidence.

উপাত্ত খনন কৃত্রিম বুদ্ধিমত্তা, পরিসংখ্যান, ডেটাবেজ ম্যানেজমেন্ট সিস্টেম সমন্বয়ে গঠিত একটি কম্পিউটিং বা পরিগণন কর্মকাণ্ড যার মাধ্যমে বিশালাকার উপাত্ত সংকলন (ডাটা সেট) থেকে নির্দিষ্ট বৈশিষ্টের উপাত্ত আবিষ্কার করা সম্ভব হয়। উপাত্ত খননের লক্ষ্য হল একটি উপাত্ত সংকলন থেকে নির্দিষ্ট বা কাংক্ষিত উপাত্ত খুঁজে বের করা এবং তা নির্দিষ্ট কাজের উপযোগী করে বিন্যাস, শ্রেণীবদ্ধ ও উপস্থাপন করা।

উপাত্তাধারগুলিতে জ্ঞান আবিষ্কারের ধাপগুলো নিম্নরূপঃ

  • বাছাইকরণ (সিলেকশন)
  • প্রাক-প্রক্রিয়াজাতকরণ (প্রি-প্রোসেসিং)
  • রূপান্তর (ট্রান্সফরমেশন)
  • উপাত্ত খনন (ডাটা মাইনিং)
  • মূল্যায়ন (এভালুয়েশন)[৪]

উপাত্ত খননের অ্যালগরিদম বা পরিগণনা প্রক্রিয়া

  • শ্রেণীবদ্ধকরণ (ক্লাসিফিকেশন)

এই প্রক্রিয়ায় পূর্বের উপাত্ত বিশ্লেষণ করে ভবিষ্যতের উপাত্তের চরিত্র সম্পর্কে পূর্ভাবাস দেওয়া যায়। সিদ্ধান্ত বৃক্ষ (ডিসিশন ট্রি), স্নায়বিক জাল [(নিউরাল নেটওয়ার্ক), ইত্যাদি প্রক্রিয়ায় সাধারণত উপাত্ত বিশ্লেষণ করা হয়।

  • গুচ্ছকরণ (ক্লাস্টারিং)

এই প্রক্রিয়ায় উপাত্তসমূহকে নির্দিষ্ট বৈশিষ্ট্যের ভিত্তিতে শ্রেণীবদ্ধ করা হয়। একটি নির্দিষ্ট শ্রেণীর উপাত্তগুলির মধ্যে সর্বোচ্চ সাদৃশ্য বজায় রাখা এবং দুইটি ভিন্ন শ্রেণীর উপাত্তগুলির মধ্যে সর্বনিম্ন সাদৃশ্য বজায় রাখা গুচ্ছকরণের উদ্দেশ্য।[৫]

  • সম্পর্কস্থাপন (অ্যাসোসিয়েশন)

এই প্রক্রিয়ায় পূর্বের কোন লিখিত নথিবিবণীতে (রেকর্ডে) যেসব উপাত্ত এসাথে অবস্থান করে তাদের মধ্যে সম্পর্কস্থাপন করা হয়।

  • অনুক্রম আবিষ্কার (সিকুয়েন্স ডিসকভারি)

এই প্রক্রিয়ায় সময়ের ভিত্তিতে এবং ক্রমানুসারে উপাত্ত শ্রেণীবদ্ধ করা হয়।[৪]

আরও দেখুন

তথ্যসূত্র

বহিঃসংযোগ

🔥 Top keywords: প্রধান পাতা২০২৪ আইসিসি পুরুষ টি২০ বিশ্বকাপতুফান (২০২৪-এর চলচ্চিত্র)বিশেষ:অনুসন্ধানঈদুল আযহাঈদের নামাজকুরবানীরবীন্দ্রনাথ ঠাকুরঈদ মোবারকক্লিওপেট্রাকোকা-কোলারাজকুমার (২০২৪-এর চলচ্চিত্র)এক্স এক্স এক্স এক্স (অ্যালবাম)বাংলাদেশমিয়া খলিফাআসসালামু আলাইকুমআবহাওয়া২০২৪ কোপা আমেরিকাদ্য কোকা-কোলা কোম্পানিইন্না লিল্লাহি ওয়া ইন্না ইলাইহি রাজিউনউয়েফা ইউরো ২০২৪ওয়ালাইকুমুস-সালামসন্দীপ লামিছানেতানজিম হাসান সাকিববাংলা প্রবাদ-প্রবচনের তালিকানির্জলা একাদশীকাজী নজরুল ইসলামচন্দ্রবোড়াশাকিব খানঈশ্বরচন্দ্র বিদ্যাসাগরস্বামী বিবেকানন্দভারতমহাত্মা গান্ধীঐশ্বর্যা রাইবাংলা ভাষাআইসিসি পুরুষ টি২০ বিশ্বকাপবিশেষ:সাম্প্রতিক পরিবর্তনসমূহমুহাম্মাদএকাদশী