বড় উপাত্ত
বড় উপাত্ত বা বিগ ডেটা (ইংরেজি: Big Data) হচ্ছে ডাটা সেট যা এতই বৃহদাকার এবং জটিল যে গতানুগতিক ডাটা প্রক্রিয়াকরণ অ্যাপ্লিকেশন সফ্টওয়্যার মোকাবেলা করার জন্য যা অনুপযুক্ত। বিগ ডাটা চ্যালেঞ্জের মধ্যে অন্তর্ভুক্ত হচ্ছে ডাটা ক্যাপচারিং, কম্পিউটার মেমরি, তথ্য সংরক্ষণ, তথ্য বিশ্লেষণ, সার্চ, শেয়ারিং, স্থানান্তর, কল্পনা, জিজ্ঞাসা, হালনাগাদ করা এনং তথ্য গোপনীয়তা। বিগ ডাটার ৫ টি মাত্রা রয়েছেঃ আয়তন, বিভিন্নতা, বেগ এবং সম্প্রতি যোগকৃত ভারসাম্য এবং মান।[২]
![](http://upload.wikimedia.org/wikipedia/commons/thumb/7/7c/Hilbert_InfoGrowth.png/400px-Hilbert_InfoGrowth.png)
বড় উপাত্ত শব্দটির বর্তমান ব্যবহার ভবিষ্যদ্বাণীমূলক বিশ্লেষণ, ব্যবহারকারীর আচরণ বিশ্লেষণ, বা কিছু অন্যান্য উন্নত উপাত্ত বিশ্লেষণ পদ্ধতির ব্যবহারকে নির্দেশ করে যা বড় উপাত্ত থেকে মান নিষ্কাশন করে, এবং খুব কমই ডাটা সেটের একটি নির্দিষ্ট আকারের ব্যবহার কে নির্দেশ করে। "কোন সন্দেহ নেই যে এখন যে পরিমাণ তথ্য পাওয়া যাচ্ছে তা সত্যিই বড়, কিন্তু এটা এই নতুন ডাটা বাস্তুতন্ত্রের সবচেয়ে প্রাসঙ্গিক বৈশিষ্ট্য নয়।"[৩] ডাটা সেট বিশ্লেষণ "ব্যবসায়িক প্রবণতা চিহ্নিত করা, রোগ প্রতিরোধ, অপরাধ মোকাবেলা ইত্যাদি" এর সাথে নতুন সম্পর্ক খুঁজে পেতে পারে।[৪] বিজ্ঞানী, ব্যবসায়িক নির্বাহী, চিকিৎসক, বিজ্ঞাপন এবং সরকার নিয়মিত ইন্টারনেট অনুসন্ধান, ফিনটেক, হেল্থকেয়ার অ্যানালিটিক্স, ভৌগোলিক তথ্য ব্যবস্থা, শহুরে ইনফরমেটিক্স এবং ব্যবসায়িক ইনফরমেটিক্স সহ বৃহৎ ডাটা সেট সঙ্গে সমস্যা পূরণ করে। বিজ্ঞানীরা ই-সায়েন্স কাজের সীমাবদ্ধতার সম্মুখীন হন, যার মধ্যে রয়েছে আবহাওয়া, জিনোমিক্স,[৫] কানেক্টোমিক্স, জটিল পদার্থবিজ্ঞান সিমুলেশন, জীববিজ্ঞান, এবং পরিবেশ গত গবেষণা।[৬]
মোবাইল ডিভাইস, সস্তা এবং অসংখ্য তথ্য-সংবেদনশীল ইন্টারনেট, এরিয়াল (রিমোট সেন্সিং), সফটওয়্যার লগ, ক্যামেরা, মাইক্রোফোন, রেডিও-ফ্রিকোয়েন্সি আইডেন্টিফিকেশন (আরএফআইডি) রিডার এবং ওয়্যারলেস সেন্সর নেটওয়ার্কের মতো ডিভাইসের মাধ্যমে ডেটা সংগ্রহের আকার ও সংখ্যা দ্রুত বৃদ্ধি পেয়েছে।[৭][৮] তথ্য সঞ্চয়ের জন্য বিশ্বের প্রযুক্তিগত সক্ষমতা ১৯৮০-এর দশকের পর থেকে প্রতি ৪০ মাসে প্রায় দ্বিগুণ হয়েছে;[৯] ২০১২ এর হিসাবে, প্রতিদিন ২.৫ এক্সাবাইট (2.5× বাইট) ডাটা উৎপাদিত হয়।[১০]