اندیس ژاکار (به انگلیسی: Jaccard index) یا ضریب شباهت ژاکار (به فرانسوی: coefficient de communauté) معیاری برای مقایسه شباهت یا تفاوت مجموعه نمونههای آماری است.
میزان شباهت دو مجموعه نمونه با توجه به اندیس ژاکار ، از تقسیم تعداد اشتراک دو مجموعه بر تعداد اجتماع دو مجموعه به دست میآید.
همچنین، فاصله ژاکار که میزان تفاوت دو مجموعه نمونه را میسنجند، با کم کردن میزان شباهت ژاکار از یک بدست میآید. همینطور با کسر تعداد اشتراک از تعداد اجتماع دو مجموعه و تقسیم آن به تعداد اجتماع دو مجموعه میتوان فاصله ژاکار بین آن دو مجموعه را محاسبه کرد.
اندیس ژاکار یک تابع استاندارد فاصله (متریک) است.[۱][۲]
دو شیء A و B را در نظر میگیریم که هر کدام شامل n صفت دودویی هستند. با استفاده از ضریب ژاکار میتوان میزان صفتهای مشترک بین A و B را محاسبه کرد. هر صفتی از A و B میتواند دارای مقدار ۰ یا ۱ باشد. تعداد کل شیوههای مختلف ترکیب صفات در A و B به شکل زیر مشخص میشود:
هر صفت میبایست در یکی از چهار گروه فوق قرار بگیرد؛ بنابراین:
ضریب شباهت ژاکار به این طریق بدست میآید:
همچنین فاصله ژاکار به شکل زیر محاسبه میشود:
{{citation}}
: Missing or empty |title=
(help).شاخصهای ارزشیابی یادگیری ماشینی | |
---|---|
رگرسیون | |
طبقهبندی | امتیاز اف ۱ · Accuracy · Precision · Recall · Kappa · MCC · AUC · ROC · حساسیت و ویژگی · Logarithmic Loss |
خوشهبندی | Silhouette · Calinski-Harabasz · Davies-Bouldin · Dunn index · Hopkins statistic · اندیس ژاکار · Rand index · Similarity measure · SMC · SimHash |
رتبهبندی | |
بینایی رایانهای | |
NLP | |
شاخصهای مرتبط با یادگیری عمیق | Inception score · FID |
سامانه توصیهگر | Coverage · Personalization · Intra-list Similarity |
تشابه | |