Indeks Jaccard

ukuran kemiripan dan keragaman antarhimpunan

Indeks Jaccard (disebut juga koefisien kemiripan Jaccard) adalah ukuran kemiripan dan keragaman himpunan sampel. Indeks ini dikembangkan oleh Paul Jaccard (awalnya bernama coefficient de communauté)[1] dan dirumuskan secara mandiri oleh T. Tanimoto.[2] Karenanya, istilah indeks Tanimoto atau koefisien Tanimoto juga dipakai dalam bidang-bidang tertentu. Namun, keduanya juga secara umum mengambil rasio Irisan per Gabungan (bahasa Inggris: Intersection over Union/IoU). Indeks ini bisa diukur sebagai berikut:

Irisan dan gabungan himpunan A dan B
Irisan per Gabungan sebagai ukuran kemiripan dalam deteksi objek pada citra—operasi penting dalam penglihatan komputer

Kemiripan atribut biner tak simetri

Klasifikasi biner

Lihat pula

  • Koefisien tumpang-tindih (koefisien Szymkiewicz–Simpson)
  • Koefisien pencocokan sederhana (koefisien kemiripan Rand/SMC)
  • Jarak Hamming
  • Koefisien Sørensen–Dice (indeks Sørensen/koefisien Dice)
  • Indeks Tversky
  • Korelasi
  • Informasi bersama (MI)

Referensi

Bacaan lebih lanjut

  • Tan, P.N., Steinbach, M., dan Kumar, V. (2005). Introduction to Data Mining. ISBN 0-321-32136-7. 
  • Jaccard, P. (1901). "Étude comparative de la distribution florale dans une portion des Alpes et des Jura". Bulletin de la Société vaudoise des sciences naturelles. 37: 547–579. 
  • Jaccard, P. (1912). "The Distribution of the flora in the alpine zone". New Phytologist. 11 (2): 37–50. doi:10.1111/j.1469-8137.1912.tb05611.x.