博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
杰卡德距离
阅读量:7079 次
发布时间:2019-06-28

本文共 604 字,大约阅读时间需要 2 分钟。

(博客主亲自录制视频教程)

杰卡德距离(Jaccard Distance) 是用来衡量两个集合差异性的一种指标,它是杰卡德 的 ,被定义为1减去Jaccard相似系数。而杰卡德相似系数(Jaccard similarity coefficient),也称杰卡德指数(Jaccard Index),是用来衡量两个集合相似度的一种指标。
 
中文名
杰卡德距离
外文名
Jaccard Distance
提出者
 Paul Jaccard
应用学科
统计学,机器学习,数据挖掘,信息信息检索
适用领域范围
集合相似性度量,字符串相似性度量

目录

  1. 1
  2. 2
  3. 3

定义

Jaccard相似指数用来度量两个集合之间的相似性,它被定义为两个集合交集的元素个数除以 的元素个数。
Jaccard距离用来度量两个集合之间的差异性,它是Jaccard的 的 ,被定义为1减去Jaccard相似系数。

性质

1) 若A、B两个集合都为空,则
;
2)
;

应用

给定两个n维二元向量A、B,A、B的每一维都只能是0或者1,利用Jaccard 来计算二者的相似性:
1)
代表向量A与向量B都是0的维度个数;
2)
代表向量A是0而向量B是1的维度个数;
3)
代表向量A是1而向量B是0的维度个数;
4)
代表向量A和向量B都是1的维度个数。
n维向量的每一维都会落入这4类中的某一类,因此:
则Jaccard 为
Jaccard距离为
 

 

转载地址:http://xjcml.baihongyu.com/

你可能感兴趣的文章
HBase与Zookeeper数据结构查询
查看>>
QQ等软件可以联网 网页打不开
查看>>
c++ 使用socket实现C/S端文件的下载传输
查看>>
JMF获取设备列表失败,获取视频设备失败?
查看>>
国内 Mono 相关文章汇总
查看>>
Python模块学习 ---- datetime
查看>>
MS SQL Server Quarter Function
查看>>
linux日志(常用命令)
查看>>
history
查看>>
Leetcode: Arranging Coins
查看>>
HttpUtil 【判断网络连接的封装类】
查看>>
【转】TCP分段与IP分片
查看>>
iOS 多线程 NSOperation、NSOperationQueue
查看>>
delphi执行查询语句时的进度条怎么做
查看>>
CF 335A(Banana-贪心-priority_queue是大根堆)
查看>>
python的memcache使用如果对key设置了一个int型
查看>>
Leetcode: Longest Substring with At Most Two Distinct Characters
查看>>
173. Binary Search Tree Iterator
查看>>
[python基础知识]python内置函数map/reduce/filter
查看>>
基因家族收缩和扩张分析 & Selective loss pathway & 泛基因组
查看>>