对象间的相似性度量
vicky
对象间的相似性度量
相似性
余弦夹角
ARD系数
ARD系数
相关系数
相异度
距离
归一化的相似性=1-归一化的相异度
变量的标准化
计算平均绝对偏差
其中
计算标准化的度量值(z-score)
使用平均绝对偏差往往比使用标准差更具有健壮性
4
夹角余弦
ARD系数
对称的二元变量
不对称的二元变量
常将出现概率较小的状态编码为1,将另一种状态编码为0
两个都取值为0的情况成为负匹配,被认为不重要
Object i
Object j
简单匹配系数: R=(a+d)/(a+b+c+d)
ARD系数:J=a/(a+b+c)
6
ARD系数
7
相关系数
欧式距离与绝对距离
欧式距离
绝对距离(Manhattan距离)
Minkowski距离
其中
Minkowski距离又称距离, 距离即欧式距离, 距离即绝对距离。
切比雪夫距离
Chebyshev距离(切比雪夫距离)
Chebyshev距离是Minkowski距离当时的极限。
对象间的相似性 来自淘豆网m.daumloan.com转载请标明出处.