【1.3】–--类之间距离的度量方法

系统聚类法不仅需要度量个体与个体之间的距离,还要度量类与类之间的距离。类间距离被度量出来之后,距离最小的两个小类将首先被合并成为一类。由类间距离定义的不同产生了不同的系统聚类法。

SPSS 中提供了如下几种类间距离测度方法:

  1. 组间平均连接距离(Between-group linkage):以两类个体两两之间距离的平均数作为类间距离;

  2.  组内平均连接距离(Within-group linkage):将两类个体合并为一类后,以合并后 类中所有个体之间的平均距离作为类间距离;

  3. 最近邻距离(Nearest neighbor):以两类中距离最近的两个个体之间的距离作为类 间距离;

  4.  最远邻距离(Furthest neighbor):以两类中距离最远的两个个体之间的距离作为类 间距离;

  5.  重心距离(Centroid cluster):以两类变量均值之间的距离作为类间距离;

  6. 中位数距离(Median cluster):以两类变量中位数之间的距离作为类间距离;

  7.  离差平方和法(Ward method): 该方法是Ward提出来的,所以又称为Ward法。具 体做法是先将n个样品各自成一类,然后每次减少一类,随着类与类的不断聚合, 类内的离差平方和必然不断增大,选择使离差平方和增加最小的两类合并,直到所 有的样品归为一类为止。

参考资料:

第 10 章 聚类分析(超级赞的一个资料)

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn