什么是 scipy.cluster.hierarchy.fcluster() 方法?

scipy.cluster.hierarchy.fcluster(Z,t,criterion='inconsistent'depth=2,R=None, monocrat=None) - 该fcluster()方法从层次聚类形成平面聚类。这种层次聚类由给定的链接矩阵定义,识别聚类类之间的链接。

下面给出了其参数的详细解释 -

参数

  • Z - 数组

    它表示用链接矩阵编码的层次聚类。

  • t - 标量

    t 的值取决于标准的类型。对于“不一致”、“距离”和“monocrit”标准,t 的值表示在形成平坦集群时应用的阈值。另一方面,对于 'maxclust' 和 'maxclust_monocrit' 标准,t 的值表示请求的最大簇数。

  • 标准- str,可选

此参数表示用于形成扁平集群的标准。标准的值可以是以下任何一项 -

  • 不一致- 不一致标准意味着集群节点及其所有后代的不一致值小于或等于 t 的值。在这种情况下,簇节点的叶子后代将属于同一个平面簇。然而,如果不是这种情况,那么每个节点都将被分配到自己的集群。

  • 距离- 标准距离将形成扁平集群,条件是每个扁平集群中的原始观察具有等于或小于 t 的 cophenetic 距离。

  • maxclust - 标准 maxclust 将找到最小阈值 r。它确保同一平面集群中任何两个原始观测值之间的 cophenetic 距离将始终小于或等于 r 和 t。

  • monocrit - 当 monocrit[i] <=t 时,标准 monocrit 将从具有索引 i 的集群节点形成一个平面集群。

  • maxclust_monocrit - 当 monocrit[i] <=r 时,标准 maxclust_monocrit 将从索引为 i 的非单一集群节点形成一个平面集群。

  • 深度- 整数,可选

    此参数表示执行不一致性计算的最大深度。深度参数的默认值为 2,它对任何其他标准没有意义。

  • R - ndarray,可选

    此参数表示要用于不一致标准的不一致矩阵。默认值为 NONE,如果未提供,则将计算矩阵。

  • monocrit - ndarray,可选

    该参数是一个长度为 n-1 的数组。

退货

  • flcuster - ndarray

    它返回一个长度为 n 的数组。