什么是 scipy.cluster.vq.kmeans2() 方法?

scipy.cluster.vq.kmeans2(data, k, iter=10, thresh=1e-05, minit='random', missing='warn', check_finite=True) - kmeans2() 方法对一组观察向量进行分类通过执行 k-means 算法分成 k 个簇。为了检查收敛性,kmeans2() 方法不使用阈值。它有额外的参数来决定质心的初始化方法,处理空集群,并验证输入度量是否只包含有限的数字。

下面给出了其参数的详细解释 -

参数

  • 数据- ndarray

    它是 N 维中 M 个观察值的 'M' × 'N' 数组。

  • k - int 或 ndarray

    此参数表示要形成的簇数和要生成的质心。它被解释为在下面给出的两个条件的情况下使用的初始集群 -

    • 当 minit 初始化字符串是 'matrix' 时。

    • 或者如果给出了 ndarray。

  • thresh - 浮动,可选

    该参数代表阈值。如果自上次迭代以来的失真变化小于或等于该阈值,则算法将默认终止。

  • minit - str,可选

    该参数表示初始化方法。下面给出了一些可用的方法 -

    • random - 它从具有均值和方差的高斯生成 k 个质心。根据数据估计均值和方差。

    • - 此方法选择 k 个观察值,即从初始质心的数据中随机行。

    • ++ - 这种方法,也称为小心播种,选择 k 个观察值,即 kmeans++ 方法的行。

    • 矩阵- 矩阵方法解释初始质心的 k 参数(作为 'k' 乘 'M' 数组)。

  • 缺少- str,可选

该参数表示处理空簇的方法。以下是可用的方法 -

  • 警告- 这种方法,顾名思义,给出警告,然后继续。

  • raise - 此方法将引发错误 (ClusterError) 并终止算法。

  • check_finite - 布尔值,可选

    此参数用于检查输入矩阵是否仅包含有限数字。禁用此参数可能会给您带来性能提升,但如果观察确实包含无穷大,它也可能导致一些问题,例如崩溃或非终止。此参数的默认值为True

退货

  • 质心- ndarray

    它通过 N 个质心数组返回 ak。

  • 标签- ndarray

    这是质心的索引。