Skip to main content
Version: 2.17.1

GMM

GMM(高斯混合聚类)算法采用了新的判断依据:概率,即通过属于某一类的概率大小来判断最终的归属类别。

仅支持通过可视化方式,配置读取该组件参数,参数详情如下表所示:

  • 可视化方式
页签参数参数名称是否必选参数描述默认值
数据源表名inputTable数据表
默认参数选择特征列selectedColNames输入表中选择特征列名类型。
模型参数混合高斯模型个数n_components混合高斯模型个数。1
模型参数协方差类型covariance_type协方差类型包括full、tied、diag、spherical等。full指每个分量有各自不同的标准协方差矩阵;tied指所有分量有相同的标准协方差矩阵;diag指每个分量有各自不同对角协方差矩阵;spherical指每个分量有各自不同的简单协方差矩阵,球面协方差矩阵。full
调优参数EM迭代停止阈值tolEM迭代停止阈值。0.001
调优参数最大迭代次数max_iter最大迭代次数。100
调优参数初始化次数n_init初始化次数,用于产生最佳初始参数。1
调优参数初始化参数类型init_params初始化参数类型包括kmeans、random等,初始化参数实现方式,默认用kmeans实现,也可以选择随机产生。kmeans