GMM
GMM(高斯混合聚类)算法采用了新的判断依据:概率,即通过属于某一类的概率大小来判断最终的归属类别。
仅支持通过可视化方式,配置读取该组件参数,参数详情如下表所示:
- 可视化方式
页签 | 参数 | 参数名称 | 是否必选 | 参数描述 | 默认值 |
---|---|---|---|---|---|
数据源 | 表名 | inputTable | 是 | 数据表 | 无 |
默认参数 | 选择特征列 | selectedColNames | 是 | 输入表中选择特征列名类型。 | 无 |
模型参数 | 混合高斯模型个数 | n_components | 是 | 混合高斯模型个数。 | 1 |
模型参数 | 协方差类型 | covariance_type | 是 | 协方差类型包括full、tied、diag、spherical等。full指每个分量有各自不同的标准协方差矩阵;tied指所有分量有相同的标准协方差矩阵;diag指每个分量有各自不同对角协方差矩阵;spherical指每个分量有各自不同的简单协方差矩阵,球面协方差矩阵。 | full |
调优参数 | EM迭代停止阈值 | tol | 是 | EM迭代停止阈值。 | 0.001 |
调优参数 | 最大迭代次数 | max_iter | 是 | 最大迭代次数。 | 100 |
调优参数 | 初始化次数 | n_init | 是 | 初始化次数,用于产生最佳初始参数。 | 1 |
调优参数 | 初始化参数类型 | init_params | 是 | 初始化参数类型包括kmeans、random等,初始化参数实现方式,默认用kmeans实现,也可以选择随机产生。 | kmeans |