DBSCAN
DBSCAN是一种基于数据密度的无监督聚类算法。在聚类空间的特定区域内,使用指定的半径阈值和数量阈值,筛选核心点及其领域点。通过密度可达及密度相连理论,实现数据点聚类。
仅支持通过可视化方式,配置读取该组件参数,参数详情如下表所示:
- 可视化方式
页签 | 参数 | 参数名称 | 是否必选 | 参数描述 | 默认值 |
---|---|---|---|---|---|
数据源 | 表名 | inputTable | 是 | 数据表 | 无 |
默认参数 | 选择特征列 | selectedColNames | 是 | 输入表中选择特征列名类型。 | 无 |
模型参数 | 半径 | eps | 是 | 用于设置密度聚类中的ε领域,即半径。 | 0.5 |
模型参数 | 最少的样本量 | min_samples | 是 | 用于设置ε领域内最少的样本量。 | 5 |
调优参数 | 最近邻搜寻方法 | algorithm | 是 | 包括auto、ball_tree、kd_tree、brute。在计算点之间距离的过程中,用于指定搜寻最近邻样本点的算法。默认为auto,表示密度聚类会自动选择一个合适的搜寻方法。如果为ball_tree,则表示使用球树搜寻最近邻。如果为kd_tree,则表示使用K-D树搜寻最近邻。如果为brute,则表示使用暴力法搜寻最近邻。 | auto |