Skip to main content
Version: 2.17.1

DBSCAN

DBSCAN是一种基于数据密度的无监督聚类算法。在聚类空间的特定区域内,使用指定的半径阈值和数量阈值,筛选核心点及其领域点。通过密度可达及密度相连理论,实现数据点聚类。

仅支持通过可视化方式,配置读取该组件参数,参数详情如下表所示:

  • 可视化方式
页签参数参数名称是否必选参数描述默认值
数据源表名inputTable数据表
默认参数选择特征列selectedColNames输入表中选择特征列名类型。
模型参数半径eps用于设置密度聚类中的ε领域,即半径。0.5
模型参数最少的样本量min_samples用于设置ε领域内最少的样本量。5
调优参数最近邻搜寻方法algorithm包括auto、ball_tree、kd_tree、brute。在计算点之间距离的过程中,用于指定搜寻最近邻样本点的算法。默认为auto,表示密度聚类会自动选择一个合适的搜寻方法。如果为ball_tree,则表示使用球树搜寻最近邻。如果为kd_tree,则表示使用K-D树搜寻最近邻。如果为brute,则表示使用暴力法搜寻最近邻。auto