Skip to main content
Version: 2.17.1

随机森林

随机森林是一个包括多决策树的分类器,其分类结果由单棵树输出类别的众数决定。

仅支持通过可视化方式,配置读取该组件参数,参数详情如下表所示:

  • 可视化方式
页签参数参数名称是否必选参数描述默认值
数据源表名inputTable数据表
默认参数选择特征标签列labelColName输入表中选择标签列名类型。
模型参数决策树数量n_estimators森林中决策树的数量。100
模型参数分裂节点所用的标准criterion分裂节点所用的标准包括gini, entropy。gini
模型参数树最大深度max_depth树的最大深度。如果为None,则将节点展开,直到所有叶子都是纯净的(只有一个类),或者直到所有叶子都包含少于min_samples_split个样本。None
模型参数特征数量max_features寻找最佳分割时要考虑的特征数量。包含sqrt,auto,log2,None。None
模型参数分类权重class_weight支持用字典的形式传入自定义。默认balanced。balanced