分箱
特征离散是将连续的数据进行分段,使其变为多个离散化区间。针对该场景,推出了自定义分箱组件。
仅支持通过可视化方式,配置读取该组件参数,参数详情如下表所示:
- 可视化方式
页签 | 参数 | 参数名称 | 是否必选 | 参数描述 | 默认值 |
---|---|---|---|---|---|
数据源 | 表名 | inputTable | 是 | 数据表 | 无 |
参数 | 选择特征列 | selectedColName | 是 | 选择需要进行离散化处理的特征列 | 无 |
参数 | 分箱标签 | selectedBinsName | 是 | 离散化的数据标签 | 无 |
参数 | 自定义离散区间 | selectedBinsList | 是 | 自定义离散区间 | 无 |