快速开始-本地建模与跟踪记录
以 逻辑回归算法 为例,进行模型训练。
数据集
入参x 出参y
1 -2 0
2 -1 0
3 0 1
4 1 1
5 2 1
6 1 0
本地模型建模
def train_model(c_param, training_data):
data = pd.read_csv(training_data)
raw_data = np.array(data)
x_data = raw_data[:, 0].reshape(-1, 1)
y_data = raw_data[:, 1]
lr = LogisticRegression(C=c_param)
lr.fit(x_data, y_data)
score = lr.score(x_data, y_data)
mlflow.sklearn.log_model(lr, "model")
if __name__ == '__main__':
c_param = 0.95
training_data = './data.csv'
train_model(c_param, training_data)
使用sdk跟踪实验过程数据
模型运行过程中,可以通过使用 waveletai-SDK 等将数据记录到运行中。自定义相关指标,并使用指标进行绩效跟踪。
示例:
import waveletai
waveletai.log_param("C", round(c_param, 2))
waveletai.log_metric("score", round(score, 2))
在小波AI平台上运行时,在平台记录可视化指标。
生成标准格式的训练模型
详情请了解训练标注格式代码参考。
示例:
import numpy as np
import pandas as pd
from sklearn.linear_model import LogisticRegression
import mlflow.sklearn
import click
import waveletai
def make(c_param, training_data):
data = pd.read_csv(training_data)
raw_data = np.array(data)
x_data = raw_data[:, 0].reshape(-1, 1)
y_data = raw_data[:, 1]
lr = LogisticRegression(C=c_param)
lr.fit(x_data, y_data)
score = lr.score(x_data, y_data)
# 记录参数
waveletai.log_param("C", round(c_param, 2))
# 记录指标
waveletai.log_metric("score", round(score, 2))
# 保存模型
mlflow.sklearn.log_model(lr, "model")
@click.command()
@click.option("--c_param", "-cp", type=float, default=0.95, help="正则化系数")
@click.option("--training_data", "-td", type=str, default="", help="默认数据集")
def train(c_param, training_data):
return make(c_param, training_data)
恭喜你!当前你已经可以在平台上训练你的模型了。
下一步,让我们一起了解如何在线进行模型训练并将已训练完成的模型注册模型库
。