构建模型

决策树

from sklearn.tree import DecisionTreeRegressor

model = DecisionTreeRegressor(random_state=1, max_depth=100000)

随机森林

from sklearn.ensemble import RandomForestRegressor

训练模型

model.fit(a_x, a_y)

预测数据

predictions = model.predict(b_x)

数据拆分和计算模型准确度

导入平均绝对误差(Mean Absolute Error,MAE)库

from sklearn.metrics import mean_absolute_error

导入数据拆分库

from sklearn.model_selection import train_test_split

拆分数据

a_x, b_x, a_y, b_y = train_test_split(x, Y, random_state=1)

拆分后的数据a_x, b_x, a_y, b_y 是原数据x,Y的子集,一部分用来训练,一部分用来验证

计算平均绝对误差

detla = mean_absolute_error(b_y, predictions)

predictions是预测出来的数据,b_y是实际的数据,函数返回差值