建模前需先导入一些要用的库包
pandas 、numpy、matplotlib数据处理三剑客,常见的包就不说了,seaborn这个库我的理解就是对matplotlib库的扩充吧,反正也是画图的。重点就是Ipython,这是基于pthon的交互式解释器。有了他可以轻松的实现和计算机的交互交流,使用非常方便。他有常见的50个使用技巧,可参考https://www.zhihu.com/question/51467397/answer/1098115714网站。以下几个简单示例。
接下去就是设置图片的一些标签参数等。
读取数据集
展示sklearn模型算法的路径图,为接下去进行的任务提供指导。
接下来对数据进行分割处理
选取模型
查看训练集合测试机的score值并做参数调整
查看调整后的训练集和测试集的score值
现在改用随机森林模型
建立完模型后进行标签预测
接下来进行评估。
初始动作与上述建模大致一致,导入库,导入数据,进行数据切割
建立回归模型
接下去进行交叉验证
导入混淆矩阵模块进行评估预测
接下来绘制ROC曲线
结束。