当前位置: 首页 > 职业素养 > 办公技能 > prthon数据挖掘建模全流程
课程大纲
一、 数据分析和挖掘概述
1. 什么是数据分析
2. 什么是数据挖掘
3. 数据分析的常用工具
4. 数据挖掘的常用工具
5. 数据挖掘全流程简介
二、 数据预处理
在错误的数据上分析,只能得到错误的结果。
1. 数据清洗
2. 归一化处理
3. 虚拟化变量
4. 不平衡样本处理
三、 特征选择
当收集的数据有大量特征的时候,哪些特征才是有效特征,哪些特征更重要?
1. 过滤法:单变量特征选择
2. 包装法:递归特征消除
3. 维度压缩:主成分分析
四、 常用算法讲解
学习挖掘项目中常用的算法。
1. 卡方检验
2. 回归分析
3. K-Means聚类
4. CART
5. SVM
6. 神经网络
7. 协同推荐
五、 模型优化
模型输出结果不佳的时候,如何对模型进行优化?
1. 参数优化,寻找**参数
2. 使用集成算法提升模型的准确度和稳定性
a) Bagging
b) Boosting
c) Stacking
3. 集成算法实现
a) 随机森林
b) Xgboost
c) 自定义Stacking
六、 报告
模型的结果如何评估,以及如何呈现
1. 模型评估
2. 报告格式
3. 可视化呈现
""