当前位置: 首页 > 公开课 > 商业模式 > 商业数据分析与算法应用
商业数据分析与算法应用
培训对象: 数据分析师
课程目标: 帮助非数据算法专业的团队leader快速理解数据算法的应用场景与脉络。 为计划转行数据算法的同学提供实际项目建模经验和解析。 了解常用的数据分析模型和经典算法原理与应用落地的流程。 学习如何构造营销用户、流失用户、高价值用户的筛选模型。 学习如何利用规则和模型构建 反作弊、异常值监控系统。 了解如何构建需求预估模型。针对周、天、小时等粒度的未来需求进行预测。 了解如何利用运筹优化算法支持相关项目落地。优化项目的建模思想与实际案例
费用说明: (含培训费、资料费、午餐、税费等)
咨 / 询 / 热 / 线 18898361497
在线咨询课程大纲:
**部分、数据分析探索与应用流程
商业数据分析
数据挖掘Road Maps
R、python简单介绍
数据探索
数据预处理
构建新的变量
异常值处理
数据可视化
数据分析应用流程
第二部分、经典预测和分类方法
回归分析
相关性
线性回归与拟合
**小二乘法的几何解释
线性回归中的变量选择
回归算法的评估与选择
KNN 分类器
确定相邻的样本数据
分类规则
参数K的选择
算法优缺点
案例分析:如何选择相似用户?
逻辑回归
逻辑回归模型
分类算法的评估
案例分析:用户借贷能力判定
决策树
迭代分割
纯度的计算
决策树的使用效果
如何避免过拟合
剪枝与终止条件
案例分析:如何利用决策树的提取出业务规则?
(补充)树模型应用——随机森林
案例分析:如何帮助业务方筛选出重要的业务变量?
第三部分、经典聚类算法
聚类问题介绍
两条数据之间的距离
欧式距离
数值型数据处理与距离函数
类别型数据的距离计算
混合类型数据的距离计算
两个类别之间的距离
**大距离、**小聚类、中心距离
K-means
如何选择参数K
层次聚类
案例分析:如何选择相似用户?
第四部分、异常检测与反欺诈
异常值检测
异常团体识别
案例分析:无监督反欺诈方案应用
业务思考:如何构建一个反欺诈系统?
第五部分、时间序列预测
时间序列回归模型
预测变量筛选
回归预测
非线性回归
相关、因果和预测
时间序列分解
时间序列成分
移动平均
经典时间序列分解
STL分解法
趋势性、季节性判定
业务思考:如何对时间序列进行聚类?
分解法预测
时间序列类异常值检测
业务思考:如何评估促销活动效果?
ARIMA模型
平稳性和差分
延迟算子
自回归与移动平均
非季节性arima
参数估计与选择
季节性arima
高级预测方法
复杂的季节性
向量自回归
神经网络
实际预测问题
周数据、天粒度数据以及小时数据预测
预测组合
长序列与短序列预测
训练集与测试集
缺失值与异常值
案例分享:共享单车Daily天粒度需求预测
第六部分、决策优化
开源决策优化工具介绍 google or-tools
运筹优化方法介绍
优化算法应用流程
案例分享(可选)
电商促销优惠券发放优化:给定用户补贴的预算,如何选择合适的补贴用户。
工厂布局优化:考虑如何减少物料搬运成本(运量和距离)。
仓库选址问题:如何选择服务点,满足服务能力和降低运输成本。
物流配送、车辆路径调度:配送问题综合建模与分析。