【课程背景】
近些年,由于以社交网站、基于位置的服务LBS 等为代表的新型信息产生方式的涌现,以及云计算、移动和物联网技术的迅猛发展,无处不在的移动、无线传感器等设备无时不刻都在产生数据,数以亿计用户的互联网服务时时刻刻都在产生着数据交互,大数据时代已经到来。在大数据时代,互联网络、社交平台等的覆盖范围正在不断的扩大,大量的增加了各种各样的数据信息,尽管其中包含的有价值的信息比较多,但要想将此类信息价值充分发挥出来,需在海量数据信息中心挖掘出有用的数据,如何分析、管理、利用大数据,在大量的数据中找到有意义的模式和规则,这些工作仍将面临很大的挑战。
【课程收益】
了解数字化转型的内涵,数字化转型的发展阶段和带来的业务转型创新,掌握公司数字化转型的主要流程;了解大数据挖掘的主要方法。
【课程特色】
内容全面、重点清晰
【课程对象】
国央企、大型上市公司财务部门、财务共享中心、互联网金融等部门中高级管理人员;
金融科技行业从业人员;
高新科技行业从业人员;
【课程时间】
1天
【课程大纲】
一、数字化转型的发展
1. 数字化转型的内涵,数字化转型的发展阶段和带来的业务转型创新。
2. 数字化转型的流程
二、人工智能与大数据
1. 什么是大数据、大数据原理,数据分析和数据管理
2. 人工智能的概念、人工智能技术(自然语言处理、统计机器学习、知识图谱技术、数据可视化技术、数据虚拟化技术)
3. 介绍数据挖掘主要步骤,包括:数据获取、数据整理、假设与建模、模型训练与调整、评估与解释、操作或实施、优化。
4. 大数据与统计学的区别
三、数据描述性统计与数据可视化
1. 数据描述性统计:数据分布特征;介绍几个统计指标:偏度、峰度等
2. 数据描述性统计的意义
3. 数据可视化工具:类别比较型图表、数据关系型图表、数据分布型图表、时间序列型图表、局部整体型图表
四、数据预处理
1. 预处理的步骤:数据获取、数据转换、数据清洗等
2. 数据异常值的判断和处理方式
五、数据集统计检验
1. 假设检验
2. 信度检验
3. 正态检验
4. 其他统计检验方法:T检验、F检验、卡方检验
六、数据相关性与方差分析
1. 相关性分析的概念、适用领域、分析方法
2. 相关性分析工具:散点图、相关系数
3. 方差分析:单因素方差分析、双因素方差分析、协方差分析
七、主成分分析与聚类分析
1. 主成分分析概念及原理、优势
2. 聚类分析基本概念、聚类分析方法(系统聚类法、K-均值法、模糊聚类法、有序样品的聚类)
八、时间序列数据分析
1. 时间序列数据分析法概念、特点、可能存在的问题
2. 主要模型:算数平均法、加权移动平均法、指数平滑法、长期趋势法
3. 时间序列数据模型应用:季节变动预测法、自回归模型、移动平均模型、自回归移动平均模型。
九、回归分析与数据学习
1. 线性回归概念与应用,一元线性回归和多元线性回归、最小二乘法
2. 多项式回归概念与应用
3. 回归决策树
4. 随机森林决策模型
5. 深度学习
人工神经网络