课程背景:
我们正生活在一个信息爆炸的时代。全球主干通信网每天传输数万兆兆字节数据。医疗保健业由医疗记录、病人监护和医学图像产生大量数据。搜索引擎支持的数十亿次Web搜索每天处理数万兆兆字节数据。社团和社会化媒体已经成为日趋重要的数据源,产生数字图像、视频、网络博客、网络社区和形形色色的社会网络。产生海量数据的数据源不胜枚举。
数据的爆炸式增长、广泛可用和巨大数量使得我们的时代成为真正的数据时代。急需功能强大和通用的工具,以便从这些海量数据中发现有价值的信息,把这些数据转化成有组织的知识。这种需求导致了数据挖掘的诞生。这个领域是年青的、动态变化的、生机勃勃的。数据挖掘已经并且将继续在我们从数据时代大步跨入信息时代的历程中做出贡献。
在本课程中,您将学习如何使用Tableau数据可视化工具进行数据挖掘及可视化工作。Tableau是Tableau软件公司创建的一个数据可视化程序。它能够查询各种数据集,包括关系型数据库、电子表格和基于云的资源,以生成图形、交互式可视化和其他可视化分析工具。本课程将基于Tableau对新冠疫情数据进行挖掘及可视化展示,以此锻炼学员的数据分析意识。
课程大纲
一: 为什么我们需要数据挖掘?
1、 什么是数据挖掘?——海量数据中寻找有价值的信息
2、 数据挖掘如何改变我们的生活?——推荐系统及精准营销
3、 数据挖掘对企业的意义——用户是业务的中心,用户数据是关键资产
二:Tableau功能介绍
1、 工具准备
a) Tableau使用概述
b) 安装Tableau
2、 连接及准备数据
a) 数据文件连接
b) 数据库连接
三:创建第一个仪表盘
1、 排序
2、 分层与分组
a) 分层
b) 分组
3、 参数设置
4、 语法操作
a) 主要功能函数简介
b) 快速表计算简介
5、 可视化
a) 地图
b) 条形图
c) 折线图
d) 饼图
e) 嵌套条形图
f) 热图
g) 散点图
h) 甘特图
i) 直方图
j) 词云
6、 设计动态仪表盘
a) 新建一个仪表盘
b) 使用仪表盘的注意事项
三:Tableau实战演练
1、 应用Tableau构建新冠疫情数据仪表盘
2、 应用Tableau分析特朗普的推特数据