1. 课程介绍
机器学习是能通过经验自动改进的计算机算法的研究,它是一个多学科交叉的领域,会涉及到计算机、信息学、数学、统计学、神经科学等。机器学习是大数据的核心技术,本质都是从历史数据中学习一般性的规则。在数据的基础上,通过算法构建出模型并对模型进行评估。
2. 课程目标
通过本次培训,学员可以全面了解监督学习、无监督学习、强化学习的区别与联系以及主要应用场景,详细了解神经网络算法的基本原理;初步掌握使用Scikit-learn、OpenCV、gensim等进行典型数据分析、图像文字相关的基础应用开发。
3. 适用对象
在机器学习算法方面零基础学习Python开发的学员,想全面系统学习Python语言的学员零基础的学员,想全面系统学习机器学习的学员
4. 零基础学习Python开发的学员,想全面系统学习Python语言的学员课程时长(天)
6小时/天,2天,共12小时
5. 培训方式/工具及方法
l PPT 教材 参考资料,理论讲解
l 场景 案例 模拟环境,动手实践
l 手把手解决问题 解决问题经验分享
6. 课程大纲
日程安排
课程模块
课程内容
第一天
机器学习原理介绍
1. 机器学习基本概念
2. 机器学习的应用
3. 训练集、验证集、测试集
4. 过拟合与欠拟合
5. 逻辑斯蒂回归
6. K近邻算法
7. 朴素贝叶斯
8. 决策树模型
9. 支持向量机
10. 神经网络简介
11. 感知机模型
12. 激活函数
13. 多层神经网络
14. 梯度下降与反向传播
实战案例:基于神经网络的花型分类
第二天
常用开发包的使用
1. Scikit-learn、PIL、OpenCV、gensim的安装
2. Scikit-learn中的决策树接口介绍
3. 用Scikit-learn中的决策树API进行分类
4. Scikit-learn中的支持向量机接口介绍
5. 用Scikit-learn中的支持向量机API进行分类
6. 图像色彩空间理论
7. 图像基本变换
8. OpenCV、PIL常见API的使用方法
9. 视频与图片的转换
10. 自然语言处理简介
11. gensim常见API的使用方法
12. 使用gensim中文分词
实战案例:基于k-means的图像量化压缩