Python数据分析课程培训方案

一、项目介绍

项目名称:Python数据分析及数据挖掘应用

项目周期:共七天

项目收获:

1.掌握Pandas的用法,能够应用Pandas进行数据清洗、数据整理、数据可视化

2.掌握Matplotlib、Seaborn、Pyecharts等数据可视化技术,能够做出表达准确的图表

3.掌握数据挖掘的经典算法,能够根据业务需求选择相应的算法进行应用分析

项目概述:

如果说IT时代的到来是浪潮迭起,新事物涌现的过程,那么DT时代的到来则是润物无声,却深刻改变了万物运行规则的过程。DT时代的核心是数据,核心竞争力是数据分析与挖掘。对于数据分析师来说,从实际业务问题出发到发现数据中的商业价值便是终极的目标,只有搭建完整的数据分析与挖掘的知识体系,才是Python程序员职业发展的长期道路。

我们的课程以多个实用案例为驱动,以培养“懂业务,会工具,精算法的全能型数据分析人才”为目标,覆盖数据分析领域的全套技术栈,包括数据清洗、数据分析、数据挖掘、机器学习等领域所需要的全部技术的前沿技术。

项目成果:

AppStore数据分析

RFM客户分群

用户流失预测

课程亮点:

1.完善的课程体系,丰富的课程内容,全面的分析工具或算法

2.理论&多案例的结合,让老师懂业务、精技术、知识体系高度整合,轻松上手数据分析。

3.快速根据业务场景和需求进行数据可视化过程,做出表达精准的图表

4.课程会探讨如何利用数据分析与挖掘相关技术解决实际问题, 帮助广大老师申报教学成果。

二、课程适合人群

1. 计算机、数据科学与大数据技术等相关专业老师

2. 正在从事或未来想从事数据科学相关方向的老师

3. 在工作中会用到数据分析相关技能的老师

三、预习资料

获取方式:请扫描下方二维码,回复【Python数据分析】即可获取完整预习资料

四、准备环境介绍

硬件:笔记本或者台式机。

操作系统:Windows7 及 Windows7 以上系统

处理器:i5 双核以上

内存:8GB 以上

软件:

1.Anonconda工具(首选)

2.PyCharm工具(其次)

五、项目进度安排

7月25日

数据分析理论

1.数据分析与数据挖掘的定义
2.数据分析与数据挖掘的层次
3.数据分析与数据挖掘三要素
4.探索性数据分析
5.预测和分类
6.分群和降维

7月26日

数据分析技术栈(一)

1.NumPy
①ndarray介绍
②ndarray的基本属性
③ndarray的基本操作
2. Pandas数据结构
①创建DataFrame和Series
②DataFrame的常用操作
3. Pandas数据清洗
①concat连接
②merge连接
③join连接
④缺失值数量统计
⑤删除缺失值
⑥填充缺失值

7月27日

数据分析技术栈(二)

1. Pandas数据可视化
①绘制柱状图
②绘制折线图
③绘制直方图
④绘制饼图
2. Matplotlib
①matplotlib绘图简介
②matplotlib绘制基本图表
3. Seaborn
①Seaborn绘图简介
②Seaborn单变量可视化
③Seaborn双变量可视化
④Seaborn多变量可视化
4.Pyecharts

7月28日

实践案例

1.AppStore案例
2.优衣库销售数据分析
3.RFM客户分群

7月29日

数据挖掘算法(一)

1.K近邻算法
K近邻算法基本原理
K近邻算法进行分类预测
sklearn实现knn
训练集测试集划分
分类算法的评估
归一化和标准化
超参数搜索
2.线性回归
线性回归简介
线性回归API使用初步
线性回归的损失函数和优化方法
梯度下降推导
波士顿房价预测案例
欠拟合和过拟合
模型的保存和加载
线性回归应用-回归分析

7月30日

数据挖掘算法(二)

1.逻辑回归
逻辑回归简介
逻辑回归API应用案例
分类算法评价方法
逻辑回归应用_分类分析
2.聚类算法
聚类算法的概念
聚类算法API的使用
聚类算法实现原理
聚类算法的评估
聚类算法案例
3.决策树
决策树算法简介
决策树分类原理
决策树算法API
决策树案例

7月31日

实践案例

1.用户画像
2.电商运营数据建模分析