Python数据分析实战

培训费用:¥ 6000

培训周期:40 课时

在线咨询

课程大纲


--掌握数据分析,开启智慧决策!


课程特色:

使用Python进行数据分析是十分便利且高效的,因此python被认为是最优秀的数据分析工具之一,本课程从理论和实战两个角度对Python数据分析工具进行了介绍,并采用理论分析和Python实践相结合的形式,按照数据分析的基本步骤对数据分析的理论知识以及相应的Python库进行了详细的介绍,让同学在了解数据分析的基本理论知识的同时能够快速上手实现数据分析程序。

课程内容围绕numpy、pandas处理与计算数据展开。通过丰富的案例实战,综合所学习的知识,让同学们更深入了解数据分析和挖掘过程;本课程后半部分涵盖数据可视化、Streamlit数据大屏搭建及数据分析项目实战三大模块。学员将学习使用matplotlib和seaborn进行数据可视化,掌握绘制各种图形的方法。同时,课程还将介绍如何使用Streamlit搭建数据可视化大屏,实现数据的实时展示与交互。最后,通过综合实战,学员将深入了解数据分析流程,并运用RFM模型进行客户细分等实际项目分析。 

 

学员对象

此培训课程适合对数据分析有兴趣的初学者,以及希望提升数据处理、分析和可视化技能的专业人士。课程内容涵盖Numpy、Pandas等基础库的使用,数据清洗、重塑和聚合统计还包括词云制作、关联分析和实战案例分析,适合零售、金融等行业的数据分析从业者参加。 

学员需要具备python编程能力,熟悉python核心语法。具备统计学理论基础,熟练掌握EXCEL应用。


课程安排:5天课程(40课时)


授课形式:  

小班精讲(面授/直播)、案例分析、操作演示、练习实践、课堂即时互动交流答疑;

课后服务(1年内):课程答疑,课件资料升级分享,录播回看,免费重修

 

课程大纲

单元1   数据分析概念和Numpy

数据分析概述

Anaconda环境搭建和使用

jupyter notebook 使用

Python的不足之处

numpy概述和常用类型介绍

numpy Ndarray数组创建

random随机函数使用

数组访问

排序

赋值和矢量运算

文件操作

统计函数

字符串函数

一元函数和二元函数

矩阵运算函数

  

单元2   pandas 基础 

pandas数据结构-Series

pandas数据结构-Dataframe

读写Excel文件

读写Csv文件

访问Dataframe

使用索引和切片

使用花式索引和布尔索引

DataFrame赋值和计算

数据排序


单元3   pandas 数据重塑和清洗 

列的操作(添加,删除和修改)

行的操作(添加,删除和修改)

使用concat合并dataframe

使用merge连接dataframe

重置索引和修改列名

apply、map和applymap使用

缺失值查找

删除和更新缺失值

异常值查找和处理

重复值查找和处理

分类数据离散化

连续型数据离散化

 

单元4   pandas 数据分析

描述性统计

使用groupby 聚合统计

使用value_counts计算频次

数据透视表和数据交叉表

环比和同比

相关性分析

数据排列名次

时间序列和时间索引

时间索引重采样-升/降采样

时间索引重采样-升/降采样

  

单元5   词云和关联分析

jieba分词

jieba词频和分词字典

词云可视化文本

关联分析概念

Apriori和FP-growth算法

mlxtend包实现关联分析

案例实战:餐厅推荐


单元6   数据可视化

数据可视化意义

数据可视化matplotlib概述

matplotlib常规配置

Latex常用格式

绘制基本图形(折线图、条形图、饼图、散点图)

绘制基本图形(箱型图、雷达图、面积图)

matplotlib绘图对象

matplotlib子图绘制

seaborn整体风格设置

seaborn基本图形绘制

seaborn高级图形绘制

数据可视化实战


单元7  Streamlit搭建数据大屏

Streamlit简介

Streamlit文本显示

Streamlit数据显示支持

Streamlit 数据可视化支持

Streamlit图表可视化支持

Streamlit用户交互支持

Streamlit多媒体支持

Streamlit页面布局和容器

流程控制系统

会员管理

Streamlit实战:搭建数据可视化大屏

 

单元8   数据分析项目综合实战

数据分析流程

客户细分-RFM模型

客户细分-RFM模型实战

零售行业分析

拍拍贷互联网金融分析