课程大纲
--掌握数据分析,开启智慧决策!
课程特色:
使用Python进行数据分析是十分便利且高效的,因此python被认为是最优秀的数据分析工具之一,本课程从理论和实战两个角度对Python数据分析工具进行了介绍,并采用理论分析和Python实践相结合的形式,按照数据分析的基本步骤对数据分析的理论知识以及相应的Python库进行了详细的介绍,让同学在了解数据分析的基本理论知识的同时能够快速上手实现数据分析程序。
课程内容围绕numpy、pandas处理与计算数据展开。通过丰富的案例实战,综合所学习的知识,让同学们更深入了解数据分析和挖掘过程;本课程后半部分涵盖数据可视化、Streamlit数据大屏搭建及数据分析项目实战三大模块。学员将学习使用matplotlib和seaborn进行数据可视化,掌握绘制各种图形的方法。同时,课程还将介绍如何使用Streamlit搭建数据可视化大屏,实现数据的实时展示与交互。最后,通过综合实战,学员将深入了解数据分析流程,并运用RFM模型进行客户细分等实际项目分析。
学员对象
此培训课程适合对数据分析有兴趣的初学者,以及希望提升数据处理、分析和可视化技能的专业人士。课程内容涵盖Numpy、Pandas等基础库的使用,数据清洗、重塑和聚合统计还包括词云制作、关联分析和实战案例分析,适合零售、金融等行业的数据分析从业者参加。
学员需要具备python编程能力,熟悉python核心语法。具备统计学理论基础,熟练掌握EXCEL应用。
课程安排:5天课程(40课时)
授课形式:
小班精讲(面授/直播)、案例分析、操作演示、练习实践、课堂即时互动交流答疑;
课后服务(1年内):课程答疑,课件资料升级分享,录播回看,免费重修
课程大纲
单元1 数据分析概念和Numpy
数据分析概述
Anaconda环境搭建和使用
jupyter notebook 使用
Python的不足之处
numpy概述和常用类型介绍
numpy Ndarray数组创建
random随机函数使用
数组访问
排序
赋值和矢量运算
文件操作
统计函数
字符串函数
一元函数和二元函数
矩阵运算函数
单元2 pandas 基础
pandas数据结构-Series
pandas数据结构-Dataframe
读写Excel文件
读写Csv文件
访问Dataframe
使用索引和切片
使用花式索引和布尔索引
DataFrame赋值和计算
数据排序
单元3 pandas 数据重塑和清洗
列的操作(添加,删除和修改)
行的操作(添加,删除和修改)
使用concat合并dataframe
使用merge连接dataframe
重置索引和修改列名
apply、map和applymap使用
缺失值查找
删除和更新缺失值
异常值查找和处理
重复值查找和处理
分类数据离散化
连续型数据离散化
单元4 pandas 数据分析
描述性统计
使用groupby 聚合统计
使用value_counts计算频次
数据透视表和数据交叉表
环比和同比
相关性分析
数据排列名次
时间序列和时间索引
时间索引重采样-升/降采样
时间索引重采样-升/降采样
单元5 词云和关联分析
jieba分词
jieba词频和分词字典
词云可视化文本
关联分析概念
Apriori和FP-growth算法
mlxtend包实现关联分析
案例实战:餐厅推荐
单元6 数据可视化
数据可视化意义
数据可视化matplotlib概述
matplotlib常规配置
Latex常用格式
绘制基本图形(折线图、条形图、饼图、散点图)
绘制基本图形(箱型图、雷达图、面积图)
matplotlib绘图对象
matplotlib子图绘制
seaborn整体风格设置
seaborn基本图形绘制
seaborn高级图形绘制
数据可视化实战
单元7 Streamlit搭建数据大屏
Streamlit简介
Streamlit文本显示
Streamlit数据显示支持
Streamlit 数据可视化支持
Streamlit图表可视化支持
Streamlit用户交互支持
Streamlit多媒体支持
Streamlit页面布局和容器
流程控制系统
会员管理
Streamlit实战:搭建数据可视化大屏
单元8 数据分析项目综合实战
数据分析流程
客户细分-RFM模型
客户细分-RFM模型实战
零售行业分析
拍拍贷互联网金融分析