课程大纲
培训介绍:
R语言作为一种数据分析语言,是当今数据科学领域流行的开源编程语言之一,在数据分析与机器学习领域已经成为一款非常重要的工具。精通R语言的数据分析师是企业竞相争抢的高薪人才。
R语言实战课程采用MBA式的案例教学,结合统计理论,建模方法论、R语言编程和老师的丰富实际项目经验,力求让每一个学生都能够把学到的知识运用到实际工作中去。我们精选的案例是目前企业真实场景下应用很广泛的场景,集合了互联网用户分析、精准营销、风险评估、BI设计与实施等领域的数据挖掘实例,对您从事真正的数据分析工作有针对性的指导与帮助。
培训目标:
· 深度学习R语言和数据挖掘的前沿算法
· 理解企业真实业务场景的建模流程
· 熟练使用R语言进行建模和实操
· 成为有多种技能并能融会贯通的复合型数据分析人才
培训大纲:
1、R语言语法详解
· 数据结构概述
· 向量
· 因子
· 矩阵
· 数据框
· 列表和函数
· 向量化计算和apply
2、数据组织和整理
· 数据整理概述
· 数据导入导出和缺失值处理1
· 缺失值处理2(发现缺失值)
· 缺失值处理3(处理缺失值)
· 数据转换(1)
· 数据转换(2)
· 数据规约和随机
3、建立数据分析的统计思维和可视化探索
· 数据分布
· 集中趋势
· 离散趋势和相关
· R中的描述统计
· 分组统计
· 单变量可视化
· 双变量可视化
· 分组统计可视化
3、用回归预测未来
· 线性回归的思想
· 回归结果的检查
· 决定系数 预测 和多元线性回归
· 一元线性回归演示
· 多项式回归演示
· 残差分析演示
· 多元线性回归演示
4、聚类方法
· 概述和距离
· 数据变换
· 层次聚类法
· kmeans聚类1
· kmeans聚类2
5、数据降维——主成分分析和因子分析
· 概述
· 相关性会导致无法求解或者不稳定
· 逐步回归
· 主成分分析
· 主成分分析例子1
· 主成分分析例子2
· 因子分析
· 因子分析例子
6、关联规则
· 关联规则介绍
· 关联规则演示
7、决策树
· 决策树介绍
· 几种分类算法介绍
· 评价模型准确性
· C4.5 和混淆矩阵 ROC图
· CART演示