R语言数据分析与数据挖掘实战应用

培训费用:¥ 4800

培训周期:16 课时

在线咨询

课程大纲


培训介绍:

    R语言作为一种数据分析语言,是当今数据科学领域流行的开源编程语言之一,在数据分析与机器学习领域已经成为一款非常重要的工具。精通R语言的数据分析师是企业竞相争抢的高薪人才。

    R语言实战课程采用MBA式的案例教学,结合统计理论,建模方法论、R语言编程和老师的丰富实际项目经验,力求让每一个学生都能够把学到的知识运用到实际工作中去。我们精选的案例是目前企业真实场景下应用很广泛的场景,集合了互联网用户分析、精准营销、风险评估、BI设计与实施等领域的数据挖掘实例,对您从事真正的数据分析工作有针对性的指导与帮助。


培训目标:

  · 深度学习R语言和数据挖掘的前沿算法

  · 理解企业真实业务场景的建模流程

  · 熟练使用R语言进行建模和实操

  · 成为有多种技能并能融会贯通的复合型数据分析人才


培训大纲:

1、R语言语法详解

  · 数据结构概述

  · 向量

  · 因子

  · 矩阵

  · 数据框

  · 列表和函数

  · 向量化计算和apply


2、数据组织和整理

  · 数据整理概述

  · 数据导入导出和缺失值处理1

  · 缺失值处理2(发现缺失值)

  · 缺失值处理3(处理缺失值)

  · 数据转换(1)

  · 数据转换(2)

  · 数据规约和随机


3、建立数据分析的统计思维和可视化探索

  · 数据分布

  · 集中趋势

  · 离散趋势和相关

  · R中的描述统计

  · 分组统计

  · 单变量可视化

  · 双变量可视化

  · 分组统计可视化


3、用回归预测未来

  · 线性回归的思想

  · 回归结果的检查

  · 决定系数 预测 和多元线性回归

  · 一元线性回归演示

  · 多项式回归演示

  · 残差分析演示

  · 多元线性回归演示

 

4、聚类方法

  · 概述和距离

  · 数据变换

  · 层次聚类法

  · kmeans聚类1

  · kmeans聚类2


5、数据降维——主成分分析和因子分析

  · 概述

  · 相关性会导致无法求解或者不稳定

  · 逐步回归

  · 主成分分析

  · 主成分分析例子1

  · 主成分分析例子2

  · 因子分析

  · 因子分析例子


6、关联规则

  · 关联规则介绍

  · 关联规则演示

 

7、决策树

  · 决策树介绍

  · 几种分类算法介绍

  · 评价模型准确性

  · C4.5 和混淆矩阵 ROC图

  · CART演示