课程介绍

国际上R语言已然是专业数据分析领域的标准。在最近一次数据挖掘领域语言流行度的调查中,R语言位居数据挖掘领域所有语言之首。2014 Dice Tech Salary Survey统计显示美国平均收入最高的IT技能是R语言,2013年的掌握R技能的人均收入为115K。O'Reilly Data Scientist Survey同样显示R技术者年收入在110K-125K。 谢老师从实践出发,结合大量的数据分析案例与教学经验,深入浅出地介绍R语言在数据分析过程中的有关任务:数据探索、数据预处理、数据描述性统计分析、数据可视化、数据建模及模型评估等。

学习目标

通过两个月的系统学习,掌握R语言是基本使用能力,熟悉常用数据分析方法和画图能力。具备将R语言运用到实际生产环境数据的使用能力。 新手完全能够通过学习本课程,变身为数据分析师,而有数据分析经验的R老手也能通过本课程发现很多实用的新东西。

学习完本课程,学习者能达到以下目标:

  • (1) 了解R语言,掌握安装R、RStudio及Rattle的方法及能力
  • (2) 掌握R语言的基本知识
  • (3) 熟悉R语言的常用数据结构、数据的导入导出
  • (4) 掌握数据分析的描述性统计分析方法
  • (5) 掌握数据可视化的绘图能力
  • (6) 了解利用R语言做交互数据可视化
  • (7) 掌握常用的数据挖掘模型:聚类分析、关联规则、决策树、KNN近邻算法等
  • (8) 掌握模型评估的一般方法:混淆矩阵、NMSE、ROC曲线等

课程目录

详细的课程目录,让你快速了解课程体系
课时 课时简介 课时描述
第一课时(R之初体验) R&Rstudio&Rattle安装、R基本知识、R数导入、R数据对象
  • 1.数据分析及R语言介绍
  • 2.数据导入
  • 3.数据对象
第二课时(R之数据处理) 基本数据管理、循环语句、数据抽样
  • 1. 数据基本管理
  • 2.循环语句
  • 3.数据抽样
第三课时(数据基本分析) 统计指标详解、描述性统计分析、分组统计、频数统计
  • 1.统计指标之位置度量
  • 2.统计指标之离散程度分析
  • 3.描述性统计分析
  • 4. 分组计算描述统计量
  • 5. 频数统计
第四课时(数据质量分析) 数据质量分析理论、缺失值处理、异常值处理
  • 1. 数据质量分析理论
  • 2. 缺失值高级处理方法
  • 3.异常值识别及处理
第五课时(数据可视化) 数据相关性分析、数据绘图基础
  • 1.数据相关性分析
  • 2. R语言绘图基础
  • 3. 低级绘图函数
  • 4. 高级绘图函数
第六课时(高级绘图工具) lattice系统、ggplot2系统、交互式绘图
  • 1.lattice
  • 2.ggplot2系统
  • 3.交互式绘图
第七课时(模型篇) 聚类分析、关联规则、决策树
  • 1.聚类分析
  • 2.关联规则
  • 3.决策树
第八课时(KNN算法&Rattle篇) KNN算法、模型评估、Rattle模块详解
  • 1.KNN近邻算法
  • 2.模型评估
  • 3.R语言数据挖掘可视化工具:Rattle

定制属于你的需求

如果上述培训内容不能满足您的培训需求,我们可为您提供订制化企业培训服务,请提交您的培训需求

我们将在一个工作日内给予回复,或直接扫描工作人员二维码,直接微信咨询。



部分培训客户

改版

反馈