课程介绍

随着科技的发展,极大地提高了数据生成的速度,已经远远超出了传统数据分析工具处理的能力;是否具备使用大规模分布式数据分析平台的能力,成为判定一个数据分析开发者能力高低的一个重要标准。 本课程重点在于讲授大规模数据分析的理念与开发实战,使得学员快速掌握基本的开发技巧。

培训目标

  • (1) 动手Clouders Manager的安装和部署
  • (2) 熟知CDH的安装配置和解决越到的问题
  • (3) 熟悉Hadoop分布式文件系统
  • (4) 懂得hdfs分布式文件系统的使用
  • (5) 了解MapReduce工作原理
  • (6) 熟知Hadoop集群硬件配置规划
  • (7) 懂得Hadoop集群配置及优化
  • (8)学会如何维护和监测Hadoop集群
  • (9)学会怎么使用Sqoop连接关系数据库进行数据导入导出
  • (10)了解Hive数据仓库的开发和应用
  • (11)Hue的web页面的数据库开发
  • (12)精通Hbase列式数据库的开发
  • (13)掌握大数据挖掘分析基础
  • (14)了解数据挖掘常见的几种工具和对比
  • (15)了解几种常用的挖掘算法原理
  • (16)了解大公司对大数据的应用场景和未来方向

课程目录

详细的课程目录,让你快速了解课程体系
课时 课时简介 课时描述
第一天 第一部分:CentOS系统和Cloudera Manager安装配置
  • 1.VMware虚拟机安装和配置
  • 2.CentOS6.5且64位系统安装
  • 3.简单的配置和遇到的问题
  • 4.动手和实操
  • 5.Cloudera Manager的离线安装
第一天 第二部分:Cloudera CDH的安装和配置及环境的测试
  • 1.Cloudera CDH的离线安装的环境准备 和配置,注意事项
  • 2.单机版、伪分布式、真分布式介绍和区别
  • 3.详细介绍了CDH的部署配置,遇到的问题,怎么解决
  • 4.HDFS分布式文件系统的安装配置和测试
  • 5.hdfs的权限配置,目录创建,目录查看等命令的使用
第二天 第三部分:如何构建分布式数据仓库平台
  • 1.怎么样才算是真正意义的大数据平台
  • 2.开源Hadoop生态系统的介绍
  • 3.数据采集过程与分布式存储
  • 4. 数据仓库与数据分析介绍
  • 5. 集群监控与调度组件
  • 6. Hue介绍和例子讲解
  • 7. 日志收集工具
  • 8. 练习
  • 9. 案例讲解
第二天 第四部分:大数据平台部署及案例
  • 1.我们应该选哪种Hadoop
  • 2.集群硬件应该如何选配
  • 3.部署案例讲解
第三天 第五部分:Hbase列数据库及应用案例
  • 1.Hbase感性认识
  • 2.开源Hadoop生态系统的介绍
  • 3.Hbase性能测试
  • 4. Hbase设计原则和优化
  • 5. 练习
  • 6. 项目案例:HBase在小米业务的应用
第三天 第六部分:大数据挖掘介绍
  • 1.大数据挖掘几种方法
  • 2.算法介绍和应用
  • 3.例子和练习
第四天 第七部分:大数据挖掘应用案例详解
  • 1.项目案例详解
  • 2.大数据在电信行业应用
  • 3.大数据在零售行业应用

定制属于你的需求

如果上述培训内容不能满足您的培训需求,我们可为您提供订制化企业培训服务,请提交您的培训需求

我们将在一个工作日内给予回复,或直接扫描工作人员二维码,直接微信咨询。



部分培训客户

改版

反馈