课程名称:
对话大数据系列技术 从破冰到精进
本课程也有部分免费的视频课程《大数据系列免费视频教程》,大家可以前往学习和了解
https://edu.hellobi.com/course/93
【温馨提示:1. 你可以在PC端浏览器或者微信收藏该页面,以方便你快速找到这个课程;2. 课程相关资料&QQ会员群可在课程PC端公告查看下载;3.购买课程后,点(课时)列表即可观看视频;4. 本课程虚拟商品,已经购买,不能退款。建议先试听章节的,有疑问可咨询客服天善九号:tianshansvip 】
大数据系列整个课程课程大纲:
课程特色:
规划全面,涵盖储备技能、Hadoop基础、HBase、Hive、Spark、Kylin等方方面,一览无余,学习路上成竹在胸;
循序渐进,课程设计由易及难,细致剖析,概览全局之下逐步攻克各技术线,积跬步以至千里;
互动共进,沿袭天善学院课程特点,学员与讲师之间、学员之间,高效高频答疑与沟通,独乐乐不如众乐乐;
知行合一,理论与案例、实操结合,学以致用,止于至善;
是诸位一窥大数据体系全貌,由浅入深的不二之选!
讲师介绍:
Mars,毕业于CSU,硕士,热衷于新技术的应用、扩展和新技术的创新。曾供职于供应链公司,负责大数据平台搭建及架构,参与基于Hadoop的数据仓库构建以及客户细分、流失客户预警、潜在客户挖掘等客户类的专项数据挖掘工作。现负责某银行项目大数据架构、客户画像等。 博客专栏:专注于大数据架构技术、数据挖掘/机器学习以及大数据的行业应用。https://ask.hellobi.com/blog/marsj
课程体系(2017年6月计划,会根据大数据业界新发展做出调整,持续更新~)
大数据技术是以数据流为核心的多个技术组成的技术栈,Mars将和大家一起持续学习,持续交流,持续更新~
课程内容:
第一章:Linux命令基础实战
大数据架构体系结构及开源组件介绍
Linux基本操作
第二章:Hadoop基础
Hadoop基础,对Hadoop架构、核心组件HDFS/YARN做了深入浅出的介绍,让你快速把握Hadoop的核心技术和工作原理,逐渐形成分布式思维;
Hadoop介绍
Hadoop运行模式
第三章:Hadoop集群搭建
Hadoop集群搭建——安装Linux虚拟机
Hadoop集群搭建——远程连接
Hadoop集群搭建(on Linux)——Hadoop(上)
Hadoop集群搭建(on Linux)——Hadoop(下)
Hadoop集群搭建(on Mac)——Hadoop
第四章:HDFS原理
番外篇-课程体系
HDFS架构原理
FS Shell命令介绍及实践
第五章:YARN工作原理
YARN的产生背景
YARN的设计思想
YARN的基本架构
YARN的工作流程(小结)
第六章:Sqoop
Sqoop,作为关系型数据库与Hadoop之间的桥梁,批量传输数据,让你自然的从关系型数据库过度到Hadoop平台,在关系型数据库与Hadoop之间游刃有余的进行数据导入导出;
Sqoop & Hive课程内容介绍
Sqoop介绍与安装
Sqoop的基本使用
Sqoop 导入参数详解
Sqoop导入实战
Sqoop增量导入(上)
Sqoop增量导入(下)
Sqoop导出实战(上)
Sqoop导出实战(下)
Sqoop Job
第七章:Hive
Hive,基于Hadoop大数据平台的数据仓库,可以让你实现传统数据仓库中的绝大部分数据处理、统计分析,让你在Hadoop大数据平台上感受到Hive QL带来的便利的交互式查询体验;Mars将以日志分析或其他示例带大家熟练掌握Hive的应用;
Hive架构介绍(一)
Hive架构介绍(二)
Hive环境搭建(一)
Hive环境搭建(二)
Hive CLI初探
Beeline介绍
Hive数据类型
Hive表一——标准建表语句解析&内、外表
Hive表二——文件及数据格式
Hive分区&桶&倾斜概念
Hive表——Alter
Hive视图&索引简介
Hive表——show & Desc命令
Hive数据导入--load
Hive数据导入--insert
Hive分区表实战
Hive复杂数据类型的嵌套实例
Hive源码阅读环境
Hive执行原理
Hive查询优化
UDF函数实例
Hive终极实例——日志分析
(1)网站日志分析的术语、架构介绍
(2)建表及数据准备
(3)数据处理及统计分析
(4)数据采集到统计分析结果的crontab定时调度
第八章:HBase
HBase,列式存储数据库,提供了快速的查询方式,是Apache Kylin的默认数据存储结果;
HBase介绍及架构
HBase安装
HBase操作实战
Hive与HBase集成实战
第九章:Kylin
Kylin,基于Hadoop的OLAP分析引擎,在Kylin中可以实现传统OLAP的各种操作,直接读取Hive的数据或流式数据作为数据源,把这些数据根据业务模型构建成Cube,Kylin提供了基于Hadoop(MapReduce)的Cube构建,Build完成的Cube数据直接存储于HBase中。Kylin提供了Web UI供查询,包括一些图表展现,是基于大数据的完美OLAP工具;
维度建模
Kylin背景及原理架构
Kylin环境搭建
维度建模知识
Kylin Cube Build步骤解析
Kylin Cube实战
Kylin 增量Cube
Kylin 优化
第十章:Spark
Spark,基于内存计算的大数据计算引擎,提供了Spark SQL、Spark MLlib(基于Spark的机器学习)、SparkR等框架适应不同的应用需求,Spark专题将和大家一起实践操作各种应用和算法;
Spark集群搭建
Spark Core
Spark WordCount(Spark-shell/pyspark..)
IDEA IntelliJ搭建Spark开发环境
Spark编程实例
Spark SQL及DataFrame
Spark SQL实例
Spark Streaming
Spark Streaming实例
Spark MLlib
Spark MLlib应用实例
Spark R介绍
学习方式:
录播课程,开课即学
在线反复观看,有效期2年
上课方式:录播学习+VIP会员群+独享问答中心+在线答疑 +2年反复观看
友情提示:
1、PC端如果发现浏览器无法观看课程,建议使用谷歌浏览器观看;移动端建议直接微信打开课程页面
2、如果购买后下次登录提示课程需要重新购买,一般是因为你把登录账户记成你绑定的手机或者邮箱帐号而混淆了。
3、【在微信购买课程的用户注意】请微信收藏课程页面或者关注微信公众号:天善智能(点“我的”即可查看你已购买的课程),已方便下次学习。
4、课程相关资料&QQ会员群可在课程PC端公告查看下载;
5、加入学习后请添加客服微信:tianshansvip(请注明:公司+职位+姓名),邀请你加入微信课程群