对话大数据系列技术从破冰到精进【天善智能网课】

课程名称：

对话大数据系列技术从破冰到精进

本课程也有部分免费的视频课程《大数据系列免费视频教程》，大家可以前往学习和了解

https://edu.hellobi.com/course/93

【温馨提示：1. 你可以在PC端浏览器或者微信收藏该页面，以方便你快速找到这个课程；2. 课程相关资料&QQ会员群可在课程PC端公告查看下载；3.购买课程后，点(课时)列表即可观看视频；4. 本课程虚拟商品，已经购买，不能退款。建议先试听章节的，有疑问可咨询客服天善九号：tianshansvip 】

大数据系列整个课程课程大纲： QQ图片20160929112849.jpg

课程特色：

规划全面，涵盖储备技能、Hadoop基础、HBase、Hive、Spark、Kylin等方方面，一览无余，学习路上成竹在胸；

循序渐进，课程设计由易及难，细致剖析，概览全局之下逐步攻克各技术线，积跬步以至千里；

互动共进，沿袭天善学院课程特点，学员与讲师之间、学员之间，高效高频答疑与沟通，独乐乐不如众乐乐；

知行合一，理论与案例、实操结合，学以致用，止于至善；

是诸位一窥大数据体系全貌，由浅入深的不二之选！

讲师介绍：

Mars，毕业于CSU，硕士，热衷于新技术的应用、扩展和新技术的创新。曾供职于供应链公司，负责大数据平台搭建及架构，参与基于Hadoop的数据仓库构建以及客户细分、流失客户预警、潜在客户挖掘等客户类的专项数据挖掘工作。现负责某银行项目大数据架构、客户画像等。博客专栏：专注于大数据架构技术、数据挖掘/机器学习以及大数据的行业应用。https://ask.hellobi.com/blog/marsj

课程体系（2017年6月计划，会根据大数据业界新发展做出调整，持续更新~）

大数据技术是以数据流为核心的多个技术组成的技术栈，Mars将和大家一起持续学习，持续交流，持续更新~

课程内容:

第一章：Linux命令基础实战

大数据架构体系结构及开源组件介绍

Linux基本操作

第二章：Hadoop基础

Hadoop基础，对Hadoop架构、核心组件HDFS/YARN做了深入浅出的介绍，让你快速把握Hadoop的核心技术和工作原理，逐渐形成分布式思维；

Hadoop介绍

Hadoop运行模式

第三章：Hadoop集群搭建

Hadoop集群搭建——安装Linux虚拟机

Hadoop集群搭建——远程连接

Hadoop集群搭建(on Linux)——Hadoop(上）

Hadoop集群搭建(on Linux)——Hadoop（下）

Hadoop集群搭建(on Mac)——Hadoop

第四章：HDFS原理

番外篇-课程体系

HDFS架构原理

FS Shell命令介绍及实践

第五章：YARN工作原理

YARN的产生背景

YARN的设计思想

YARN的基本架构

YARN的工作流程(小结)

第六章：Sqoop

Sqoop，作为关系型数据库与Hadoop之间的桥梁，批量传输数据，让你自然的从关系型数据库过度到Hadoop平台，在关系型数据库与Hadoop之间游刃有余的进行数据导入导出；

Sqoop & Hive课程内容介绍

Sqoop介绍与安装

Sqoop的基本使用

Sqoop 导入参数详解

Sqoop导入实战

Sqoop增量导入（上）

Sqoop增量导入（下）

Sqoop导出实战（上）

Sqoop导出实战（下）

Sqoop Job

第七章：Hive

Hive，基于Hadoop大数据平台的数据仓库，可以让你实现传统数据仓库中的绝大部分数据处理、统计分析，让你在Hadoop大数据平台上感受到Hive QL带来的便利的交互式查询体验；Mars将以日志分析或其他示例带大家熟练掌握Hive的应用；

Hive架构介绍（一）

Hive架构介绍（二）

Hive环境搭建（一）

Hive环境搭建（二）

Hive CLI初探

Beeline介绍

Hive数据类型

Hive表一——标准建表语句解析&内、外表

Hive表二——文件及数据格式

Hive分区&桶&倾斜概念

Hive表——Alter

Hive视图&索引简介

Hive表——show & Desc命令

Hive数据导入--load

Hive数据导入--insert

Hive分区表实战

Hive复杂数据类型的嵌套实例

Hive源码阅读环境

Hive执行原理

Hive查询优化

UDF函数实例

Hive终极实例——日志分析

（1）网站日志分析的术语、架构介绍

（2）建表及数据准备

（3）数据处理及统计分析

（4）数据采集到统计分析结果的crontab定时调度

第八章：HBase

HBase，列式存储数据库，提供了快速的查询方式，是Apache Kylin的默认数据存储结果；

HBase介绍及架构

HBase安装

HBase操作实战

Hive与HBase集成实战

第九章：Kylin

Kylin，基于Hadoop的OLAP分析引擎，在Kylin中可以实现传统OLAP的各种操作，直接读取Hive的数据或流式数据作为数据源，把这些数据根据业务模型构建成Cube，Kylin提供了基于Hadoop（MapReduce）的Cube构建，Build完成的Cube数据直接存储于HBase中。Kylin提供了Web UI供查询，包括一些图表展现，是基于大数据的完美OLAP工具；

维度建模

Kylin背景及原理架构

Kylin环境搭建

维度建模知识

Kylin Cube Build步骤解析

Kylin Cube实战

Kylin 增量Cube

Kylin 优化

第十章：Spark

Spark，基于内存计算的大数据计算引擎，提供了Spark SQL、Spark MLlib(基于Spark的机器学习）、SparkR等框架适应不同的应用需求，Spark专题将和大家一起实践操作各种应用和算法；

Spark集群搭建

Spark Core

Spark WordCount（Spark-shell/pyspark..）

IDEA IntelliJ搭建Spark开发环境

Spark编程实例

Spark SQL及DataFrame

Spark SQL实例

Spark Streaming

Spark Streaming实例

Spark MLlib

Spark MLlib应用实例

Spark R介绍

学习方式：

录播课程，开课即学

在线反复观看，有效期2年

上课方式：录播学习+VIP会员群+独享问答中心+在线答疑 +2年反复观看

友情提示：

1、PC端如果发现浏览器无法观看课程，建议使用谷歌浏览器观看；移动端建议直接微信打开课程页面

2、如果购买后下次登录提示课程需要重新购买，一般是因为你把登录账户记成你绑定的手机或者邮箱帐号而混淆了。

3、【在微信购买课程的用户注意】请微信收藏课程页面或者关注微信公众号：天善智能（点“我的”即可查看你已购买的课程），已方便下次学习。

4、课程相关资料&QQ会员群可在课程PC端公告查看下载；

5、加入学习后请添加客服微信：tianshansvip（请注明：公司+职位+姓名），邀请你加入微信课程群

天善九号.jpg

对话大数据系列技术从破冰到精进

课程名称：