大数据系列免费视频教程 【Linux、Hadoop、Spark、Kylin、Hive、HBase、Sqoop、日志分析等】

大数据系列免费视频教程 【Linux、Hadoop、Spark、Kylin、Hive、HBase、Sqoop、日志分析等】

大数据体系架构、Linux基础操作、Hadoop、Spark、SparkR、Hive、Kylin、Sqoop等视频教程

免费 3974 人学习

引言:

本课程为《对话大数据系列技术 从破冰到精进》的免费课程,精品课程请前往:

https://edu.hellobi.com/course/136


大数据系列整个课程课程大纲:

QQ图片20160929112849.jpg

课程特色:

规划全面,涵盖储备技能、Hadoop基础、HBase、Hive、Spark、Kylin等方方面,一览无余,学习路上成竹在胸;

循序渐进,课程设计由易及难,细致剖析,概览全局之下逐步攻克各技术线,积跬步以至千里;

互动共进,沿袭天善学院课程特点,学员与讲师之间、学员之间,高效高频答疑与沟通,独乐乐不如众乐乐;

知行合一,理论与案例、实操结合,学以致用,止于至善;

是诸位一窥大数据体系全貌,由浅入深的不二之选!


讲师介绍:

Mars,毕业于CSU,硕士,热衷于新技术的应用、扩展和新技术的创新。曾供职于供应链公司,负责大数据平台搭建及架构,参与基于Hadoop的数据仓库构建以及客户细分、流失客户预警、潜在客户挖掘等客户类的专项数据挖掘工作。现负责某银行项目大数据架构、客户画像等。 博客专栏:专注于大数据架构技术、数据挖掘/机器学习以及大数据的行业应用。https://ask.hellobi.com/blog/marsj


课程体系(2016年9月计划,会根据大数据业界新发展做出调整,持续更新~

大数据技术是以数据流为核心的多个技术组成的技术栈,Mars将和大家一起持续学习,持续交流,持续更新~

Linux命令基础实战;

第一章:Linux命令基础实战

大数据架构体系结构及开源组件介绍

Linux基本操作


Hadoop基础,对Hadoop架构、核心组件HDFS/YARN做了深入浅出的介绍,让你快速把握Hadoop的核心技术和工作原理,逐渐形成分布式思维;

第二章:Hadoop基础

Hadoop介绍

Hadoop运行模式


第三章:Hadoop集群搭建

Hadoop集群搭建——安装Linux虚拟机

Hadoop集群搭建——远程连接

Hadoop集群搭建(on Linux)——Hadoop(上)

Hadoop集群搭建(on Linux)——Hadoop(下)

Hadoop集群搭建(on Mac)——Hadoop


第四章:HDFS原理

番外篇-课程体系

HDFS架构原理

FS Shell命令介绍及实践


第五章:YARN工作原理

YARN的产生背景

YARN的设计思想

YARN的基本架构

YARN的工作流程(小结)


Sqoop,作为关系型数据库与Hadoop之间的桥梁,批量传输数据,让你自然的从关系型数据库过度到Hadoop平台,在关系型数据库与Hadoop之间游刃有余的进行数据导入导出;

第六章:Sqoop

Sqoop & Hive课程内容介绍

Sqoop介绍与安装

Sqoop的基本使用

Sqoop 导入参数详解

Sqoop导入实战

Sqoop增量导入(上)

Sqoop增量导入(下)

Sqoop导出实战(上)

Sqoop导出实战(下)

Sqoop Job


Hive,基于Hadoop大数据平台的数据仓库,可以让你实现传统数据仓库中的绝大部分数据处理、统计分析,让你在Hadoop大数据平台上感受到Hive QL带来的便利的交互式查询体验;Mars将以日志分析或其他示例带大家熟练掌握Hive的应用;

第七章:Hive

Hive架构介绍(一)

Hive架构介绍(二)

Hive环境搭建(一)

Hive环境搭建(二)

Hive CLI初探

Beeline介绍

Hive数据类型

Hive表一——标准建表语句解析&内、外表

Hive表二——文件及数据格式

Hive分区&桶&倾斜概念

Hive表——Alter

Hive视图&索引简介

Hive表——show & Desc命令

Hive数据导入--load

Hive数据导入--insert


HBase,列式存储数据库,提供了快速的查询方式,是Apache Kylin的默认数据存储结果;

第八章:HBase

HBase介绍及架构

HBase安装

HBase操作实战

Hive与HBase集成实战


Kylin,基于Hadoop的OLAP分析引擎,在Kylin中可以实现传统OLAP的各种操作,直接读取Hive的数据或流式数据作为数据源,把这些数据根据业务模型构建成Cube,Kylin提供了基于Hadoop(MapReduce)的Cube构建,Build完成的Cube数据直接存储于HBase中。Kylin提供了Web UI供查询,包括一些图表展现,是基于大数据的完美OLAP工具;

第九章:Kylin

维度建模    

Kylin架构介绍

Kylin环境搭建

Kylin实战

Kylin性能调试


Spark,基于内存计算的大数据计算引擎,提供了Spark SQL、Spark MLlib(基于Spark的机器学习)、SparkR等框架适应不同的应用需求,Spark专题将和大家一起实践操作各种应用和算法;

第十章:Spark

Spark初探

Spark架构介绍

Spark工作原理

Spark集群搭建

IDEA IntelliJ搭建Spark开发环境

Spark SQL

Spark MLib

Spark R


资料获取

请联系微信天善课程助手管理员微信:tianshancourse(请注明:公司+姓名+行业),随后管理员会将你拉入到交流群中。

1.png

改版

反馈