课程名称:
从零开始学习Spark免费视频教程
【温馨提示:1. 你可以在PC端浏览器或者微信收藏该页面,以方便你快速找到这个课程;2. 课程相关资料可在课程PC端公告查看下载;3.加入课程后,点(课时)列表即可观看视频 】
课程目标:
Spark是目前大数据最火热的技术之一,本课程涉及scala编程语言,spark核心编程,spark-sql,Streaming等内容,同时结合实际案例干货,帮助数据从业人员能够快速入门和上手spark。
课件地址:https://github.com/ambition119/spark-course
课程目的:
n 掌握Spark原理与架构;
n 掌握Spark-sql;
n 掌握Streaming;
n 了解Mllib分类聚类等算法;
n 掌握Scala编程;
讲师介绍:
平常心,Hortonworks认证专家,熟悉HDP。
多年大型互联网公司大数据应用开发经验。
课程大纲:
一、Spark环境搭建
n hdp,cdh环境搭建和对比
n Apache Spark环境搭建
二、RDD核心编程
n MR和spark的WordCount对比
n RDD创建
n RDD的操作(Transformation,Action)
n 持久化
n 共享变量(广播,累加)
n 数据倾斜案例
三、DataFrame DataSet spark-sql编程
n DataFrame创建
n HiveContext
n 内置函数,窗口函数
n UDF、UDAF
n Spark-sql和tableau的整合
n Spark-sql和RDD的案例-TopN
四、Streaming
n HDFS文件、Socket文件、Kafka
n DStream的操作(转换,输出)
n 滑动窗口计算
n Spark-sql和Spark Streaming的结合案例-黑名单过滤
五、Mllib
n 分类 回归算法
n 聚类 Kmeans算法
n 推荐 ALS(基于物品的协同过滤)算法
六、Scala编程
n 基础语法
n 条件控制和循环
n 函数和过程
n lazy和异常
n 数组Array,ArrayBuffer和遍历
n Java数组和Scala数组的隐式转换
n Map和Tuple
n Java Map和Scala Map的隐式转换
n 集合操作
n 面向对象编程之类,对象,继承,Trait
n 面向对象编程之对象
n 面向对象编程之继承
n 面向对象编程之Trait
n 函数式编程
n 模式匹配
n 正则表达式
n 样例类和提取器实战
n 隐式转换和隐式参数
综合案例:
1、数据倾斜案例
2、流量分析案例
3、IP地址库案例
4、流量图表案例
友情提示
1、PC端如果发现浏览器无法观看课程,建议使用谷歌浏览器观看;移动端建议直接微信打开课程页面
2、【在微信加入课程的用户注意】请微信收藏课程页面或者关注微信公众号:天善智能(点“我的”即可查看你已加入的课程),已方便下次学习。
3、课程相关资料可在课程PC端公告查看下载;
4、加入学习后请添加客服微信:tianshansvip(请注明:公司+职位+姓名),邀请你加入微信课程群