玩转大数据分析!Spark2.X+Python 实战课程

玩转大数据分析!Spark2.X+Python 实战课程

手把手实战教学大数据分析, 结合 Python 以及 Spark 2.x 从0开始掌握大数据。

399 315 人学习

课程名称:


玩转大数据分析!Spark2.X+Python 实战课程

 【温馨提示:1. 你可以在PC端浏览器或者微信收藏该页面,以方便你快速找到这个课程;2. 课程相关资料&QQ会员群可在课程PC端公告查看下载;3.购买课程后,点(课时)列表即可观看视频4. 本课程虚拟商品,已经购买,不能退款。建议先试听章节的,有疑问可咨询客服天善九号:tianshansvip 


课程背景:

本套课程策划实用,集合了Python及Spark一起来分析大数据,日常数据分析使用的语言较多的是R或者Python,但是这样的脚本语言先天只能在一台机器上发展,不适合分析大数据,因此需要其他大数据软件来处理,一般的大数据软件如HADOOP等又不太熟悉。而Spark是由Scala编写,也推出Pyspark,让熟悉Python者能够轻易熟悉操作大数据。


本课程免费试听课程:https://edu.hellobi.com/course/215


学习方式

录播课程,开课即学

在线反复观看,有效期2年

上课方式:录播学习+VIP会员群+独享问答中心+在线答疑 +2年反复观看



课程特色:

手把手实战教学大数据分析, 结合 Python 以及Spark 2.x 从0开始掌握大数据.适合:数据分析师,数据科学家,对大数据分析有兴趣的同学.


讲师介绍:

Bryan

投身于大数据处理分析超过五年,曾任职美国上市公司资料科学家,同时也是SparkTW创始人之一. 

•曾任职于程序化广告,云端服务以及电信公司


课前准备:

硬体配置

  CPU: 4 core 以上

  RAM: 8 G 以上

作业系统

   CentOS 7.0 +

基础知识

   Bash 基本操作

   Python 基本操作

   SQL 基本操作

   Docker or VM

軟件版本

     Spark 2.0+

     Python 2.7/3.5+



课程大纲:

1、大数据时代

1.1什么是大数据

1.2大数据与生活

1.3大数据下的分析工具


2、大数据的瑞士刀- Spark

2.1Hadoop与生态系

2.2Spark vs Hadoop

2.3Spark 核心概念

2.4Pyspark 基本操作

2.5SQL in Spark

2.6Spark 与机器学习


3、Spark 实战环境设定

3.1一分钟建立 Spark 环境

3.2建立Hadoop 集群

3.3安装与设定 Spark 集群

3.4安装与设定 Hive

3.5打造交互式 Spark 环境


4、活用 Pyspark

4.1Python 语法复习

4.2用 Pyspark 建立第一个Spark RDD

4.3RDD 的操作与观察

4.4RDD 与 Map Reduce

4.5共享变数

4.6RDD 运算实例

4.7撰写第一只 Spark 程序

4.8递交你的 Spark 程序


5、Spark ETL 实战

5.1认识资料单元格式

5.2观察资料

5.3选择,筛选与聚合

5.4储存数据

5.5用 Spark 建立 SQL Server


6、Spark 与分布式机器学习

6.1认识数据格式

6.2描述统计

6.3资料清理与变形

6.4认识 pipiline

6.5罗吉斯回归原理与应用

6.6判定树原理与应用

6.7建立预测模型


友情提示:  

1、PC端如果发现浏览器无法观看课程,建议使用谷歌浏览器观看;移动端建议直接微信打开课程页面

2、如果购买后下次登录提示课程需要重新购买,一般是因为你把登录账户记成你绑定的手机或者邮箱帐号而混淆了。

3、【在微信购买课程的用户注意】请微信收藏课程页面或者关注微信公众号:天善智能(点“我的”即可查看你已购买的课程),已方便下次学习。

4、课程相关资料&QQ会员群可在课程PC端公告查看下载;

5、加入学习后请添加客服微信:tianshansvip(请注明:课程名称,发送支付截图),加入学员交流群中。  

1637730118610963.jpeg

改版

反馈