- 章节1: 大数据时代
- 课时1:课程介绍 免费 08:45
- 课时2:什么是大数据 免费 11:29
- 课时3:大数据与生活 免费 12:48
- 课时4:大数据下的分析工具 免费 13:36
- 章节2: 大数据的瑞士刀-Spark
- 课时5:Hadoop与生态系 免费 14:54
- 课时6:Spark vs Hadoop 免费 13:21
- 课时7:Spark 核心概念 免费 14:51
- 课时8:Pyspark 基本操作 免费 13:08
- 课时9:SQL in Spark 免费 14:58
- 章节3: 建立Spark环境
- 课时10:一分钟建立Spark 环境1 09:13
- 课时11:一分钟建立Spark 环境2 12:38
- 课时12:建立 Hadoop 环境1 13:09
- 课时13:建立 Hadoop 环境2 14:59
- 课时14:建立 Hadoop 环境3 10:01
- 课时15:建立 Spark 集群 14:38
- 课时16:建立 Hive1 11:32
- 课时17:建立 Hive2 12:46
- 课时18:建立交互式 Pyspark 环境1 09:46
- 课时19:建立交互式 Pyspark 环境2 11:44
- 章节4: 活用 Pyspark
- 课时20:Python语法复习1 14:19
- 课时21:Python语法复习2 14:37
- 课时22:建立第一个RDD1 13:45
- 课时23:建立第一个RDD2 10:47
- 课时24:RDD的MapReduce1 12:44
- 课时25:RDD的MapReduce2 15:00
- 课时26:Dataframe 的操作与观察1 09:51
- 课时27:Dataframe 的操作与观察2 10:40
- 课时28:共享变数1 07:05
- 课时29:共享变数2 09:46
- 课时30:Python结合Pyspark实务案例1 14:07
- 课时31:Python结合Pyspark实务案例2 09:57
- 课时32:撰写pyspark程序 12:43
- 课时33:提交你的Spark程序 12:22
- 章节5: Spark ETL 实战
- 课时34:实战ETL 06:54
- 课时35:认识资料存储格式 13:58
- 课时36:观察资料 14:09
- 课时37:选择,筛选与聚合(1) 13:18
- 课时38:选择,筛选与聚合(2) 08:06
- 课时39:储存数据 11:55
- 课时40:用 Spark 建立 SQL Server大数据BI系统 14:59
- 章节6: Spark 与分布式机器学习
- 课时41:认识资料格式 14:16
- 课时42:描述统计 14:52
- 课时43:资料清洗 14:57
- 课时44:Data Pipeline 07:15
- 课时45:使用Kmeans将资料分群(1) 14:57
- 课时46:使用Kmeans将资料分群(2) 10:43
- 课时47:logistic regression(1) 14:54
- 课时48:logistic regression(2) 14:09
- 课时49:决策树与随机森林(1) 14:24
- 课时50:决策树与随机森林(2) 15:01
- 课时51:总结-如何成为更好的自己 08:16