小案例玩转Pyspark

小案例玩转Pyspark

数据科学一旦入门,永无止境...

199 66 人学习

课程名称:

小案例玩转Pyspark

 【温馨提示:1. 你可以在PC端浏览器或者微信收藏该页面,以方便你快速找到这个课程;2. 课程相关资料&QQ会员群可在课程PC端公告查看下载;3.购买课程后,点(课时)列表即可观看视频 】


课程特色:

Python是数据科学家的顺手兵器,Spark又被称为大数据分析的瑞士军刀,两者的结合让玩数据的人得心应手。

本课程有两大特点:

1、以业界最典型的商业分析案例为主线,展现数据科学家眼中Spark各个模块的用法、心得、不足和与Python其他包的结合运用;

2、以Spark的发展方向为授课主干,所有内容围绕DataFrame API,为学员扫清阅读帮助文档的障碍(目前还没有结合Pyspark新特性的书出版,即使《PySpark实战指南》也是新旧特性混合写,而且内容也不全面)。


课程学习环境:

Windows7、与Python3.5配套的Anaconda,Spark2.3

环境配置参考-https://mp.weixin.qq.com/s/Bt6qrE3sGUSCm_BaA33C6A


学前准备与参考书:

先修课程:“Python数据科学-技术详解与商业实践(八大案例,配套书籍) ” https://edu.hellobi.com/course/280

参考书:《PySpark实战指南:利用Python和Spark构建数据密集型应用》、《Spark大数据分析技术与实战》、《Spark机器学习进阶实战》、《Python数据科学:技术详解与商业实践》


讲师简介:

常国珍,北京大学会计学博士,中国大数据产业生态联盟专家委员会委员。具有多年金融、电信及零售行业数据科学项目实施和咨询服务经验。专注于零售金融与泛零售领域的数据治理、市场与用户分析、信息安全和智能解决方案。著有《Python数据科学:技术详解与商业实践》等三本数据科学图书。


学习方式

在线反复观看,有效期2年

上课方式:录播学习+VIP会员群+独享问答中心+在线答疑 +2年反复观看



课程目录:

第一课:PySpark基础与信用评分卡案例

1.1Spark基本框架

1.2搭建windows单机版Python+spark环境

1.3违约模型的数据理解

1.4违约建模的业务理解

1.5构建数据的宽表和模型构建与评估

第二课:数字化营销框架与用户画像实践

2.1用户画像概念与用途

2.2用户标签体系

2.3基于用户标签的推荐系统框架

2.4用户标签开发方法

2.5Spark RDD和DataFrame讲解

2.6新闻APP用户画像实践

第三课:预测模型与流失预警案例

3.1Spark ML的数据类型与建立DataFrame

3.2数据的描述性统计分析

3.3建立Spark ML pipline

3.4数据的预处理

3.5建立正则化逻辑回归模型

3.6建立GBDT模型

3.7二分类模型的评估和参数调优

3.8建立客户流失模型

第四课:申请与交易反欺诈

4.1欺诈的基本认识

4.2 申请反欺诈及案例 

4.3 交易反欺诈及案例

第五课:产品推荐算法与案例

5.1频繁模式-关联规则与FP-Growth

5.2协同过滤与影片推荐

5.3实时推荐与流计算

第六课:图分析算法与案例

6.1 GraphFrames的基础操作

6.2 社会网络分析技术常用算法简介

6.3图分析技术在不同领域中的运用

6.4 机场航班数据分析


友情提示:  

1、PC端如果发现浏览器无法观看课程,建议使用谷歌浏览器观看;移动端建议直接微信打开课程页面

2、如果购买后下次登录提示课程需要重新购买,一般是因为你把登录账户记成你绑定的手机或者邮箱帐号而混淆了。

3、【在微信购买课程的用户注意】请微信收藏课程页面或者关注微信公众号:天善智能(点“我的”即可查看你已购买的课程),已方便下次学习。

4、课程相关资料&QQ会员群可在课程PC端公告查看下载;

5、加入学习后请添加客服微信:tianshansvip(请注明:课程名称,发送支付截图),加入学员交流群中。  

image.png


改版

反馈