用Python进行数据挖掘-从通用的数据挖掘流程到推荐系统、自然语言处理

用Python进行数据挖掘-从通用的数据挖掘流程到推荐系统、自然语言处理

所有课程内容均为『本人原创』,干货至上 实践穿插理论,杜绝空谈,杜绝纯粹的调包侠,杜绝拿来主义!

免费 1165 人学习

讲师介绍

  • 背景:浙大硕士,曾在多家大公司实习,现初入行『数据科学家』一枚。校招收获多个主流互联网公司『数据挖掘相关岗位』的 (sp) offer,有丰富的面试经验和项目经历

  • 兴趣点:机器学习理论及应用,凸优化,自然语言处理

  • 从事项目:推荐系统,对话机器人

  • 博客专栏:数据挖掘机养成记博客专栏 https://ask.hellobi.com/blog/DataMiner

课程风格


本课程内容均为本人原创,干货至上!
实践穿插理论
杜绝脱离实际的空谈,杜绝拖沓的讲解,杜绝纯粹的调包侠,杜绝拿来主义!

你将从本课程收获

  1. 数据挖掘基本流程的快速上手

  2. 基于python的数据挖掘算法库

  3. 本人对特定问题的思考和总结

  4. 推荐系统、自然语言处理相关的理论和实践


你不会学到

  1. 网上可轻易获取的公开资料(如 Python及其算法库的安装、库的文档、常见的基础理论等)

  2. 空泛的概念

  3. 艰深的数学推导

  4. 脱离互联网数据挖掘实际的(如 统计学里某些理论)

课程大纲(持续修改更新)


课时课程内容
开篇课程介绍及开发环境配置
第一讲优雅高效地数据挖掘——基于 sklearn_pandas
番外深挖 OneHot 和 Dummy 背后的玄机
第二讲数据挖掘流程通用框架之『概述』
第三讲数据挖掘流程通用框架之『特征工程——从基础到高级』
番外如何将词表示成向量
第四讲数据挖掘流程通用框架之『模型融合』
第五讲搭建一个简单的推荐系统之『协同过滤』
第六讲搭建一个简单的推荐系统之『矩阵分解』
番外浅谈二分类评价指标——P/R/F1/ROC/AUC
番外深究 AUC 和 ROC 的内在联系
第七讲搭建一个简单的推荐系统之『组合推荐』
番外谱聚类漫谈
第八讲检索式聊天机器人——基于 NLTK
第九讲生成式聊天机器人——基于 Tensorflow
番外Softmax 与 LR 的推导过程比较
Todo未完待续

课前准备

  1. 线性代数,概率论

  2. python基础知识

  3. 机器学习、数据挖掘常识性内容


资料获取


本文所用课件、数据集、代码等见公告。

加天善课程助手管理员微信:tianshancourse(请注明:公司+姓名+行业),随后管理员会将你拉入到交流群中。可以跟老师一起交流

tianshancourse.png




改版

反馈