小册描述
目录
- 什么是数据分析和挖掘
- 数据分析与挖掘的应用领域
- 电商领域—发现破坏规则的“害群之马”
- 交通出行领域—为打车平台进行私人订制
- 医疗健康领域—找到最佳医疗方案
- 数据分析与挖掘的区别
- 数据挖掘的流程
- 常用的数据分析与挖掘工具
- 下载与安装Anoconda
- 数据分析实战案例
- 数据的探索性分析
- 数据建模-对离散变量重编码
- 数据建模-拆分数据集
- 数据建模-默认参数的模型构建
- 数据建模-模型网格搜索
- 数据建模-默认的K近邻模型
- 数据建模-网格搜索的K近邻模型
- 数据建模-默认的GBDT模型
- 数据建模-网络搜索的GBDT模型
- 序列与数据框的构造
- 外部数据的读取
- 数据类型转换及描述统计
- 字符与日期数据的处理
- 常用的数据清洗方法
- 重复观测处理
- 缺失值处理
- 异常值处理
- 数据子集的获取
- 透视表功能
- 表之间的合并与连接
- 分组聚合操作