小册描述
目录
- 1.1 为何选择机器学习
- 1.1.1 机器学习能够解决的问题
- 1.1.2 熟悉任务和数据
- 1.2 为何选择Python
- 1.3 scikit-learn
- 1.4 必要的库和工具
- 1.4.1 Jupyter Notebook
- 1.4.2 NumPy
- 1.4.3 SciPy
- 1.4.4 matplotlib
- 1.4.5 pandas
- 1.4.6 mglearn
- 1.5 Python 2 与Python 3 的对比
- 1.7 第 一个应用:鸢尾花分类
- 1.7.1 初识数据
- 1.7.2 衡量模型是否成功:训练数据与测试数据
- 1.7.3 要事第 一:观察数据
- 1.7.4 构建第 一个模型:k 近邻算法
- 1.7.5 做出预测
- 1.7.6 评估模型
- 2.1 分类与回归
- 2.2 泛化、过拟合与欠拟合
- 2.3 监督学习算法
- 2.3.1 一些样本数据集
- 2.3.2 k 近邻
- 2.3.3 线性模型
- 2.3.4 朴素贝叶斯分类器
- 2.3.5 决策树
- 2.3.6 决策树集成
- 2.3.7 核支持向量机
- 2.3.8 神经网络(深度学习)
- 2.4 分类器的不确定度估计
- 2.4.1 决策函数
- 2.4.2 预测概率
- 2.4.3 多分类问题的不确定度
- 3.1 无监督学习的类型
- 3.2 无监督学习的挑战
- 3.3 预处理与缩放
- 3.3.1 不同类型的预处理
- 3.3.2 应用数据变换
- 3.3.3 对训练数据和测试数据进行相同的缩放
- 3.3.4 预处理对监督学习的作用
- 3.4 降维、特征提取与流形学习
- 3.4.1 主成分分析
- 3.4.2 非负矩阵分解
- 3.4.3 用t-SNE 进行流形学习
- 3.5 聚类
- 3.5.1 k 均值聚类
- 3.5.2 凝聚聚类
- 3.5.3 DBSCAN
- 3.5.4 聚类算法的对比与评估
- 3.5.5 聚类方法小结