小册描述
目录
- 机器学习为什么需要策略
- 开发集和测试集的定义
- 开发集和测试集应该服从同一分布
- 开发集和测试集应该有多大?
- 使用单值评估指标进行优化
- 优化指标和满意度指标
- 通过开发集和度量指标加速迭代
- 何时修改开发集、测试集和指标
- 快速构建并迭代你的第一个系统
- 误差分析:根据开发集样本评估想法
- 在误差分析时并行评估多个想法
- 清洗误标注的开发集和测试集样本
- 将大型开发集拆分为两个子集,专注其一
- Eyeball 和 Blackbox 开发集该设置多大?
- 偏差和方差:误差的两大来源
- 偏差和方差举例
- 与最优错误率比较
- 处理偏差和方差
- 偏差和方差间的权衡
- 减少可避免偏差的技术
- 训练集误差分析
- 减少方差的技术
- 诊断偏差与方差:学习曲线
- 绘制训练误差曲线
- 解读学习曲线:高偏差
- 解读学习曲线:其它情况
- 绘制学习曲线
- 为何与人类表现水平进行对比
- 如何定义人类表现水平
- 超越人类表现水平
- 何时在不同的分布上训练与测试
- 如何决定是否使用你所有的数据
- 如何决定是否添加不一致的数据
- 给数据加权重
- 从训练集泛化到开发集
- 辨别偏差、方差和数据不匹配误差
- 解决数据不匹配问题
- 人工合成数据
- 优化验证测试
- 优化验证测试的一般形式
- 强化学习举例
- 端到端学习的兴起
- 端到端学习的更多例子
- 端到端学习的优缺点
- 流水线组件的选择:数据可用性
- 流水线组件的选择:任务简单性
- 直接学习更为丰富的输出
- 根据组件进行误差分析
- 误差归因至某个组件
- 误差归因的一般情况
- 组件误差分析与人类水平对比
- 发现有缺陷的机器学习流水线