首页
技术小册
AIGC
面试刷题
技术文章
MAGENTO
云计算
视频课程
源码下载
PDF书籍
「涨薪秘籍」
登录
注册
机器学习为什么需要策略
开发集和测试集的定义
开发集和测试集应该服从同一分布
开发集和测试集应该有多大?
使用单值评估指标进行优化
优化指标和满意度指标
通过开发集和度量指标加速迭代
何时修改开发集、测试集和指标
快速构建并迭代你的第一个系统
误差分析:根据开发集样本评估想法
在误差分析时并行评估多个想法
清洗误标注的开发集和测试集样本
将大型开发集拆分为两个子集,专注其一
Eyeball 和 Blackbox 开发集该设置多大?
偏差和方差:误差的两大来源
偏差和方差举例
与最优错误率比较
处理偏差和方差
偏差和方差间的权衡
减少可避免偏差的技术
训练集误差分析
减少方差的技术
诊断偏差与方差:学习曲线
绘制训练误差曲线
解读学习曲线:高偏差
解读学习曲线:其它情况
绘制学习曲线
为何与人类表现水平进行对比
如何定义人类表现水平
超越人类表现水平
何时在不同的分布上训练与测试
如何决定是否使用你所有的数据
如何决定是否添加不一致的数据
给数据加权重
从训练集泛化到开发集
辨别偏差、方差和数据不匹配误差
解决数据不匹配问题
人工合成数据
优化验证测试
优化验证测试的一般形式
强化学习举例
端到端学习的兴起
端到端学习的更多例子
端到端学习的优缺点
流水线组件的选择:数据可用性
流水线组件的选择:任务简单性
直接学习更为丰富的输出
根据组件进行误差分析
误差归因至某个组件
误差归因的一般情况
组件误差分析与人类水平对比
发现有缺陷的机器学习流水线
当前位置:
首页>>
技术小册>>
机器学习训练指南
小册名称:机器学习训练指南
**机器学习(machine learning)**已然成为无数重要应用的基石——如今,在网络搜索、垃圾邮件检测、语音识别以及产品推荐等领域,你都能够发现它的身影。如果你或你的团队正在研发一款机器学习相关应用,并期待取得较快进展,那么这本书将会是你的得力助手。 案例:建立猫咪图片初创公司 想象一下,你正在建立一家初创公司,这家公司的产品目标是为猫咪爱好者们提供数不尽的猫咪图片,你打算应用**神经网络(neural network)**技术来构建一套计算机视觉系统,通过该系统来识别图片中的猫。 ![](/uploads/images/20231219/6c516b2c5b6153bdb2ea10d218054949.jpg) 但悲剧的是,目前你的学习算法准确度还不够好。为了改进这个猫咪检测器,你正面临着巨大的压力。可你该怎么做呢? 你的团队给出了许多建议,例如: - 获取更多的数据,即收集更多的猫咪图片 - 收集更加多样化的训练数据集,图片中猫的位置可能不常见,也有可能颜色奇异,或者拍摄时使用不同的相机参数 - 通过增加梯度下降的迭代次数,使算法训练得久一些 - 尝试一个拥有更多层/更多隐藏元/更多参数的,规模更大的神经网络 - 尝试一个更小的神经网络 - 尝试加入正则化(例如 L2 正则化) - 改变神经网络的架构(激活函数,隐藏元数量等等) - ... 在上面众多的方向中,如果你做出了正确的选择,就将建立起一个效果领先的猫咪图片识别平台,并带领你的公司取得成功。但如果你选择了一个糟糕的方向,则可能因此浪费掉几个月的时间。那么你该如何做出决定呢? 这本书将告诉你应该怎么做。众多的机器学习问题会留下一些线索,告诉你什么样的尝试有用,什么样的没用。而学会解读这些线索将会节省你几个月甚至几年的开发时间。
下一篇:
开发集和测试集的定义
该分类下的相关小册推荐:
python与ChatGPT让excel高效办公(上)
人人都能学AI,66个提问指令,14个AI工具
人工智能原理、技术及应用(中)
深度强化学习--算法原理与金融实践(三)
AI-Agent智能应用实战(上)
人工智能技术基础(上)
程序员必学数学基础课
ChatGPT与提示工程(下)
AI时代项目经理:ChatGPT与项目经理(下)
大规模语言模型:从理论到实践(下)
AI时代产品经理:ChatGPT与产品经理(中)
区块链权威指南(中)