小册描述
目录
- 第7章 强化学习
- 7.1 强化学习简介
- 7.1.1 什么是强化学习
- 7.1.2 强化学习的应用
- 7.2 基于值函数的强化学习方法
- 7.2.1 蒙特卡罗法
- 7.2.2 时间差分法
- 7.2.3 值函数逼近法
- 7.3 基于直接策略搜索的强化学习方法
- 7.3.1 策略梯度法
- 7.3.2 置信域策略优化法
- 7.3.3 确定性策略梯度法
- 7.4 DQN算法模型
- 7.5 强化学习前沿研究
- 7.5.1 逆向强化学习
- 7.5.2 深度强化学习
- 7.5.3 分层强化学习
- 7.5.4 价值迭代网络
- 7.5.5 AlphaGo的原理
- 7.6 强化学习应用实践
- 第8章 自然语言处理
- 8.1 自然语言处理概述
- 8.1.1 自然语言处理的概念
- 8.1.2 自然语言处理的层次
- 8.1.3 NLP的判别标准
- 8.2 自然语言处理的发展与应用
- 8.2.1 自然语言处理的发展历程
- 8.2.2 自然语言处理的应用
- 8.3 自然语言处理技术分类
- 8.3.1 NLP基础技术
- 8.3.2 NLP应用技术
- 8.4 语音处理
- 8.4.1 语音处理概述
- 8.4.2 语音处理发展状况
- 8.4.3 语音处理的主要分支
- 8.4.4 语音处理的其他分支
- 8.5 自然语言处理应用实践
- 第9章 机器视觉
- 9.1 图像表达与性质
- 9.1.1 图像表达的若干概念