小册描述
目录
- 3.1深度学习简介
- 3.1.1深度学习与人工智能
- 3.1.2深度学习与机器学习
- 3.1.3深度学习与表示学习
- 3.2深度神经网络
- 3.2.1深度神经网络构建
- 3.2.2深度神经网络实例
- 3.3深度卷积神经网络
- 3.4深度循环神经网络
- 3.5深度图神经网络
- 3.5.1图神经网络简介
- 3.5.2图神经网络聚合函数
- 3.5.3图神经网络更新函数
- 3.5.4图神经网络池化函数
- 3.6深度神经网络训练
- 3.6.1模型训练挑战
- 3.6.2数据预处理
- 3.6.3参数初始化
- 3.6.4学习率调整
- 3.6.5梯度优化算法
- 3.6.6超参数优化
- 3.6.7正则化技术
- 3.7.1 TensorFlow安装.81
- 3.7.2 TensorFlow基本框架
- 3.7.3 TensorBoard.82
- 3.7.4 scikit-learn
- 3.7.5 Keras83
- 4.1强化学习简介
- 4.2马尔可夫决策过程
- 4.3动态规划方法
- 4.3.1策略函数
- 4.3.2奖励函数
- 4.3.3累积回报
- 4.3.4状态值函数
- 4.3.5状态-动作值函数
- 4.3.6状态-动作值函数与状态值函数的关系
- 4.3.7 Bellman方程
- 4.3.8策略迭代算法
- 4.3.9值函数迭代算法
- 4.4蒙特卡洛方法
- 4.4.1蒙特卡洛估计
- 4.4.2蒙特卡洛强化学习算法伪代码
- 4.5时序差分学习
- 4.5.1时序差分学习算法
- 4.5.2时序差分学习算法、动态规划和蒙特卡洛算法比较
- 4.5.3 Q-learning
- 4.5.4 SARSA
- 4.6策略梯度方法
- 4.7.1强化学习的智能交易系统框架
- 4.7.2智能交易系统环境模型编程