小册描述
目录
- 8. 1 学习和纯优化有什么不同
- 8. 2 小批量算法
- 8. 3 基本算法
- 8. 4 参数初始化策略
- 8. 5 自适应学习率算法
- 8. 6 二阶近似方法
- 8. 7 一些优化策略
- 9. 1 卷积运算
- 9. 2 为什么要使用卷积运算
- 9. 3 池化
- 9. 4 基本卷积函数的变体
- 9. 5 卷积核的初始化
- 10. 1 展开计算图
- 10. 2 循环神经网络
- 10. 3 双向 RNN
- 10. 4 基于编码-解码的序列到序列架构
- 10. 5 深度循环网络
- 10. 6 递归神经网络
- 10. 7 长短期记忆网络
- 10. 8 门控循环单元
- 10. 9 截断梯度
- 11. 1 设计流程
- 11. 2 更多的性能度量方法
- 11. 3 默认的基准模型
- 11. 4 要不要收集更多数据
- 11. 5 超参数的调节
- 11. 6 模型调试的重要性
- 12. 1 大规模深度学习
- 12. 2 计算机视觉中的预处理
- 12. 3 语音识别
- 12. 4 自然语言处理
- 12. 5 推荐系统
- 12. 6 知识问答系统
- 13. 1 大语言模型的背景
- 13. 2 大语言模型的重要性
- 13. 3 大语言模型的应用场景
- 13. 4 大语言模型和传统方法的区别
- 14. 1 Transformer 架构
- 14. 2 预训练
- 14. 3 微调
- 14. 4 自回归训练
- 14. 5 掩码语言模型
- 15. 1 GPT 系列模型
- 15. 2 BERT
- 15. 3 XLNet
- 16. 1 自动文本生成
- 16. 2 对话系统和聊天机器人
- 16. 3 代码和技术文档生成
- 16. 4 创意内容生成
- 16. 5 国产优秀大语言模型———文心一言
- 16. 6 国产优秀大语言模型———讯飞星火认知大模型