小册描述
目录
- 7.1GPT-1~GPT-4系列模型分析
- 7.1.1GPT-1和GPT-2模型
- 7.1.2GPT-3模型
- 7.1.3GPT-3的衍生模型:Code-X
- 7.1.4GPT-4模型
- 7.2InstructGPT模型分析
- 7.2.1模型简介
- 7.2.2数据收集
- 7.2.3模型原理
- 7.2.4模型讨论
- 7.3基于GPT-2模型的文本摘要实战
- 7.3.1项目简介
- 7.3.2数据预处理模块
- 7.3.3GPT-2模型模块
- 7.3.4模型训练模块
- 7.3.5模型推理模块
- 8.1PPO算法简介
- 8.1.1策略梯度算法回顾
- 8.1.2PPO算法原理剖析
- 8.1.3PPO算法对比与评价
- 8.2RLHF框架简介
- 8.2.1RLHF内部剖析
- 8.2.2RLHF价值分析
- 8.2.3RLHF问题分析
- 8.3基于PPO的正向情感倾向性生成项目实战
- 8.3.1项目任务与数据集分析
- 8.3.2数据预处理模块
- 8.3.3模型训练模块
- 8.3.4模型生成模块
- 8.3.5模型评估模块
- 9.1任务设计
- 9.2数据准备
- 9.3基于文档生成问题任务的类ChatGPT实战
- 9.3.1SFT阶段
- 9.3.2RM阶段
- 9.3.3RL阶段
- 10.1AIGC的发展趋势
- 10.1.1AI云边协同
- 10.1.2AI工具应用
- 10.1.3AI可控生成
- 10.1.4AI辅助决策
- 10.2ChatGPT 2C应用场景