小册描述
目录
- 4.1机器学习的分类
- 4.1.1有监督学习
- 4.1.2无监督学习
- 4.1.3强化学习
- 4.2OpenAI Gym
- 4.2.1OpenAI Gym API简介
- 4.2.2环境简介
- 4.3强化学习算法
- 4.3.1Q-learning算法
- 4.3.2SARSA算法
- 4.3.3DQN算法
- 4.3.4Policy Gradient算法
- 4.3.5Actor-Critic算法
- 5.1提示学习
- 5.1.1什么是提示学习
- 5.1.2提示模板设计
- 5.1.3答案空间映射设计
- 5.1.4多提示学习方法
- 5.2上下文学习
- 5.2.1什么是上下文学习
- 5.2.2预训练阶段提升上下文学习能力
- 5.2.3推理阶段优化上下文学习的效果
- 5.3思维链
- 5.4基于提示的文本情感分析实战
- 5.4.1项目简介
- 5.4.2数据预处理模块
- 5.4.3BERT模型模块
- 5.4.4模型训练模块
- 5.4.5模型推理模块
- 6.1大型预训练模型简介
- 6.2预训练模型中的分词器
- 6.2.1BPE
- 6.2.2WordPiece
- 6.2.3Unigram
- 6.2.4SentencePiece
- 6.3分布式深度学习框架
- 6.3.1并行范式简介
- 6.3.2Megatron-LM
- 6.3.3DeepSpeed
- 6.3.4Colossal-AI
- 6.3.5FairScale
- 6.3.6ParallelFormers
- 6.3.7OneFlow
- 6.4基于大型语言模型的预训练实战
- 6.4.1项目简介
- 6.4.2数据预处理模块
- 6.4.3执行模型训练
- 6.5基于大型语言模型的信息抽取实战
- 6.5.1项目简介
- 6.5.2数据预处理模块
- 6.5.3Freeze微调模块
- 6.5.4LoRA微调模块
- 6.5.5P-Tuning v2微调模块