🍉的博客
首页
摄影
文章
小功能
课程
关于
首页
摄影
文章
小功能
课程
关于
搜索
课程
/
LLMs From Scratch
/
Instruction Tuning (SFT)
Phase 10
Lesson 6
CODE
QUIZ
1 OUTPUTS
Instruction Tuning (SFT)
标记完成
加载中…
← 上一课
Scaling: Distributed Training, FSDP, DeepSpeed
下一课 →
RLHF: Reward Model + PPO