LLMs From Scratch — AI 工程课程

01 Tokenizers: BPE, WordPiece, SentencePiece

CODE QUIZ 2 OUTPUTS

✓ → 02 Building a Tokenizer from Scratch

CODE QUIZ 1 OUTPUTS

✓ → 03 Data Pipelines for Pre-Training

CODE QUIZ 1 OUTPUTS

✓ → 04 Pre-Training a Mini GPT (124M Parameters)

CODE QUIZ 1 OUTPUTS

✓ → 05 Scaling: Distributed Training, FSDP, DeepSpeed

CODE QUIZ 1 OUTPUTS

✓ → 06 Instruction Tuning (SFT)

CODE QUIZ 1 OUTPUTS

✓ → 07 RLHF: Reward Model + PPO

CODE QUIZ 1 OUTPUTS

✓ → 08 DPO: Direct Preference Optimization

CODE QUIZ 1 OUTPUTS

✓ → 09 Constitutional AI and Self-Improvement

✓ → 10 Evaluation: Benchmarks, Evals, LM Harness

CODE QUIZ 2 OUTPUTS

✓ → 11 Quantization: Making Models Fit

CODE QUIZ 1 OUTPUTS

✓ → 12 Inference Optimization

CODE QUIZ 1 OUTPUTS

✓ → 13 Building a Complete LLM Pipeline

✓ → 14 Open Models: Architecture Walkthroughs

✓ → 15 Speculative Decoding and EAGLE-3

✓ → 16 Differential Attention (V2)

✓ → 17 Native Sparse Attention (DeepSeek NSA)

✓ → 18 Multi-Token Prediction (MTP)

✓ → 19 DualPipe Parallelism

✓ → 20 DeepSeek-V3 Architecture Walkthrough

✓ → 21 Jamba — Hybrid SSM-Transformer

✓ → 22 Async and Hogwild! Inference

✓ → 25 Speculative Decoding and EAGLE

✓ → 34 Gradient Checkpointing and Activation Recomputation