CS336 2026 Language Modeling from Scratch 共 13 份讲义。 讲义 日期 来源 资源 CS336 2026 Lecture 1:从零构建语言模型、课程版图与 Tokenization 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 2:Resource Accounting、Tensor、FLOPs 与 Memory 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 3:语言模型架构与超参数 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 4:Attention Alternatives 与 Mixture of Experts 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 5:GPUs、Roofline 与 FlashAttention 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 6:Benchmarking、Profiling 与 Triton Kernels 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 7:Parallelism 与分布式训练基础 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 8:Parallelism Basics 与大模型并行训练 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 9:Scaling Laws Basics 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 10:Inference、KV Cache 与服务系统 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 11:Scaling Case Study and Details 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 12:Evaluation 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF CS336 2026 Lecture 13:Data I 2026 年春季 Stanford CS336 阅读 · LaTeX · 备用 PDF