跳转至

CS224R

Deep Reinforcement Learning

共 19 份讲义。

讲义 日期 来源 资源
CS224R Lecture 1: 深度强化学习导论 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 2: 模仿学习 2025 年 4 月 9 日 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 3: 策略梯度 2026年4月4日 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 4: Actor-Critic 方法 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 5: Off-Policy Actor-Critic 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 6: Q-Learning 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 7: Offline RL 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 8: Reward Learning 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 9: RLHF 与偏好优化 2025 年 5 月 12 日 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 10: 强化学习用于 LLM 推理 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 11: 基于模型的强化学习 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 12: 多任务 RL 与目标条件 RL 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 13: 元强化学习 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 14: 探索与元探索 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 15: 层次化模仿与强化学习 2025年03月18日 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 16: Autonomy — Chelsea Finn 2025年3月18日 Stanford CS224R: Reinforcement Learning 阅读 · LaTeX · 备用 PDF
CS224R Lecture 17: 用强化学习推进机器人智能 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 18: 深度 RL 前沿与研究方法 2025 年春季 Stanford Online 阅读 · LaTeX · 备用 PDF
CS224R Lecture 19: Q-Learning 复习与总结 2026 年 4 月 3 日 Stanford Online 阅读 · LaTeX · 备用 PDF