CS224R

Deep Reinforcement Learning

共 19 份讲义。

讲义	日期	来源	资源
CS224R Lecture 1: 深度强化学习导论	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 2: 模仿学习	2025 年 4 月 9 日	Stanford Online	阅读 · LaTeX
CS224R Lecture 3: 策略梯度	2026年4月4日	Stanford Online	阅读 · LaTeX
CS224R Lecture 4: Actor-Critic 方法	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 5: Off-Policy Actor-Critic	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 6: Q-Learning	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 7: Offline RL	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 8: Reward Learning	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 9: RLHF 与偏好优化	2025 年 5 月 12 日	Stanford Online	阅读 · LaTeX
CS224R Lecture 10: 强化学习用于 LLM 推理	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 11: 基于模型的强化学习	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 12: 多任务 RL 与目标条件 RL	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 13: 元强化学习	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 14: 探索与元探索	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 15: 层次化模仿与强化学习	2025年03月18日	Stanford Online	阅读 · LaTeX
CS224R Lecture 16: Autonomy — Chelsea Finn	2025年3月18日	Stanford CS224R: Reinforcement Learning	阅读 · LaTeX
CS224R Lecture 17: 用强化学习推进机器人智能	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 18: 深度 RL 前沿与研究方法	2025 年春季	Stanford Online	阅读 · LaTeX
CS224R Lecture 19: Q-Learning 复习与总结	2026 年 4 月 3 日	Stanford Online	阅读 · LaTeX