基于 Docker 的 veRL 环境安装与开发

引言

本期介绍基于 Docker 的 veRL 安装方式，实现无痛的环境配置。

为什么用 Docker？

传统的 pip install 方式经常遇到 Flash Attention 和 PyTorch 版本依赖冲突。Docker 提供了隔离的、可复现的环境，避免了这些问题。

开发环境：Mac（本地终端）\(\to\) 远程 GPU Server \(\to\) Docker 容器中运行 veRL。通过 VSCode/Cursor 连接远程容器，实现本地开发体验。

docker run -it --rm -v <host>:<container> -w <workdir> <image>:<tag> <cmd>

Docker 是管理复杂 ML 环境的最佳实践。veRL 官方提供了 Docker 镜像，可快速搭建训练环境。

对初学者来说，Docker 的最大价值不是“更高级”，而是让训练环境可复制。尤其在远程 GPU + 本地 IDE 的工作流里，只要镜像、挂载和工作目录定义清楚，大部分环境问题都能被提前消掉。

推荐的最小工作流

Docker 不是附属工具，而是 ML 工程的基础设施。先把环境复制问题解决，再去优化训练速度，通常更划算。