【ManiSkill】ppo.py - notes
1. if __name__ == “__main__”
[L209] save_video_trigger
用于控制何时保存训练视频的触发函数。
该函数通过检查当前迭代次数是否满足保存频率要求来决定是否保存训练视频。
[L256] global_step: int = 0
用于追踪训练过程中的总环境交互步数。这个变量在训练开始时初始化为0,并在每次环境交互时增加num_envs
。它被用作记录训练进度和日志记录的全局计数器。
主要用途
- 作为TensorBoard和W&B日志的x轴步数
- 用于计算训练的SPS (Steps Per Second)