Change ckpt_dir

eba0e134 · biluo.shen · 25e8c58b · eba0e134 · eba0e134
Commit eba0e134 authored Feb 21, 2024 by biluo.shen
Expand all Hide whitespace changes
Inline Side-by-side

Showing with 385 additions and 3 deletions

scripts/dmc_dist.py scripts/dmc_dist.py +381 -0

scripts/ppo.py scripts/ppo.py +4 -3

No files found.
--- a/scripts/dmc_dist.py
+++ b/scripts/dmc_dist.py
--- a/scripts/ppo.py
+++ b/scripts/ppo.py
@@ -146,8 +146,6 @@ def run(local_rank, world_size):
    if args.world_size > 1:
        setup(args.backend, local_rank, args.world_size, args.port)
-    os.makedirs(args.ckpt_dir, exist_ok=True)
    timestamp = int(time.time())
    run_name = f"{args.env_id}__{args.exp_name}__{args.seed}__{timestamp}"
    writer = None
@@ -159,6 +157,9 @@ def run(local_rank, world_size):
            "|param|value|\n|-|-|\n%s" % ("\n".join([f"|{key}|{value}|" for key, value in vars(args).items()])),
        )
+        ckpt_dir = os.path.join(args.ckpt_dir, run_name)
+        os.makedirs(ckpt_dir, exist_ok=True)
    # TRY NOT TO MODIFY: seeding
    # CRUCIAL: note that we needed to pass a different seed for each data parallelism worker
@@ -394,7 +395,7 @@ def run(local_rank, world_size):
        # TRY NOT TO MODIFY: record rewards for plotting purposes
        if local_rank == 0:
            if iteration % args.save_interval == 0:
-                torch.save(agent.state_dict(), os.path.join(args.ckpt_dir, f"ppo_{iteration}.pth"))
+                torch.save(agent.state_dict(), os.path.join(ckpt_dir, f"{iteration}.pth"))
            writer.add_scalar("charts/learning_rate", optimizer.param_groups[0]["lr"], global_step)
            writer.add_scalar("losses/value_loss", v_loss.item(), global_step)