reduce_gradient out compile

598465e8 · biluo.shen · 0559e98c · 598465e8
Commit 598465e8 authored Feb 25, 2024 by biluo.shen
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

scripts/ppo.py scripts/ppo.py +1 -1

No files found.
--- a/scripts/ppo.py
+++ b/scripts/ppo.py
@@ -267,7 +267,6 @@ def run(local_rank, world_size):
        optimizer.zero_grad()
        scaler.scale(loss).backward()
        scaler.unscale_(optimizer)
-        reduce_gradidents(agent, args.world_size)
        return old_approx_kl, approx_kl, clipfrac, pg_loss, v_loss, entropy_loss
    def predict_step(agent, next_obs):
@@ -403,6 +402,7 @@ def run(local_rank, world_size):
                old_approx_kl, approx_kl, clipfrac, pg_loss, v_loss, entropy_loss = \
                    train_step(agent, scaler, mb_obs, b_actions[mb_inds], b_logprobs[mb_inds], b_advantages[mb_inds],
                            b_returns[mb_inds], b_values[mb_inds])
+                reduce_gradidents(agent, args.world_size)
                nn.utils.clip_grad_norm_(agent.parameters(), args.max_grad_norm)
                scaler.step(optimizer)
                scaler.update()