DarriusL
diff --git a/‎README.md
+6 b/‎README.md
+6
diff --git a/‎config/a2c/a2c_gae_cartpole_onbatch.json
+61 b/‎config/a2c/a2c_gae_cartpole_onbatch.json
+61
diff --git a/‎config/a2c/a2c_nstep_cartpole_on.json renamed to ‎config/a2c/a2c_nstep_cartpole_onbatch.json b/‎config/a2c/a2c_nstep_cartpole_on.json renamed to ‎config/a2c/a2c_nstep_cartpole_onbatch.json
diff --git a/‎config/reinforce/reinforce_entropyreg_cartpole_nstep.json renamed to ‎config/reinforce/reinforce_entropyreg_cartpole_onbatch.json b/‎config/reinforce/reinforce_entropyreg_cartpole_nstep.json renamed to ‎config/reinforce/reinforce_entropyreg_cartpole_onbatch.json
diff --git a/‎config/sarsa/sarsa_cartpole_nstep.json renamed to ‎config/sarsa/sarsa_cartpole_onbatch.json b/‎config/sarsa/sarsa_cartpole_nstep.json renamed to ‎config/sarsa/sarsa_cartpole_onbatch.json
diff --git a/‎executor.py
-1 b/‎executor.py
-1
@@ -132,3 +132,9 @@ python executor.py -cfg='./config/dqn/doubledqn_cartpole_off.json' --mode='train
 python executor.py -cfg='./config/dqn/doubledqn_cartpole_per.json' --mode='train'
 ```
 
+a2c
+
+```shell
+python executor.py -cfg='./config/a2c/a2c_nstep_cartpole_on.json' --mode='train'
+```
+
@@ -0,0 +1,61 @@
+{
+    "agent_cfg":{
+        "algorithm_cfg":{
+            "name":"A2C",
+            "var_schedule_cfg":null,
+            "gamma":0.99,
+            "rets_mean_baseline":false,
+            "policy_loss_var":1,
+            "value_loss_var":0.9,
+            "entropy_reg_var_cfg":{
+                "name":"fixed",
+                "var_start":0.01,
+                "var_end":0.01,
+                "star_epoch":0,
+                "end_epoch":0
+            },
+            "n_step_returns":11,
+            "lbd":null
+        },
+        "net_cfg":{
+            "actor_net_cfg":{
+                "name":"MLPNet",
+                "hid_layers":[32],
+                "hid_layers_activation":"Selu"
+            },
+            "critic_net_cfg":{
+                "name":"MLPNet",
+                "hid_layers":[32],
+                "hid_layers_activation":"Selu"
+            }
+        },
+        "optimizer_cfg":{
+            "name":"adam",
+            "lr":1e-4,
+            "weight_decay": 1e-08,
+            "betas": [
+                0.9,
+                0.999
+            ]
+        },
+        "lr_schedule_cfg":null,
+        "memory_cfg":{
+            "name":"OnPolicyBatch"
+        },
+        "max_epoch":10000,
+        "train_exp_size":128,
+        "batch_learn_times_per_train":4
+    },
+    "env":{
+        "name":"CartPole",
+        "solved_total_reward":99900,
+        "finish_total_reward":100000,
+        "survival_T":100000
+    },
+    "model_path":null,
+    "valid":{
+        "valid_step":100,
+        "valid_times":5,
+        "not_improve_finish_step":5
+    }
+}
@@ -6,7 +6,6 @@
 from lib.callback import Logger
 
 #TODO:Added: A mode that can be trained on top of existing models
-#TODO:logger optimization in each file
 if __name__ == '__main__':
     if not os.path.exists("./cache/logger"):
         os.makedirs("./cache/logger");