Upload policy_config.py with huggingface_hub
Browse files- policy_config.py +3 -1
policy_config.py
CHANGED
|
@@ -15,7 +15,8 @@ exp_config = {
|
|
| 15 |
'env_id': 'QbertNoFrameskip-v4',
|
| 16 |
'collector_env_num': 8,
|
| 17 |
'evaluator_env_num': 8,
|
| 18 |
-
'fram_stack': 4
|
|
|
|
| 19 |
},
|
| 20 |
'policy': {
|
| 21 |
'model': {
|
|
@@ -57,6 +58,7 @@ exp_config = {
|
|
| 57 |
'render_freq': -1,
|
| 58 |
'mode': 'train_iter'
|
| 59 |
},
|
|
|
|
| 60 |
'cfg_type': 'InteractionSerialEvaluatorDict',
|
| 61 |
'stop_value': 30000,
|
| 62 |
'n_episode': 8
|
|
|
|
| 15 |
'env_id': 'QbertNoFrameskip-v4',
|
| 16 |
'collector_env_num': 8,
|
| 17 |
'evaluator_env_num': 8,
|
| 18 |
+
'fram_stack': 4,
|
| 19 |
+
'env_wrapper': 'atari_default'
|
| 20 |
},
|
| 21 |
'policy': {
|
| 22 |
'model': {
|
|
|
|
| 58 |
'render_freq': -1,
|
| 59 |
'mode': 'train_iter'
|
| 60 |
},
|
| 61 |
+
'figure_path': None,
|
| 62 |
'cfg_type': 'InteractionSerialEvaluatorDict',
|
| 63 |
'stop_value': 30000,
|
| 64 |
'n_episode': 8
|