Model save

Browse files

Files changed (9) hide show

README.md +1 -1
all_results.json +5 -5
model-00001-of-00004.safetensors +1 -1
model-00002-of-00004.safetensors +1 -1
model-00003-of-00004.safetensors +1 -1
model-00004-of-00004.safetensors +1 -1
train_results.json +5 -5
trainer_state.json +40 -40
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -27,7 +27,7 @@ print(output["generated_text"])
 ## Training procedure
-[<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="150" height="24"/>](https://wandb.ai/mehuldamani/grpo/runs/05z5vzuu)
 This model was trained with SFT.

 ## Training procedure
+[<img src="https://raw.githubusercontent.com/wandb/assets/main/wandb-github-badge-28.svg" alt="Visualize in Weights & Biases" width="150" height="24"/>](https://wandb.ai/mehuldamani/grpo/runs/6zd8lzhq)
 This model was trained with SFT.

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "total_flos": 3.4831312270239744e+16,
-    "train_loss": 0.5093159944780411,
-    "train_runtime": 190.1381,
     "train_samples": 500,
-    "train_samples_per_second": 2.63,
-    "train_steps_per_second": 0.163
 }

 {
+    "total_flos": 3.478922794514227e+16,
+    "train_loss": 0.5009717364465037,
+    "train_runtime": 188.6962,
     "train_samples": 500,
+    "train_samples_per_second": 2.65,
+    "train_steps_per_second": 0.164
 }

model-00001-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:05df9af5bbcc1fc4485237adf9b59fafee3503ca6472022d290d0877364bd118
 size 4877660776

 version https://git-lfs.github.com/spec/v1
+oid sha256:d3a937840bb41d58c6831fd1ab4cc2730322968e3acba561a8f0a43213d1514a
 size 4877660776

model-00002-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:735ea284946ed2bbe6c1d7630edd5f35288d8fd9f32ed1f197bf4b981387e8cd
 size 4932751008

 version https://git-lfs.github.com/spec/v1
+oid sha256:824041223d77709dde94551d419b903ec85bce195d9f471d2982d64fc49f87e1
 size 4932751008

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:586f47df3b7eefbb6a1ba768e09bb2acc46ac93eafbfee29c3229f45c0918944
 size 4330865200

 version https://git-lfs.github.com/spec/v1
+oid sha256:257ff2712398fba61ff1234263fb3cf5770c9a8a908b9e3085aa22931e1b6f87
 size 4330865200

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:47744af40e9a9dba93296005eab6fa0fc73f49acec96f6f0e57fd524bce9530c
 size 1089994880

 version https://git-lfs.github.com/spec/v1
+oid sha256:b7b39b048f665379c405a5678c6d82cb40c21ced641dbf38c7ea1d70348a2ad8
 size 1089994880

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "total_flos": 3.4831312270239744e+16,
-    "train_loss": 0.5093159944780411,
-    "train_runtime": 190.1381,
     "train_samples": 500,
-    "train_samples_per_second": 2.63,
-    "train_steps_per_second": 0.163
 }

 {
+    "total_flos": 3.478922794514227e+16,
+    "train_loss": 0.5009717364465037,
+    "train_runtime": 188.6962,
     "train_samples": 500,
+    "train_samples_per_second": 2.65,
+    "train_steps_per_second": 0.164
 }

trainer_state.json CHANGED Viewed

@@ -10,88 +10,88 @@
   "log_history": [
     {
       "epoch": 0.16,
-      "grad_norm": 80.5,
       "learning_rate": 1e-05,
-      "loss": 0.8016,
-      "mean_token_accuracy": 0.7859388060867787,
       "step": 5
     },
     {
       "epoch": 0.32,
-      "grad_norm": 5.90625,
       "learning_rate": 1e-05,
-      "loss": 0.4746,
-      "mean_token_accuracy": 0.85956239849329,
       "step": 10
     },
     {
       "epoch": 0.32,
-      "eval_loss": 0.5104641914367676,
-      "eval_mean_token_accuracy": 0.8601989203160352,
-      "eval_runtime": 8.1194,
-      "eval_samples_per_second": 12.439,
-      "eval_steps_per_second": 12.439,
       "step": 10
     },
     {
       "epoch": 0.48,
-      "grad_norm": 47.0,
       "learning_rate": 1e-05,
-      "loss": 0.4803,
-      "mean_token_accuracy": 0.855245703458786,
       "step": 15
     },
     {
       "epoch": 0.64,
-      "grad_norm": 1.1875,
       "learning_rate": 1e-05,
-      "loss": 0.3854,
-      "mean_token_accuracy": 0.8733080595731735,
       "step": 20
     },
     {
       "epoch": 0.64,
-      "eval_loss": 0.44995084404945374,
-      "eval_mean_token_accuracy": 0.8694882983028298,
-      "eval_runtime": 8.144,
-      "eval_samples_per_second": 12.402,
-      "eval_steps_per_second": 12.402,
       "step": 20
     },
     {
       "epoch": 0.8,
-      "grad_norm": 1.4609375,
       "learning_rate": 1e-05,
-      "loss": 0.4753,
-      "mean_token_accuracy": 0.8553871914744378,
       "step": 25
     },
     {
       "epoch": 0.96,
-      "grad_norm": 1.578125,
       "learning_rate": 1e-05,
-      "loss": 0.4362,
-      "mean_token_accuracy": 0.863992878049612,
       "step": 30
     },
     {
       "epoch": 0.96,
-      "eval_loss": 0.4244144558906555,
-      "eval_mean_token_accuracy": 0.8749614068777254,
-      "eval_runtime": 8.1573,
-      "eval_samples_per_second": 12.382,
-      "eval_steps_per_second": 12.382,
       "step": 30
     },
     {
       "epoch": 0.992,
-      "mean_token_accuracy": 0.8452935963869095,
       "step": 31,
-      "total_flos": 3.4831312270239744e+16,
-      "train_loss": 0.5093159944780411,
-      "train_runtime": 190.1381,
-      "train_samples_per_second": 2.63,
-      "train_steps_per_second": 0.163
     }
   ],
   "logging_steps": 5,
@@ -111,7 +111,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 3.4831312270239744e+16,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null

   "log_history": [
     {
       "epoch": 0.16,
+      "grad_norm": 72.5,
       "learning_rate": 1e-05,
+      "loss": 0.791,
+      "mean_token_accuracy": 0.7902325183153153,
       "step": 5
     },
     {
       "epoch": 0.32,
+      "grad_norm": 2.78125,
       "learning_rate": 1e-05,
+      "loss": 0.458,
+      "mean_token_accuracy": 0.8656408250331878,
       "step": 10
     },
     {
       "epoch": 0.32,
+      "eval_loss": 0.5019531846046448,
+      "eval_mean_token_accuracy": 0.8634858332057991,
+      "eval_runtime": 8.0528,
+      "eval_samples_per_second": 12.542,
+      "eval_steps_per_second": 12.542,
       "step": 10
     },
     {
       "epoch": 0.48,
+      "grad_norm": 2.390625,
       "learning_rate": 1e-05,
+      "loss": 0.4723,
+      "mean_token_accuracy": 0.8590857356786727,
       "step": 15
     },
     {
       "epoch": 0.64,
+      "grad_norm": 1.1640625,
       "learning_rate": 1e-05,
+      "loss": 0.3782,
+      "mean_token_accuracy": 0.8752073399722576,
       "step": 20
     },
     {
       "epoch": 0.64,
+      "eval_loss": 0.44335949420928955,
+      "eval_mean_token_accuracy": 0.8705554610431785,
+      "eval_runtime": 8.1133,
+      "eval_samples_per_second": 12.449,
+      "eval_steps_per_second": 12.449,
       "step": 20
     },
     {
       "epoch": 0.8,
+      "grad_norm": 1.5234375,
       "learning_rate": 1e-05,
+      "loss": 0.4699,
+      "mean_token_accuracy": 0.8568822145462036,
       "step": 25
     },
     {
       "epoch": 0.96,
+      "grad_norm": 1.5390625,
       "learning_rate": 1e-05,
+      "loss": 0.4329,
+      "mean_token_accuracy": 0.8653567247092724,
       "step": 30
     },
     {
       "epoch": 0.96,
+      "eval_loss": 0.42237037420272827,
+      "eval_mean_token_accuracy": 0.8750163653109333,
+      "eval_runtime": 8.1202,
+      "eval_samples_per_second": 12.438,
+      "eval_steps_per_second": 12.438,
       "step": 30
     },
     {
       "epoch": 0.992,
+      "mean_token_accuracy": 0.8463566526770592,
       "step": 31,
+      "total_flos": 3.478922794514227e+16,
+      "train_loss": 0.5009717364465037,
+      "train_runtime": 188.6962,
+      "train_samples_per_second": 2.65,
+      "train_steps_per_second": 0.164
     }
   ],
   "logging_steps": 5,
       "attributes": {}
     }
   },
+  "total_flos": 3.478922794514227e+16,
   "train_batch_size": 1,
   "trial_name": null,
   "trial_params": null

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a9559d7192e2181d349e0aec63d9aaf3c7573ff5a67df719b40ad5ed946eb229
 size 5880

 version https://git-lfs.github.com/spec/v1
+oid sha256:0727bb194d0f1b17b7923152ee54dbb78426c0763fbfa564c944ae46a0e3a52b
 size 5880