Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

adapter_config.json +3 -3
adapter_model.safetensors +1 -1
checkpoint-125/adapter_config.json +3 -3
checkpoint-125/adapter_model.safetensors +1 -1
checkpoint-125/optimizer.pt +1 -1
checkpoint-125/trainer_state.json +23 -23

adapter_config.json CHANGED Viewed

@@ -25,10 +25,10 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "q_proj",
     "k_proj",
-    "o_proj",
-    "v_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "v_proj",
     "k_proj",
+    "q_proj",
+    "o_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:60da9d58360530663741e4ca22bae2db608962d358f38f3359596bc8edd8cfdc
 size 33588528

 version https://git-lfs.github.com/spec/v1
+oid sha256:737226b4a4649a3965c71c19abb2efbe5b0b31ab5554485bdbaf8db81faa945b
 size 33588528

checkpoint-125/adapter_config.json CHANGED Viewed

@@ -25,10 +25,10 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "q_proj",
     "k_proj",
-    "o_proj",
-    "v_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
+    "v_proj",
     "k_proj",
+    "q_proj",
+    "o_proj"
   ],
   "target_parameters": null,
   "task_type": "CAUSAL_LM",

checkpoint-125/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:60da9d58360530663741e4ca22bae2db608962d358f38f3359596bc8edd8cfdc
 size 33588528

 version https://git-lfs.github.com/spec/v1
+oid sha256:737226b4a4649a3965c71c19abb2efbe5b0b31ab5554485bdbaf8db81faa945b
 size 33588528

checkpoint-125/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:897397825ce06bb33563ff8cf2867213c66af5fb3e0103d48d97cf3069112e5f
 size 67327691

 version https://git-lfs.github.com/spec/v1
+oid sha256:565d0efc3c4dd91b6fce73d62da0c22a098b7cc863d7887d34b5269f8b75e6b2
 size 67327691

checkpoint-125/trainer_state.json CHANGED Viewed

@@ -11,86 +11,86 @@
   "log_history": [
     {
       "epoch": 0.08,
-      "grad_norm": 0.814979076385498,
       "learning_rate": 0.0001856,
-      "loss": 1.5935,
       "step": 10
     },
     {
       "epoch": 0.16,
-      "grad_norm": 0.6319419741630554,
       "learning_rate": 0.0001696,
-      "loss": 1.358,
       "step": 20
     },
     {
       "epoch": 0.24,
-      "grad_norm": 1.6961193084716797,
       "learning_rate": 0.00015360000000000002,
-      "loss": 1.2815,
       "step": 30
     },
     {
       "epoch": 0.32,
-      "grad_norm": 0.353381484746933,
       "learning_rate": 0.00013759999999999998,
-      "loss": 1.1922,
       "step": 40
     },
     {
       "epoch": 0.4,
-      "grad_norm": 0.49867403507232666,
       "learning_rate": 0.0001216,
-      "loss": 1.3126,
       "step": 50
     },
     {
       "epoch": 0.48,
-      "grad_norm": 0.39462074637413025,
       "learning_rate": 0.0001056,
-      "loss": 1.3094,
       "step": 60
     },
     {
       "epoch": 0.56,
-      "grad_norm": 0.38629117608070374,
       "learning_rate": 8.960000000000001e-05,
       "loss": 1.2157,
       "step": 70
     },
     {
       "epoch": 0.64,
-      "grad_norm": 0.41698044538497925,
       "learning_rate": 7.36e-05,
-      "loss": 1.3107,
       "step": 80
     },
     {
       "epoch": 0.72,
-      "grad_norm": 0.37216514348983765,
       "learning_rate": 5.76e-05,
-      "loss": 1.2042,
       "step": 90
     },
     {
       "epoch": 0.8,
-      "grad_norm": 0.5222511291503906,
       "learning_rate": 4.16e-05,
-      "loss": 1.2705,
       "step": 100
     },
     {
       "epoch": 0.88,
-      "grad_norm": 0.5186126232147217,
       "learning_rate": 2.5600000000000002e-05,
-      "loss": 1.3127,
       "step": 110
     },
     {
       "epoch": 0.96,
-      "grad_norm": 0.3743302524089813,
       "learning_rate": 9.600000000000001e-06,
-      "loss": 1.2898,
       "step": 120
     }
   ],

   "log_history": [
     {
       "epoch": 0.08,
+      "grad_norm": 0.6921696066856384,
       "learning_rate": 0.0001856,
+      "loss": 1.593,
       "step": 10
     },
     {
       "epoch": 0.16,
+      "grad_norm": 0.6577253341674805,
       "learning_rate": 0.0001696,
+      "loss": 1.3572,
       "step": 20
     },
     {
       "epoch": 0.24,
+      "grad_norm": 0.4804594814777374,
       "learning_rate": 0.00015360000000000002,
+      "loss": 1.28,
       "step": 30
     },
     {
       "epoch": 0.32,
+      "grad_norm": 0.3516864478588104,
       "learning_rate": 0.00013759999999999998,
+      "loss": 1.191,
       "step": 40
     },
     {
       "epoch": 0.4,
+      "grad_norm": 0.5060459971427917,
       "learning_rate": 0.0001216,
+      "loss": 1.3117,
       "step": 50
     },
     {
       "epoch": 0.48,
+      "grad_norm": 0.3955352008342743,
       "learning_rate": 0.0001056,
+      "loss": 1.3089,
       "step": 60
     },
     {
       "epoch": 0.56,
+      "grad_norm": 0.3805406391620636,
       "learning_rate": 8.960000000000001e-05,
       "loss": 1.2157,
       "step": 70
     },
     {
       "epoch": 0.64,
+      "grad_norm": 0.405851811170578,
       "learning_rate": 7.36e-05,
+      "loss": 1.3118,
       "step": 80
     },
     {
       "epoch": 0.72,
+      "grad_norm": 0.3721686899662018,
       "learning_rate": 5.76e-05,
+      "loss": 1.2033,
       "step": 90
     },
     {
       "epoch": 0.8,
+      "grad_norm": 0.5105984807014465,
       "learning_rate": 4.16e-05,
+      "loss": 1.2716,
       "step": 100
     },
     {
       "epoch": 0.88,
+      "grad_norm": 0.5118499398231506,
       "learning_rate": 2.5600000000000002e-05,
+      "loss": 1.3137,
       "step": 110
     },
     {
       "epoch": 0.96,
+      "grad_norm": 0.36947008967399597,
       "learning_rate": 9.600000000000001e-06,
+      "loss": 1.2903,
       "step": 120
     }
   ],