ErNewdev0
/

nusa-beta-0001

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

ErNewdev0 commited on May 3

Commit

07bee0d

·

verified ·

1 Parent(s): 4432c09

Model save

Files changed (3) hide show

README.md +7 -7
generation_config.json +1 -1
model.safetensors +1 -1

README.md CHANGED Viewed

@@ -12,9 +12,9 @@ should probably proofread and complete it, then remove this comment. -->
 # nusa-beta-0001
-This model was trained from scratch on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.7441
 ## Model description
@@ -36,7 +36,7 @@ The following hyperparameters were used during training:
 - learning_rate: 5e-05
 - train_batch_size: 8
 - eval_batch_size: 8
-- seed: 50
 - gradient_accumulation_steps: 2
 - total_train_batch_size: 16
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
@@ -49,12 +49,12 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 0.6651        | 10.0  | 100  | 1.7441          |
 ### Framework versions
-- Transformers 4.51.3
-- Pytorch 2.6.0+cu124
 - Datasets 3.5.1
-- Tokenizers 0.21.1

 # nusa-beta-0001
+This model is a fine-tuned version of [](https://huggingface.co/) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 6.8389
 ## Model description
 - learning_rate: 5e-05
 - train_batch_size: 8
 - eval_batch_size: 8
+- seed: 42
 - gradient_accumulation_steps: 2
 - total_train_batch_size: 16
 - optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 6.9648        | 10.0  | 100  | 6.8389          |
 ### Framework versions
+- Transformers 4.48.3
+- Pytorch 2.5.1+cu124
 - Datasets 3.5.1
+- Tokenizers 0.21.0

generation_config.json CHANGED Viewed

@@ -3,5 +3,5 @@
   "bos_token_id": 50256,
   "eos_token_id": 50256,
   "pad_token_id": 50257,
-  "transformers_version": "4.51.3"
 }

   "bos_token_id": 50256,
   "eos_token_id": 50256,
   "pad_token_id": 50257,
+  "transformers_version": "4.48.3"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:588c83f7a8a88eaacddd8d35882d3a1a5ccda135146cb83a1a0b42aece235610
 size 120188792

 version https://git-lfs.github.com/spec/v1
+oid sha256:c0f8411e2bb6670d9ef4d678701e36ff3445ceeb507e898bd91c4dcde7797e38
 size 120188792