Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

config.json +10 -11
metadata.json +2 -2
model.weights.h5 +2 -2
preprocessor.json +12 -16
task.json +26 -34
tokenizer.json +5 -10

config.json CHANGED Viewed

@@ -1,17 +1,16 @@
 {
-    "module": "keras_nlp.src.models.bert.bert_backbone",
-    "class_name": "BertBackbone",
     "config": {
-        "name": "bert_backbone",
         "trainable": true,
-        "vocabulary_size": 30522,
-        "num_layers": 2,
-        "num_heads": 2,
-        "hidden_dim": 128,
-        "intermediate_dim": 512,
         "dropout": 0.1,
-        "max_sequence_length": 512,
-        "num_segments": 2
     },
-    "registered_name": "keras_nlp>BertBackbone"
 }

 {
+    "module": "keras_nlp.src.models.gpt2.gpt2_backbone",
+    "class_name": "GPT2Backbone",
     "config": {
+        "name": "gpt2_backbone",
         "trainable": true,
+        "vocabulary_size": 50257,
+        "num_layers": 12,
+        "num_heads": 12,
+        "hidden_dim": 768,
+        "intermediate_dim": 3072,
         "dropout": 0.1,
+        "max_sequence_length": 1024
     },
+    "registered_name": "keras_nlp>GPT2Backbone"
 }

metadata.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
     "keras_version": "3.3.3",
     "keras_nlp_version": "0.10.0",
-    "parameter_count": 4385920,
-    "date_saved": "2024-05-02@01:15:04"
 }

 {
     "keras_version": "3.3.3",
     "keras_nlp_version": "0.10.0",
+    "parameter_count": 124439808,
+    "date_saved": "2024-05-02@16:48:55"
 }

model.weights.h5 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6cd686cb39d95b258d02990e71512600d26c06e902f3b2f7d9ec1a6e4f559efc
-size 17632104

 version https://git-lfs.github.com/spec/v1
+oid sha256:3a175c71ca3bb821790dc6c78c3720621ecaa16f38e0db531e4fadbd9ada810f
+size 498160592

preprocessor.json CHANGED Viewed

@@ -1,29 +1,25 @@
 {
-    "module": "keras_nlp.src.models.bert.bert_preprocessor",
-    "class_name": "BertPreprocessor",
     "config": {
-        "name": "bert_preprocessor",
         "trainable": true,
         "dtype": "float32",
         "tokenizer": {
-            "module": "keras_nlp.src.models.bert.bert_tokenizer",
-            "class_name": "BertTokenizer",
             "config": {
-                "name": "bert_tokenizer",
                 "trainable": true,
                 "dtype": "int32",
-                "vocabulary": null,
                 "sequence_length": null,
-                "lowercase": true,
-                "strip_accents": false,
-                "split": true,
-                "suffix_indicator": "##",
-                "oov_token": "[UNK]"
             },
-            "registered_name": "keras_nlp>BertTokenizer"
         },
-        "sequence_length": 512,
-        "truncate": "round_robin"
     },
-    "registered_name": "keras_nlp>BertPreprocessor"
 }

 {
+    "module": "keras_nlp.src.models.gpt2.gpt2_causal_lm_preprocessor",
+    "class_name": "GPT2CausalLMPreprocessor",
     "config": {
+        "name": "gpt2_causal_lm_preprocessor",
         "trainable": true,
         "dtype": "float32",
         "tokenizer": {
+            "module": "keras_nlp.src.models.gpt2.gpt2_tokenizer",
+            "class_name": "GPT2Tokenizer",
             "config": {
+                "name": "gpt2_tokenizer",
                 "trainable": true,
                 "dtype": "int32",
                 "sequence_length": null,
+                "add_prefix_space": false
             },
+            "registered_name": "keras_nlp>GPT2Tokenizer"
         },
+        "sequence_length": 1024,
+        "add_start_token": true,
+        "add_end_token": true
     },
+    "registered_name": "keras_nlp>GPT2CausalLMPreprocessor"
 }

task.json CHANGED Viewed

@@ -1,57 +1,49 @@
 {
-    "module": "keras_nlp.src.models.bert.bert_classifier",
-    "class_name": "BertClassifier",
     "config": {
         "backbone": {
-            "module": "keras_nlp.src.models.bert.bert_backbone",
-            "class_name": "BertBackbone",
             "config": {
-                "name": "bert_backbone",
                 "trainable": true,
-                "vocabulary_size": 30522,
-                "num_layers": 2,
-                "num_heads": 2,
-                "hidden_dim": 128,
-                "intermediate_dim": 512,
                 "dropout": 0.1,
-                "max_sequence_length": 512,
-                "num_segments": 2
             },
-            "registered_name": "keras_nlp>BertBackbone"
         },
         "preprocessor": {
-            "module": "keras_nlp.src.models.bert.bert_preprocessor",
-            "class_name": "BertPreprocessor",
             "config": {
-                "name": "bert_preprocessor",
                 "trainable": true,
                 "dtype": "float32",
                 "tokenizer": {
-                    "module": "keras_nlp.src.models.bert.bert_tokenizer",
-                    "class_name": "BertTokenizer",
                     "config": {
-                        "name": "bert_tokenizer",
                         "trainable": true,
                         "dtype": "int32",
-                        "vocabulary": null,
                         "sequence_length": null,
-                        "lowercase": true,
-                        "strip_accents": false,
-                        "split": true,
-                        "suffix_indicator": "##",
-                        "oov_token": "[UNK]"
                     },
-                    "registered_name": "keras_nlp>BertTokenizer"
                 },
-                "sequence_length": 512,
-                "truncate": "round_robin"
             },
-            "registered_name": "keras_nlp>BertPreprocessor"
         },
-        "name": "bert_classifier",
-        "num_classes": 2,
-        "activation": "linear",
-        "dropout": 0.1
     },
-    "registered_name": "keras_nlp>BertClassifier"
 }

 {
+    "module": "keras_nlp.src.models.gpt2.gpt2_causal_lm",
+    "class_name": "GPT2CausalLM",
     "config": {
         "backbone": {
+            "module": "keras_nlp.src.models.gpt2.gpt2_backbone",
+            "class_name": "GPT2Backbone",
             "config": {
+                "name": "gpt2_backbone",
                 "trainable": true,
+                "vocabulary_size": 50257,
+                "num_layers": 12,
+                "num_heads": 12,
+                "hidden_dim": 768,
+                "intermediate_dim": 3072,
                 "dropout": 0.1,
+                "max_sequence_length": 1024
             },
+            "registered_name": "keras_nlp>GPT2Backbone"
         },
         "preprocessor": {
+            "module": "keras_nlp.src.models.gpt2.gpt2_causal_lm_preprocessor",
+            "class_name": "GPT2CausalLMPreprocessor",
             "config": {
+                "name": "gpt2_causal_lm_preprocessor",
                 "trainable": true,
                 "dtype": "float32",
                 "tokenizer": {
+                    "module": "keras_nlp.src.models.gpt2.gpt2_tokenizer",
+                    "class_name": "GPT2Tokenizer",
                     "config": {
+                        "name": "gpt2_tokenizer",
                         "trainable": true,
                         "dtype": "int32",
                         "sequence_length": null,
+                        "add_prefix_space": false
                     },
+                    "registered_name": "keras_nlp>GPT2Tokenizer"
                 },
+                "sequence_length": 1024,
+                "add_start_token": true,
+                "add_end_token": true
             },
+            "registered_name": "keras_nlp>GPT2CausalLMPreprocessor"
         },
+        "name": "gpt2_causal_lm"
     },
+    "registered_name": "keras_nlp>GPT2CausalLM"
 }

tokenizer.json CHANGED Viewed

@@ -1,17 +1,12 @@
 {
-    "module": "keras_nlp.src.models.bert.bert_tokenizer",
-    "class_name": "BertTokenizer",
     "config": {
-        "name": "bert_tokenizer",
         "trainable": true,
         "dtype": "int32",
-        "vocabulary": null,
         "sequence_length": null,
-        "lowercase": true,
-        "strip_accents": false,
-        "split": true,
-        "suffix_indicator": "##",
-        "oov_token": "[UNK]"
     },
-    "registered_name": "keras_nlp>BertTokenizer"
 }

 {
+    "module": "keras_nlp.src.models.gpt2.gpt2_tokenizer",
+    "class_name": "GPT2Tokenizer",
     "config": {
+        "name": "gpt2_tokenizer",
         "trainable": true,
         "dtype": "int32",
         "sequence_length": null,
+        "add_prefix_space": false
     },
+    "registered_name": "keras_nlp>GPT2Tokenizer"
 }