kunjcr2
/

MedAssistGPT

v2_pretrain_medassist

Model card Files Files and versions

kunjcr2 commited on 14 days ago

Commit

43e40b8

·

verified ·

1 Parent(s): 50c8b86

Update modeling_medassistgpt.py

Files changed (1) hide show

modeling_medassistgpt.py +14 -0

modeling_medassistgpt.py CHANGED Viewed

@@ -105,6 +105,20 @@ class MedAssistGPTModel(PreTrainedModel):
         elif isinstance(module, nn.Embedding):
             nn.init.normal_(module.weight, mean=0.0, std=0.02)
     def forward(self, input_ids, labels=None):
         h = self.embed(input_ids)
         for blk in self.blocks:

         elif isinstance(module, nn.Embedding):
             nn.init.normal_(module.weight, mean=0.0, std=0.02)
+    def prepare_inputs_for_generation(
+        self, input_ids, past_key_values=None, attention_mask=None, use_cache=None, **kwargs
+    ):
+        # If past_key_values is provided, only use the last token
+        if past_key_values is not None:
+            input_ids = input_ids[:, -1:]
+        return {
+            "input_ids": input_ids,
+            "past_key_values": past_key_values,
+            "use_cache": use_cache,
+            "attention_mask": attention_mask,
+        }
     def forward(self, input_ids, labels=None):
         h = self.embed(input_ids)
         for blk in self.blocks: