ghostai1
/

GHOSTSONAFB

Model card Files Files and versions

ghostai1 commited on May 11

Commit

758bfe8

·

verified ·

1 Parent(s): 866f7ce

Update barks.py

Files changed (1) hide show

barks.py +4 -2

barks.py CHANGED Viewed

@@ -303,9 +303,11 @@ def generate_vocals(vocal_prompt: str, total_duration: int):
         # Convert to numpy and create AudioSegment
         vocal_array = vocal_array.cpu().numpy().squeeze()
-        sample_rate = bark_model.config.sampling_rate
         temp_vocal_path = "temp_vocal.wav"
-        torchaudio.save(temp_vocal_path, torch.tensor(vocal_array).unsqueeze(0), sample_rate)
         vocal_segment = AudioSegment.from_wav(temp_vocal_path)
         os.remove(temp_vocal_path)

         # Convert to numpy and create AudioSegment
         vocal_array = vocal_array.cpu().numpy().squeeze()
+        sample_rate = 24000  # Default sample rate for suno/bark-small
         temp_vocal_path = "temp_vocal.wav"
+        # Convert tensor to float32 for torchaudio.save compatibility
+        vocal_tensor = torch.tensor(vocal_array, dtype=torch.float32).unsqueeze(0)
+        torchaudio.save(temp_vocal_path, vocal_tensor, sample_rate)
         vocal_segment = AudioSegment.from_wav(temp_vocal_path)
         os.remove(temp_vocal_path)