datasets: - litagin/moe-speech language: - ja
モデルのサイズは、LLMのモデルパラメータを参考した際に180M相当
"inter_channels": 576, "hidden_channels": 576, "filter_channels": 2046, "n_heads": 3, "n_layers": 18,