ibndias
/

Qwen2.5-1.5B-Open-R1-GRPO1st

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen2.5-1.5B-Open-R1-GRPO1st / train_results.json

ibndias's picture

Model save

6423c7f verified 10 months ago

history blame contribute delete

202 Bytes

	{
	"total_flos": 0.0,
	"train_loss": 0.025075771342079053,
	"train_runtime": 60646.5116,
	"train_samples": 72441,
	"train_samples_per_second": 1.194,
	"train_steps_per_second": 0.011
	}