MZ's picture

3 2 1

MZ

Shahradmz

·

https://emzedi.github.io/website/#

EMZEDI

AI & ML interests

LLMs, Graph Learning, Temporal Graph Learning, RL, Continual RL, Optimization

Organizations

Papers 2

arXiv:2410.15460

arXiv:2401.17574

models 115

Shahradmz/Qwen2.5-0.5B-Instruct_cppo-reward_REWARD_1

0.5B • Updated May 12

Shahradmz/Qwen2.5-0.5B-Instruct_cppo-reward_REWARD_0

0.5B • Updated May 12

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_CPPO_1

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_CPPO_0

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_PPO_1

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_PPO_0

Shahradmz/Qwen2-1.5B-Instruct_cppo-reward_REWARD_0

2B • Updated Mar 25

Shahradmz/Qwen2-1.5B-Instruct_cppo-reward_REWARD_1

Shahradmz/Qwen2-0.5B-Reward_debug_mas

Text Classification • 0.5B • Updated Mar 19 • 1

Shahradmz/Qwen2-0.5B-Reward

View 115 models

datasets 12

Shahradmz/education_qna_hinted_qwen05

Viewer • Updated Mar 28 • 1 • 3

Shahradmz/education_qna_hinted

Viewer • Updated Mar 27 • 1 • 3

Shahradmz/education_summary_expert

Viewer • Updated Mar 27 • 1 • 3

Shahradmz/education_qna_hinted_static

Viewer • Updated Mar 26 • 1 • 3

Shahradmz/cppo_continual_dataset_rl_others

Viewer • Updated Mar 10 • 75.7k • 5

Shahradmz/cppo_continual_dataset_rl_relationships

Viewer • Updated Mar 10 • 93.9k • 12

Shahradmz/cppo_continual_dataset_reward_others

Viewer • Updated Mar 10 • 78.5k • 11

Shahradmz/cppo_continual_dataset_reward_relationships

Viewer • Updated Mar 10 • 97.4k • 3

Shahradmz/ca_constitution_1

Viewer • Updated Nov 25, 2024 • 33.7k • 6

Shahradmz/ca_constitution_2

Viewer • Updated Nov 23, 2024 • 35.8k • 4

View 12 datasets