AI & ML interests
None defined yet.
Recent Activity
MultiRL/qwen3_4b_easy_rl_final
4B
•
Updated
•
617
MultiRL/qwen3_1.7b_sft_final
2B
•
Updated
•
5.73k
MultiRL/qwen3_4b_sft_final
4B
•
Updated
•
1.68k
MultiRL/qwen3_1.7b_easy_rl_new
2B
•
Updated
•
2
MultiRL/qwen3_4b_standard_medium_rl
4B
•
Updated
•
438
MultiRL/qwen3_4b_standard_easy_rl
4B
•
Updated
•
693
MultiRL/qwen3_4b_medium_rl_progress_C
4B
•
Updated
•
2
MultiRL/qwen3_4b_medium_rl
4B
•
Updated
•
256
4B
•
Updated
•
78
MultiRL/qwen3_4b_instruct_sft
4B
•
Updated
•
459
MultiRL/qwen3_1.7b_easy_rl_test_task_group
2B
•
Updated
•
3
MultiRL/qwen3_1.7b_easy_rl_test
2B
•
Updated
•
168
8B
•
Updated
•
67
MultiRL/qwen3_8b_sudoku_sft
8B
•
Updated
•
60
MultiRL/qwen3_1.7b_sudoku_sft
2B
•
Updated
•
1.42k
MultiRL/qwen3_1.7b_easy_reinforce_batch_32_by_pass
2B
•
Updated
•
56
MultiRL/qwen3_1.7b_easy_reinforce_batch_64_by_pass
2B
•
Updated
•
3
MultiRL/qwen3_1.7b_easy_reinforce_test
2B
•
Updated
•
41
MultiRL/qwen3_1.7b_C_easy_gspo_test
2B
•
Updated
•
44
MultiRL/qwen3_1.7b_base_C_normal_short_sft_lr_1e_5_C_easy_grpo_step70
2B
•
Updated
•
35
MultiRL/qwen3_1.7b_C_short_sft_lr_1e_5_C_easy_reinforce_step80
2B
•
Updated
•
27
MultiRL/qwen3_1.7b_base_C_normal_concise_sft_lr_5e_6
2B
•
Updated
•
27
MultiRL/qwen3_1.7b_base_C_easy_short_sft_lr_1e_6
2B
•
Updated
•
24
MultiRL/qwen3_1.7b_format_rl
2B
•
Updated
•
28
MultiRL/qwen3_1.7b_base_C_normal_short_sft_lr_5e_6
2B
•
Updated
•
25
MultiRL/qwen3_1.7b_base_B_normal_short_sft_lr_1e_5
2B
•
Updated
•
28
MultiRL/qwen3_1.7b_base_A_normal_short_sft_lr_1e_5
2B
•
Updated
•
15
MultiRL/qwen3_1.7b_base_C_normal_short_sft_lr_1e_5
2B
•
Updated
•
56
MultiRL/qwen3_1.7b_base_C_normal_sft_lr_1e_5
2B
•
Updated
•
17
MultiRL/qwen3_1.7b_base_B_normal_sft_lr_1e_5
2B
•
Updated
•
2