AI & ML interests
None defined yet.
Recent Activity
MultiRL/qwen3_4b_easy_rl_new
4B
•
Updated
•
87
MultiRL/qwen3_1.7b_easy_rl_gspo
2B
•
Updated
•
3
4B
•
Updated
•
61
MultiRL/qwen3_1.7b_easy_rl_final_step120
2B
•
Updated
•
2.45k
MultiRL/qwen3_4b_medium_rl_final
4B
•
Updated
•
345
MultiRL/qwen3_4b_sft_one_act
4B
•
Updated
•
63
MultiRL/qwen3_1.7b_easy_rl_reinforce_ori
2B
•
Updated
•
89
MultiRL/qwen3_1.7b_easy_rl_reinforce_alpha_0.5
2B
•
Updated
•
3
MultiRL/qwen3_1.7b_easy_rl_reinforce_alpha_1
2B
•
Updated
•
3
MultiRL/qwen3_1.7b_easy_rl_reinforce_alpha_0
2B
•
Updated
•
2
MultiRL/qwen3_1.7b_sft_one_act
2B
•
Updated
•
106
MultiRL/qwen3_1.7b_easy_rl_final
2B
•
Updated
•
869
MultiRL/qwen3_4b_easy_rl_final
4B
•
Updated
•
64
MultiRL/qwen3_1.7b_sft_final
2B
•
Updated
•
3.45k
MultiRL/qwen3_4b_sft_final
4B
•
Updated
•
169
MultiRL/qwen3_1.7b_easy_rl_new
2B
•
Updated
•
1
MultiRL/qwen3_4b_standard_medium_rl
4B
•
Updated
•
53
MultiRL/qwen3_4b_standard_easy_rl
4B
•
Updated
•
55
MultiRL/qwen3_4b_medium_rl_progress_C
MultiRL/qwen3_4b_medium_rl
4B
•
Updated
•
52
4B
•
Updated
•
33
MultiRL/qwen3_4b_instruct_sft
4B
•
Updated
•
66
MultiRL/qwen3_1.7b_easy_rl_test_task_group
MultiRL/qwen3_1.7b_easy_rl_test
2B
•
Updated
•
43
8B
•
Updated
•
28
MultiRL/qwen3_8b_sudoku_sft
8B
•
Updated
•
27
MultiRL/qwen3_1.7b_sudoku_sft
2B
•
Updated
•
107
MultiRL/qwen3_1.7b_easy_reinforce_batch_32_by_pass
2B
•
Updated
•
20
MultiRL/qwen3_1.7b_easy_reinforce_batch_64_by_pass
2B
•
Updated
MultiRL/qwen3_1.7b_easy_reinforce_test
2B
•
Updated
•
5