SRFT - a Yuqian-Fu Collection

Yuqian-Fu 's Collections

SRFT

SRFT

updated Sep 28, 2025

SRFT: A Single-Stage Method with Supervised and Reinforcement Fine-Tuning for Reasoning

Paper • 2506.19767 • Published Jun 24, 2025 • 15
Yuqian-Fu/SRFT-Qwen2.5-Math-7B

Text Generation • 8B • Updated Jul 24, 2025 • 33 • 3
Yuqian-Fu/SRFT-Qwen2.5-7B-Instruct

8B • Updated Jul 24, 2025 • 4
Yuqian-Fu/SRFT-Qwen2.5-Math-1.5B

2B • Updated Jul 24, 2025 • 5
Elliott/Openr1-Math-46k-8192

Viewer • Updated Apr 23, 2025 • 45.8k • 637 • 8