Yangyi Chen

YangyiYY

https://yangyi-chen.github.io/

AI & ML interests

Multimodal, Large Language Models

Recent Activity

liked a model 12 days ago

nvidia/Nemotron-Cascade-8B-Intermediate-ckpts

authored a paper 12 days ago

CRAFT: Customizing LLMs by Creating and Retrieving from Specialized Toolsets

authored a paper 12 days ago

R-Tuning: Teaching Large Language Models to Refuse Unknown Questions

View all activity

Organizations

None yet

upvoted a paper 13 days ago

Nemotron-Cascade: Scaling Cascaded Reinforcement Learning for General-Purpose Reasoning Models

Paper • 2512.13607 • Published 16 days ago • 26

upvoted a collection 15 days ago

Nemotron-Cascade

Collection

Scaling Cascaded Reinforcement Learning for General-Purpose Reasoning Models • 17 items • Updated 8 days ago • 40

upvoted a paper 28 days ago

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

Paper • 2511.21689 • Published Nov 26 • 111

upvoted a paper 6 months ago

Perception-Aware Policy Optimization for Multimodal Reasoning

Paper • 2507.06448 • Published Jul 8 • 47

upvoted a paper 7 months ago

ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

Paper • 2505.24864 • Published May 30 • 143

upvoted a paper 8 months ago

RM-R1: Reward Modeling as Reasoning

Paper • 2505.02387 • Published May 5 • 79

upvoted a paper 9 months ago

CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training

Paper • 2504.13161 • Published Apr 17 • 93

upvoted an article 10 months ago

Article

Putting RL back in RLHF

Jun 12, 2024

•

109

upvoted a paper 11 months ago

Mobile-Agent-E: Self-Evolving Mobile Assistant for Complex Tasks

Paper • 2501.11733 • Published Jan 20 • 28

upvoted a paper 12 months ago

OpenOmni: Large Language Models Pivot Zero-shot Omnimodal Alignment across Language with Real-time Self-Aware Emotional Speech Synthesis

Paper • 2501.04561 • Published Jan 8 • 17

Yangyi Chen

AI & ML interests

Recent Activity

Organizations

YangyiYY's activity

Putting RL back in RLHF