4 9 1

Yikun B

Yikunb

AI & ML interests

Reinforcement Learning

Recent Activity

authored a paper about 15 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

upvoted a paper about 21 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

submitted a paper about 21 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

View all activity

Organizations

None yet

authored a paper about 15 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published 15 days ago • 95

upvoted a paper about 21 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published 15 days ago • 95

submitted a paper to Daily Papers about 21 hours ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published 15 days ago • 95

liked a model 11 days ago

chhao/Weak-Driven-Learning

Text Generation • Updated 10 days ago • 54 • 5

commented a paper 14 days ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 15 days ago • 265 •

authored a paper 14 days ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 15 days ago • 265

submitted a paper to Daily Papers 14 days ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 15 days ago • 265

upvoted a paper 14 days ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published 15 days ago • 265

authored a paper 21 days ago

Real-Time Aligned Reward Model beyond Semantics

Paper • 2601.22664 • Published 25 days ago • 13

upvoted a paper 22 days ago

Real-Time Aligned Reward Model beyond Semantics

Paper • 2601.22664 • Published 25 days ago • 13

submitted a paper to Daily Papers 22 days ago

Real-Time Aligned Reward Model beyond Semantics

Paper • 2601.22664 • Published 25 days ago • 13

upvoted 2 papers about 1 month ago

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 197

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 154

upvoted a collection about 1 month ago

cool-papers

Collection

95 items • Updated 4 days ago • 8

submitted a paper to Daily Papers about 1 month ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 154

authored 2 papers about 1 month ago

Transformer Copilot: Learning from The Mistake Log in LLM Fine-tuning

Paper • 2505.16270 • Published May 22, 2025 • 6

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 154

commented 2 papers about 1 month ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 154 •

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 154 •

upvoted a paper 5 months ago

TaTToo: Tool-Grounded Thinking PRM for Test-Time Scaling in Tabular Reasoning

Paper • 2510.06217 • Published Oct 7, 2025 • 65

Yikun B

AI & ML interests

Recent Activity

Organizations

Yikunb's activity