4 1306

Shaobai Jiang

shaobaij

AI & ML interests

None yet

Recent Activity

upvoted a paper about 9 hours ago

AgentIR: Reasoning-Aware Retrieval for Deep Research Agents

upvoted a paper about 9 hours ago

NOBLE: Accelerating Transformers with Nonlinear Low-Rank Branches

upvoted a paper about 9 hours ago

Progressive Residual Warmup for Language Model Pretraining

View all activity

Organizations

None yet

upvoted 3 papers about 9 hours ago

upvoted a paper about 12 hours ago

Learning Personalized Agents from Human Feedback

Paper • 2602.16173 • Published 20 days ago • 9

upvoted 3 papers 2 days ago

T2S-Bench & Structure-of-Thought: Benchmarking and Prompting Comprehensive Text-to-Structure Reasoning

Paper • 2603.03790 • Published 6 days ago • 112

SkillNet: Create, Evaluate, and Connect AI Skills

Paper • 2603.04448 • Published 12 days ago • 76

Memex(RL): Scaling Long-Horizon LLM Agents via Indexed Experience Memory

Paper • 2603.04257 • Published 6 days ago • 18

upvoted 13 papers 3 days ago

If You Want Coherence, Orchestrate a Team of Rivals: Multi-Agent Models of Organizational Intelligence

Paper • 2601.14351 • Published Jan 20 • 1

F-GRPO: Don't Let Your Policy Learn the Obvious and Forget the Rare

Paper • 2602.06717 • Published Feb 6 • 72

POPE: Learning to Reason on Hard Problems via Privileged On-Policy Exploration

Paper • 2601.18779 • Published Jan 26 • 1

VERGE: Formal Refinement and Guidance Engine for Verifiable LLM Reasoning

Paper • 2601.20055 • Published Jan 27 • 7

Mechanistic Data Attribution: Tracing the Training Origins of Interpretable LLM Units

Paper • 2601.21996 • Published Jan 29 • 5

MAD: Modality-Adaptive Decoding for Mitigating Cross-Modal Hallucinations in Multimodal Large Language Models

Paper • 2601.21181 • Published Jan 29 • 9

Statistical Estimation of Adversarial Risk in Large Language Models under Best-of-N Sampling

Paper • 2601.22636 • Published Jan 30 • 22

THINKSAFE: Self-Generated Safety Alignment for Reasoning Models

Paper • 2601.23143 • Published Jan 30 • 39

SAGE: Steerable Agentic Data Generation for Deep Search with Execution Feedback

Paper • 2601.18202 • Published Jan 26 • 9

Continual GUI Agents

Paper • 2601.20732 • Published Jan 28 • 5

OmegaUse: Building a General-Purpose GUI Agent for Autonomous Task Execution

Paper • 2601.20380 • Published Jan 28 • 9

Scaling Multiagent Systems with Process Rewards

Paper • 2601.23228 • Published Jan 30 • 8

Spark: Strategic Policy-Aware Exploration via Dynamic Branching for Long-Horizon Agentic Learning

Paper • 2601.20209 • Published Jan 28 • 23

Shaobai Jiang

AI & ML interests

Recent Activity

Organizations

shaobaij's activity