Dawn

LegendaryDawn

AI & ML interests

None yet

Recent Activity

updated a model 2 days ago

LegendaryDawn/SDRL-freq-Qwen3-8B-Base-majority_n8_l4096-DAPO_n8_bs256_long12-yarn2-step200

published a model 2 days ago

LegendaryDawn/SDRL-freq-Qwen3-8B-Base-majority_n8_l4096-DAPO_n8_bs256_long12-yarn2-step200

updated a model 4 days ago

LegendaryDawn/SDRL-freq-Qwen3-8B-Base-majority_n8_l4096-DAPO_n8_bs256_long12-yarn2-step125

View all activity

Organizations

None yet

updated a model 2 days ago

LegendaryDawn/SDRL-freq-Qwen3-8B-Base-majority_n8_l4096-DAPO_n8_bs256_long12-yarn2-step200

8B • Updated 2 days ago • 36

published a model 2 days ago

LegendaryDawn/SDRL-freq-Qwen3-8B-Base-majority_n8_l4096-DAPO_n8_bs256_long12-yarn2-step200

8B • Updated 2 days ago • 36

updated a model 4 days ago

LegendaryDawn/SDRL-freq-Qwen3-8B-Base-majority_n8_l4096-DAPO_n8_bs256_long12-yarn2-step125

8B • Updated 4 days ago • 7

published a model 4 days ago

LegendaryDawn/SDRL-freq-Qwen3-8B-Base-majority_n8_l4096-DAPO_n8_bs256_long12-yarn2-step125

8B • Updated 4 days ago • 7

updated a model 4 days ago

LegendaryDawn/SDRL-rand-Qwen3-8B-Base-random_n8_l4096-DAPO_n8_bs256_long12-yarn2-step125

8B • Updated 4 days ago • 9

published a model 4 days ago

LegendaryDawn/SDRL-rand-Qwen3-8B-Base-random_n8_l4096-DAPO_n8_bs256_long12-yarn2-step125

8B • Updated 4 days ago • 9

updated a model 6 days ago

LegendaryDawn/SDRL-rand-Qwen3-8B-Base-random_n8_l4096-DAPO_n8_bs256_long12-yarn2-step200

8B • Updated 6 days ago • 36

published a model 6 days ago

LegendaryDawn/SDRL-rand-Qwen3-8B-Base-random_n8_l4096-DAPO_n8_bs256_long12-yarn2-step200

8B • Updated 6 days ago • 36

upvoted 2 papers 7 days ago

Prepare Reasoning Language Models for Multi-Agent Debate with Self-Debate Reinforcement Learning

Paper • 2601.22297 • Published 21 days ago • 2

PhyCritic: Multimodal Critic Models for Physical AI

Paper • 2602.11124 • Published 8 days ago • 51

updated a model 8 days ago

LegendaryDawn/SDRL-baseline-Qwen3-8B-Base-DAPO-n8-bs256-long12-yarn2-step200

8B • Updated 8 days ago • 35

published a model 8 days ago

LegendaryDawn/SDRL-baseline-Qwen3-8B-Base-DAPO-n8-bs256-long12-yarn2-step200

8B • Updated 8 days ago • 35

updated a model 14 days ago

LegendaryDawn/SDRL-freq-Qwen3-8B-Base-majority_n8_l4096-DAPO_n8_bs256_long8-step200

8B • Updated 14 days ago • 410

published a model 14 days ago

LegendaryDawn/SDRL-freq-Qwen3-8B-Base-majority_n8_l4096-DAPO_n8_bs256_long8-step200

8B • Updated 14 days ago • 410

updated a model 15 days ago

LegendaryDawn/SDRL-rand-Qwen3-8B-Base-random_n8_l4096-DAPO_n8_bs256_long8-step200

8B • Updated 15 days ago • 411

published a model 15 days ago

LegendaryDawn/SDRL-rand-Qwen3-8B-Base-random_n8_l4096-DAPO_n8_bs256_long8-step200

8B • Updated 15 days ago • 411

updated a model 16 days ago

LegendaryDawn/SDRL-baseline-Qwen3-8B-Base-DAPO-n8-bs256-long8-step200

8B • Updated 16 days ago • 394

published a model 16 days ago

LegendaryDawn/SDRL-baseline-Qwen3-8B-Base-DAPO-n8-bs256-long8-step200

8B • Updated 16 days ago • 394

updated a model 23 days ago

LegendaryDawn/SDRL-rand-Qwen3-4B-Base-icml-self-debate-random_n8_l2048-DAPO_n8_bs256_long8-step200

4B • Updated 23 days ago • 79

published a model 23 days ago

LegendaryDawn/SDRL-rand-Qwen3-4B-Base-icml-self-debate-random_n8_l2048-DAPO_n8_bs256_long8-step200

4B • Updated 23 days ago • 79

Dawn

AI & ML interests

Recent Activity

Organizations

LegendaryDawn's activity