plaguss
/

Mistral-7B-v0.1-Math-Shepherd-PRM-0.2

Token Classification

Generated from Trainer

stepwise-reward-trainer

text-generation-inference

Model card Files Files and versions

Mistral-7B-v0.1-Math-Shepherd-PRM-0.2 / README.md

Commit History

Update README.md

97f6149
verified

plaguss commited on Dec 11, 2024

End of training

9791a93
verified

plaguss commited on Dec 10, 2024

Model save

94c2016
verified

plaguss commited on Dec 10, 2024