13 9 132

Pritish Mishra

pritish

AI & ML interests

Machine Learning, Computer Vision, NLP, ODML, ML Ops

Recent Activity

liked a model 5 days ago

Qwen/Qwen3.5-397B-A17B

upvoted an article 6 days ago

KV Caching Explained: Optimizing Transformer Inference Efficiency

liked a model 24 days ago

arcee-ai/Trinity-Large-Preview

View all activity

Organizations

None yet

liked a model 5 days ago

Qwen/Qwen3.5-397B-A17B

Image-Text-to-Text • Updated 1 day ago • 133k • • 812

upvoted an article 6 days ago

Article

KV Caching Explained: Optimizing Transformer Inference Efficiency

Jan 30, 2025

•

233

liked a model 24 days ago

arcee-ai/Trinity-Large-Preview

Text Generation • 399B • Updated 1 day ago • 1.91k • 144

upvoted an article 25 days ago

Article

Transformers v5: Simple model definitions powering the AI ecosystem

Dec 1, 2025

•

299

liked 5 models about 1 month ago

liked a model about 2 months ago

LiquidAI/LFM2.5-Audio-1.5B

Audio-to-Audio • Updated Jan 6 • 1.24k • 347

upvoted a collection 2 months ago

NVIDIA Nemotron v3

Collection

Open, Production-ready Enterprise Models • 7 items • Updated 17 days ago • 143

liked 3 models 3 months ago

arcee-ai/Trinity-Mini

Text Generation • Updated Dec 11, 2025 • 7.06k • • 178

nari-labs/Dia2-2B

Text-to-Speech • Updated Dec 1, 2025 • 9.76k • 157

baidu/ERNIE-4.5-VL-28B-A3B-Thinking

Image-Text-to-Text • 30B • Updated 4 days ago • 663 • 521

liked 4 models 4 months ago

moonshotai/Kimi-K2-Thinking

Text Generation • Updated 22 days ago • 283k • • 1.67k

unsloth/Qwen3-14B

Updated May 13, 2025 • 18.6k • 15

unsloth/Qwen3-30B-A3B-Instruct-2507-GGUF

31B • Updated Jul 31, 2025 • 56.1k • 291

deepseek-ai/DeepSeek-OCR

Image-Text-to-Text • Updated Nov 4, 2025 • 3.19M • 3.16k

liked 2 models 5 months ago

google/embeddinggemma-300m

Qwen/Qwen3-30B-A3B-Instruct-2507-FP8

Text Generation • 31B • Updated Sep 17, 2025 • 756k • 112

Pritish Mishra

AI & ML interests

Recent Activity

Organizations

pritish's activity

KV Caching Explained: Optimizing Transformer Inference Efficiency

Transformers v5: Simple model definitions powering the AI ecosystem