Inference Optimization

community

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model about 11 hours ago

inference-optimization/gpt-oss-120b-ckpt4-speculator.eagle3

nm-research updated a model about 11 hours ago

inference-optimization/gpt-oss-120b-ckpt3-speculator.eagle3

ChibuUkachi updated a model about 11 hours ago

inference-optimization/Qwen3-Coder-Next.w4a16

View all activity

Collections 6

View 6 collections

models 167

datasets 3

inference-optimization/SWE-bench_Multilingual

Viewer • Updated 2 days ago • 300

inference-optimization/SWE-bench_Verified

Viewer • Updated 2 days ago • 500

inference-optimization/SWE-bench_Lite

Viewer • Updated 2 days ago • 323

Inference Optimization

AI & ML interests

Recent Activity

Collections 6

inference-optimization/test_tencentbac_fastmtp

inference-optimization/test_qwen3_next_mtp

inference-optimization/Qwen3-Next-80B-A3B-Instruct_mtp_speculator

inference-optimization/granite-4.0-h-tiny-FP8-block

RedHatAI/granite-4.0-h-tiny-FP8-dynamic

inference-optimization/granite-4.0-h-tiny-quantized.w4a16

inference-optimization/granite-4.0-h-tiny-NVFP4

inference-optimization/test_tencentbac_fastmtp

inference-optimization/test_qwen3_next_mtp

inference-optimization/Qwen3-Next-80B-A3B-Instruct_mtp_speculator

inference-optimization/granite-4.0-h-tiny-FP8-block

RedHatAI/granite-4.0-h-tiny-FP8-dynamic

inference-optimization/granite-4.0-h-tiny-quantized.w4a16

inference-optimization/granite-4.0-h-tiny-NVFP4

models 167

inference-optimization/gpt-oss-120b-ckpt4-speculator.eagle3

inference-optimization/gpt-oss-120b-ckpt3-speculator.eagle3

inference-optimization/Qwen3-Coder-Next.w4a16

inference-optimization/Qwen3-32B-Thinking-speculator.eagle3

inference-optimization/DeepSeek-R1-NVFP4-FP8-BLOCK

inference-optimization/Llama-3.2-3B-Instruct_7_bits_mode_heuristic

inference-optimization/Llama-3.2-3B-Instruct_7_bits_mode_noise

inference-optimization/Llama-3.2-3B-Instruct_7_bits_mode_hybrid

inference-optimization/Llama-3.2-3B-Instruct_6.5_bits_mode_heuristic

inference-optimization/Llama-3.2-3B-Instruct_6.5_bits_mode_noise

datasets 3

inference-optimization/SWE-bench_Multilingual

inference-optimization/SWE-bench_Verified

inference-optimization/SWE-bench_Lite

AI & ML interests

Recent Activity

Team members 14

Collections 6

models 167 Sort: Recently updated

datasets 3 Sort: Recently updated

models 167

datasets 3