gpt-oss-120B (high)
OpenAIOpen WeightApache 2.0 · Commercial OK
विवरण
GPT-OSS-120B is an open-weight, 116.8B-parameter Mixture-of-Experts (MoE) language model from OpenAI designed for high-reasoning, agentic, and general-purpose production use cases. It activates 5.1B parameters per forward pass and is optimized to run on a single H100 GPU with native MXFP4 quantization. The model supports configurable reasoning depth, full chain-of-thought access, and native tool use, including function calling, browsing, and structured output generation. It achieves near-parity with OpenAI o4-mini on core reasoning benchmarks. Note: While referred to as '120b' for simplicity, it technically has 116.8B parameters.
रिलीज़ तिथि
2025-08-05
पैरामीटर
116.8B
संदर्भ लंबाई
131K
मोडैलिटीज़
text
क्षमता रडार
45
general
50
coding
91
reasoning
53
scienceअनुमानित
70
agents
0
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| Code Ranking | 100 | 60.0 | AA |
| General Ranking | 91 | 68.0 | AA |
| Math Reasoning | 22 | 94.0 | AA |
| Science | 94 | 62.0 | AA |
बेंचमार्क स्कोर (LLM Stats)
Biology
GPQA
80.1%स्वयं
Communication
TAU-bench Retail
67.8%स्वयं
Finance
MMLU
90.0%स्वयं
Healthcare
HealthBench
57.6%स्वयं
HealthBench Hard
30.0%स्वयं
Math
CodeForces
0.82 / 3000स्वयं
Humanity's Last Exam
14.9%स्वयं
AA मूल्यांकन सूचकांक
Math Index93.4
Intelligence Index33.3
Coding Index28.6
Aime 250.9
Livecodebench0.9
Mmlu Pro0.8
Gpqa0.8
Ifbench0.7
Tau20.7
Lcr0.5
Scicode0.4
Terminalbench Hard0.2
Hle0.2
LLM Stats श्रेणी स्कोर
Finance90
General90
Language90
Legal90
Biology80
Chemistry80
Physics80
Tool Calling70
Communication70
Reasoning70
Healthcare60
Math60
Vision10
मूल्य निर्धारण
इनपुट मूल्य$0.15 / 1M tokens
आउटपुट मूल्य$0.6 / 1M tokens
मिश्रित मूल्य (3:1)$0.262 / 1M tokens
गति
टोकन/सेकंड251.0 tokens/s
पहले टोकन में देरी0.50s
पहले उत्तर में देरी8.47s
उपलब्ध प्रदाता
(LS आंतरिक इकाइयाँ)| प्रदाता | इनपुट मूल्य | आउटपुट मूल्य |
|---|---|---|
| DeepInfra | 90K | 450K |
| OpenAI | 100K | 500K |
| Novita | 100K | 500K |
| Fireworks | 150K | 600K |
| Groq | 150K | 600K |