Llama 3.1 Instruct 405B
MetaLlamaOpen WeightLlama 3.1 Community License
विवरण
Llama 3.1 405B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks. The model supports 8 languages and has a 128K token context length.
रिलीज़ तिथि
2024-07-23
पैरामीटर
405.0B
संदर्भ लंबाई
—
मोडैलिटीज़
text
क्षमता रडार
32
general
22
coding
23
reasoning
34
scienceअनुमानित
70
agents
0
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| Code Ranking | 296 | 25.0 | AA |
| General Ranking | 289 | 37.0 | AA |
| Math Reasoning | 303 | 20.0 | AA |
| Reasoning | 5 | 92.0 | LS |
| Science | 293 | 36.0 | AA |
बेंचमार्क स्कोर (LLM Stats)
Biology
GPQA
50.7%स्वयं
Code
HumanEval
89.0%स्वयं
Gorilla Benchmark API Bench
35.3%स्वयं
Finance
MMLU (CoT)
88.6%स्वयं
MMLU
87.3%स्वयं
MMLU-Pro
73.3%स्वयं
General
ARC-C
96.9%स्वयं
MBPP EvalPlus
88.6%स्वयं
IFEval
88.6%स्वयं
BFCL
88.5%स्वयं
Multipl-E HumanEval
75.2%स्वयं
Multipl-E MBPP
65.7%स्वयं
Nexus
58.7%स्वयं
Math
GSM8k
96.8%स्वयं
Multilingual MGSM (CoT)
91.6%स्वयं
DROP
84.8%स्वयं
MATH
73.8%स्वयं
Reasoning
API-Bank
92.0%स्वयं
AA मूल्यांकन सूचकांक
Intelligence Index17.4
Coding Index14.5
Math Index3.0
Mmlu Pro0.7
Math 5000.7
Gpqa0.5
Ifbench0.4
Livecodebench0.3
Scicode0.3
Lcr0.2
Aime0.2
Tau20.2
Terminalbench Hard0.1
Hle0.0
Aime 250.0
LLM Stats श्रेणी स्कोर
Structured Output90
Instruction Following90
Math90
Finance80
General80
Healthcare80
Language80
Legal80
Reasoning80
Tool Calling70
Code60
Biology50
Chemistry50
Physics50
मूल्य निर्धारण
इनपुट मूल्य$2.75 / 1M tokens
आउटपुट मूल्य$6.5 / 1M tokens
मिश्रित मूल्य (3:1)$3.688 / 1M tokens
गति
टोकन/सेकंड31.5 tokens/s
पहले टोकन में देरी0.69s
पहले उत्तर में देरी0.69s
उपलब्ध प्रदाता
(LS आंतरिक इकाइयाँ)कोई प्रदाता डेटा उपलब्ध नहीं