Llama 3.1 Instruct 70B
MetaLlamaOpen WeightLlama 3.1 Community License
विवरण
Llama 3.1 70B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks.
रिलीज़ तिथि
2024-07-23
पैरामीटर
70.0B
संदर्भ लंबाई
131K
मोडैलिटीज़
text
क्षमता रडार
28
general
17
coding
20
reasoning
29
scienceअनुमानित
70
agents
0
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| Code Ranking | 385 | 15.0 | AA |
| General Ranking | 367 | 30.0 | AA |
| Math Reasoning | 306 | 19.0 | AA |
| Reasoning | 10 | 90.0 | LS |
| Science | 357 | 30.0 | AA |
बेंचमार्क स्कोर (LLM Stats)
Biology
GPQA
41.7%स्वयं
Code
HumanEval
80.5%स्वयं
Gorilla Benchmark API Bench
29.7%स्वयं
Finance
MMLU (CoT)
86.0%स्वयं
MMLU
83.6%स्वयं
MMLU-Pro
66.4%स्वयं
General
ARC-C
94.8%स्वयं
IFEval
87.5%स्वयं
MBPP ++ base version
86.0%स्वयं
BFCL
84.8%स्वयं
Multipl-E HumanEval
65.5%स्वयं
Multipl-E MBPP
62.0%स्वयं
Nexus
56.7%स्वयं
Math
GSM-8K (CoT)
95.1%स्वयं
Multilingual MGSM (CoT)
86.9%स्वयं
DROP
79.6%स्वयं
MATH (CoT)
68.0%स्वयं
Reasoning
API-Bank
90.0%स्वयं
AA मूल्यांकन सूचकांक
Intelligence Index12.5
Coding Index10.9
Math Index4.0
Mmlu Pro0.7
Math 5000.6
Gpqa0.4
Ifbench0.3
Scicode0.3
Livecodebench0.2
Aime0.2
Tau20.2
Lcr0.1
Hle0.0
Aime 250.0
Terminalbench Hard0.0
LLM Stats श्रेणी स्कोर
Structured Output90
Instruction Following90
Finance80
Healthcare80
Language80
Legal80
Math80
Tool Calling70
General70
Reasoning70
Code60
Biology40
Chemistry40
Physics40
मूल्य निर्धारण
इनपुट मूल्य$0.56 / 1M tokens
आउटपुट मूल्य$0.56 / 1M tokens
मिश्रित मूल्य (3:1)$0.56 / 1M tokens
गति
टोकन/सेकंड33.0 tokens/s
पहले टोकन में देरी0.62s
पहले उत्तर में देरी0.62s
उपलब्ध प्रदाता
(LS आंतरिक इकाइयाँ)कोई प्रदाता डेटा उपलब्ध नहीं