Llama 3.1 Instruct 8B
MetaLlamaOpen WeightLlama 3.1 Community License
विवरण
Llama 3.1 8B Instruct is a multilingual large language model optimized for dialogue use cases. It features a 128K context length, state-of-the-art tool use, and strong reasoning capabilities.
रिलीज़ तिथि
2024-07-23
पैरामीटर
8.0B
संदर्भ लंबाई
16K
मोडैलिटीज़
text
क्षमता रडार
22
general
8
coding
14
reasoning
17
scienceअनुमानित
50
agents
0
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| Code Ranking | 420 | 10.0 | AA |
| General Ranking | 418 | 23.0 | AA |
| Math Reasoning | 324 | 14.0 | AA |
| Reasoning | 26 | 83.0 | LS |
| Science | 435 | 17.0 | AA |
बेंचमार्क स्कोर (LLM Stats)
Biology
GPQA
30.4%स्वयं
Code
HumanEval
72.6%स्वयं
Gorilla Benchmark API Bench
8.2%स्वयं
Finance
MMLU (CoT)
73.0%स्वयं
MMLU
69.4%स्वयं
MMLU-Pro
48.3%स्वयं
General
ARC-C
83.4%स्वयं
IFEval
80.4%स्वयं
BFCL
76.1%स्वयं
MBPP EvalPlus (base)
72.8%स्वयं
Multipl-E MBPP
52.4%स्वयं
Multipl-E HumanEval
50.8%स्वयं
Nexus
38.5%स्वयं
Math
GSM-8K (CoT)
84.5%स्वयं
Multilingual MGSM (CoT)
68.9%स्वयं
DROP
59.5%स्वयं
MATH (CoT)
51.9%स्वयं
Reasoning
API-Bank
82.6%स्वयं
AA मूल्यांकन सूचकांक
Intelligence Index11.8
Coding Index4.9
Math Index4.3
Math 5000.5
Mmlu Pro0.5
Ifbench0.3
Gpqa0.3
Tau20.2
Lcr0.2
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.1
Aime 250.0
Terminalbench Hard0.0
LLM Stats श्रेणी स्कोर
Structured Output80
Instruction Following80
Finance60
General60
Healthcare60
Language60
Legal60
Math60
Reasoning60
Tool Calling50
Code40
Biology30
Chemistry30
Physics30
मूल्य निर्धारण
इनपुट मूल्य$0.1 / 1M tokens
आउटपुट मूल्य$0.1 / 1M tokens
मिश्रित मूल्य (3:1)$0.1 / 1M tokens
गति
टोकन/सेकंड188.5 tokens/s
पहले टोकन में देरी0.47s
पहले उत्तर में देरी0.47s
उपलब्ध प्रदाता
(LS आंतरिक इकाइयाँ)कोई प्रदाता डेटा उपलब्ध नहीं