Llama 3.1 Instruct 8B
MetaLlamaOpen WeightLlama 3.1 Community License
説明
Llama 3.1 8B Instruct is a multilingual large language model optimized for dialogue use cases. It features a 128K context length, state-of-the-art tool use, and strong reasoning capabilities.
リリース日
2024-07-23
パラメータ
8.0B
コンテキスト長
16K
モダリティ
text
能力レーダー
22
general
8
coding
14
reasoning
17
science推定
50
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 420 | 10.0 | AA |
| General Ranking | 418 | 23.0 | AA |
| Math Reasoning | 324 | 14.0 | AA |
| Reasoning | 26 | 83.0 | LS |
| Science | 435 | 17.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
30.4%自己申告
Code
HumanEval
72.6%自己申告
Gorilla Benchmark API Bench
8.2%自己申告
Finance
MMLU (CoT)
73.0%自己申告
MMLU
69.4%自己申告
MMLU-Pro
48.3%自己申告
General
ARC-C
83.4%自己申告
IFEval
80.4%自己申告
BFCL
76.1%自己申告
MBPP EvalPlus (base)
72.8%自己申告
Multipl-E MBPP
52.4%自己申告
Multipl-E HumanEval
50.8%自己申告
Nexus
38.5%自己申告
Math
GSM-8K (CoT)
84.5%自己申告
Multilingual MGSM (CoT)
68.9%自己申告
DROP
59.5%自己申告
MATH (CoT)
51.9%自己申告
Reasoning
API-Bank
82.6%自己申告
AA評価指数
Intelligence Index11.8
Coding Index4.9
Math Index4.3
Math 5000.5
Mmlu Pro0.5
Ifbench0.3
Gpqa0.3
Tau20.2
Lcr0.2
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.1
Aime 250.0
Terminalbench Hard0.0
LLM Statsカテゴリスコア
Structured Output80
Instruction Following80
Finance60
General60
Healthcare60
Language60
Legal60
Math60
Reasoning60
Tool Calling50
Code40
Biology30
Chemistry30
Physics30
価格設定
入力価格$0.1 / 1M tokens
出力価格$0.1 / 1M tokens
混合価格(3:1)$0.1 / 1M tokens
速度
トークン/秒188.5 tokens/s
初トークン遅延0.47s
初回答遅延0.47s
利用可能なプロバイダー
(LS内部単位)プロバイダーデータがありません