メインコンテンツへスキップ

Llama 2 Chat 70B

MetaLlama
リリース日
2023-07-18
パラメータ
コンテキスト長
131K
モダリティ
text

能力レーダー

15
general
10
coding
16
reasoning
24
science推定
80
agents
0
multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン#順位スコアソース
コーディングランキング449
10.0
AA
総合ランキング474
16.0
AA
数学的推論325
14.0
AA
科学456
17.0
AA

ベンチマークスコア (LLM Stats)

Biology

GPQA50.5%自己申告

Code

HumanEval88.4%自己申告

Finance

MMLU86.0%自己申告
MMLU-Pro68.9%自己申告

General

IFEval92.1%自己申告
MBPP EvalPlus87.6%自己申告
BFCL v277.3%自己申告

Math

MGSM91.1%自己申告
MATH77.0%自己申告

AA評価指数

Intelligence Index
3.0
Mmlu Pro
0.4
Gpqa
0.3
Math 500
0.3
Livecodebench
0.1
Hle
0.1
Aime
0.0

LLM Statsカテゴリスコア

Instruction Following
90
Structured Output
90
Code
90
Language
80
Legal
80
Math
80
Reasoning
80
Finance
80
Healthcare
80
Tool Calling
80
General
70
Physics
50
Biology
50
Chemistry
50

価格設定

入力価格無料
出力価格無料
混合価格(3:1)無料

速度

トークン/秒0.0
初トークン遅延0.00s
初回答遅延0.00s

プロバイダー価格ランキング

プロバイダーデータがありません

外部リンク