メインコンテンツへスキップ

Llama 2 Chat 70B

MetaLlama

リリース日

2023-07-18

パラメータ

—

コンテキスト長

131K

モダリティ

text

能力レーダー

15

general

10

coding

16

reasoning

24

science推定

80

agents

0

multimodal

専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。

ランキング

ドメイン	#順位	スコア	ソース
コーディングランキング	449	10.0	AA
総合ランキング	474	16.0	AA
数学的推論	325	14.0	AA
科学	456	17.0	AA

ベンチマークスコア (LLM Stats)

Biology

GPQA

50.5%自己申告

Code

HumanEval

88.4%自己申告

Finance

MMLU

86.0%自己申告

MMLU-Pro

68.9%自己申告

General

IFEval

92.1%自己申告

MBPP EvalPlus

87.6%自己申告

BFCL v2

77.3%自己申告

Math

MGSM

91.1%自己申告

MATH

77.0%自己申告

AA評価指数

Intelligence Index

3.0

Mmlu Pro

0.4

Gpqa

0.3

Math 500

0.3

Livecodebench

0.1

Hle

0.1

Aime

0.0

LLM Statsカテゴリスコア

Instruction Following

90

Structured Output

90

Code

90

Language

80

Legal

80

Math

80

Reasoning

80

Finance

80

Healthcare

80

Tool Calling

80

General

70

Physics

50

Biology

50

Chemistry

50

価格設定

入力価格無料

出力価格無料

混合価格（3:1）無料

速度

トークン/秒0.0

初トークン遅延0.00s

初回答遅延0.00s

プロバイダー価格ランキング

プロバイダーデータがありません

外部リンク

Artificial Analysis