跳转到主要内容

Llama 3.1 Instruct 405B

MetaLlama开源权重Llama 3.1 Community License

描述

Llama 3.1 405B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks. The model supports 8 languages and has a 128K token context length.

发布日期
2024-07-23
参数规模
405.0B
上下文长度
支持模态
text

能力雷达图

27
general
30
coding
23
reasoning
34
science估算
70
agents
0
multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域#排名分数来源
代码能力榜323
25.0
AA
通用能力榜327
33.0
AA
数学推理303
20.0
AA
推理能力5
92.0
LS
科学能力318
35.0
AA

基准测试分数 (LLM Stats)

Biology

GPQA50.7%自报

Code

HumanEval89.0%自报
Gorilla Benchmark API Bench35.3%自报

Finance

MMLU (CoT)88.6%自报
MMLU87.3%自报
MMLU-Pro73.3%自报

General

ARC-C96.9%自报
MBPP EvalPlus88.6%自报
IFEval88.6%自报
BFCL88.5%自报
Multipl-E HumanEval75.2%自报
Multipl-E MBPP65.7%自报
Nexus58.7%自报

Math

GSM8k96.8%自报
Multilingual MGSM (CoT)91.6%自报
DROP84.8%自报
MATH73.8%自报

Reasoning

API-Bank92.0%自报

AA 评测指数

Intelligence Index
8.5
Math Index
3.0
Mmlu Pro
0.7
Math 500
0.7
Gpqa
0.5
Ifbench
0.4
Livecodebench
0.3
Scicode
0.3
Lcr
0.2
Aime
0.2
Tau2
0.2
Terminalbench Hard
0.1
Hle
0.0
Aime 25
0.0

LLM Stats 分类评分

Instruction Following
90
Math
90
Structured Output
90
Language
80
Legal
80
Reasoning
80
Finance
80
General
80
Healthcare
80
Tool Calling
70
Code
60
Physics
50
Biology
50
Chemistry
50

定价

输入价格$2.75 / 1M tokens
输出价格$6.5 / 1M tokens
混合价格(3:1)$3.688 / 1M tokens

速度

Tokens/秒60.6
首Token延迟0.68s
首回答延迟0.68s

供应商价格排行

供应商价格排行

7 个供应商

最便宜: Kilo Gateway最贵: Azure
供应商输入输出
1Kilo Gateway最便宜
$1
$1
2Venice AI
$1.1
$3
3Meta主要
$2.75
$6.5
4Synthetic
$3
$3
5Abacus
$3.5
$3.5
6Azure Cognitive Services
$5.33
$16
7Azure
$5.33
$16

比较该模型在不同 API 供应商之间的定价。

外部链接