Llama 65B
MetaLlama
发布日期
2023-02-24
参数规模
—
上下文长度
131K
支持模态
text
能力雷达图
2
general
90
coding
80
reasoning
43
science估算
80
agents
0
multimodal
Science 在缺少专门科学评测时使用推理能力代理估算。
排行榜排名
| 领域 | #排名 | 分数 | 来源 |
|---|---|---|---|
| 通用能力榜 | 532 | 2.0 | AA |
基准测试分数 (LLM Stats)
Biology
GPQA
50.5%自报
Code
HumanEval
88.4%自报
Finance
MMLU
86.0%自报
MMLU-Pro
68.9%自报
General
IFEval
92.1%自报
MBPP EvalPlus
87.6%自报
BFCL v2
77.3%自报
Math
MGSM
91.1%自报
MATH
77.0%自报
AA 评测指数
Intelligence Index2.1
LLM Stats 分类评分
Instruction Following90
Structured Output90
Code90
Language80
Legal80
Math80
Reasoning80
Finance80
Healthcare80
Tool Calling80
General70
Physics50
Biology50
Chemistry50
定价
输入价格免费
输出价格免费
混合价格(3:1)免费
速度
Tokens/秒0.0
首Token延迟0.00s
首回答延迟0.00s
供应商价格排行
暂无提供商数据