Qwen2.5 32B Instruct
Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Commercial OK
描述
Qwen2.5-32B-Instruct is an instruction-tuned 32 billion parameter language model, part of the Qwen2.5 series. It is designed to follow instructions, generate long texts (over 8K tokens), understand structured data (e.g., tables), and generate structured outputs, especially JSON. The model supports multilingual capabilities across over 29 languages.
發布日期
2024-09-19
參數規模
32.5B
上下文長度
—
支援模態
—
能力雷達圖
70
general
90
coding
80
reasoning
43
science估算
0
agents
0
multimodal
Science 在缺少專門科學評測時使用推理能力代理估算。
排行榜排名
| 領域 | #排名 | 分數 | 來源 |
|---|---|---|---|
| 推理能力 | 48 | 69.0 | LS |
基準測試分數 (LLM Stats)
Biology
GPQA
49.5%自報
Chemistry
MMLU-STEM
80.9%自報
Code
HumanEval
88.4%自報
Finance
MMLU
83.3%自報
MMLU-Pro
69.0%自報
TruthfulQA
57.8%自報
TheoremQA
44.1%自報
General
MBPP
0.84 / 100自報
MMLU-Redux
83.9%自報
MultiPL-E
75.4%自報
ARC-C
70.4%自報
MBPP+
67.2%自報
Language
BBH
84.5%自報
Winogrande
82.0%自報
Math
GSM8k
95.9%自報
MATH
83.1%自報
Reasoning
HellaSwag
85.2%自報
HumanEval+
52.4%自報
AA 評測指數
暫無 AA 評測資料
LLM Stats 分類評分
Code90
Language80
Math80
General70
Healthcare70
Legal70
Reasoning70
Finance60
Biology50
Chemistry50
Physics50
定價
暫無定價資料
速度
暫無速度資料
可用提供商
(LS 內部計價單位)暫無提供商資料