Qwen2.5 14B Instruct
Alibaba Cloud / Qwen TeamQwenOpen WeightApache 2.0 · Commercial OK
描述
Qwen2.5-14B-Instruct is an instruction-tuned 14.7B parameter language model, part of the Qwen2.5 series. It features significant improvements in instruction following, long text generation (8K+ tokens), structured data understanding, and JSON output generation. The model supports a 128K token context length and multilingual capabilities across 29+ languages including Chinese, English, French, Spanish, and more.
發布日期
2024-09-19
參數規模
14.7B
上下文長度
—
支援模態
—
能力雷達圖
70
general
80
coding
70
reasoning
43
science估算
0
agents
0
multimodal
Science 在缺少專門科學評測時使用推理能力代理估算。
排行榜排名
| 領域 | #排名 | 分數 | 來源 |
|---|---|---|---|
| 推理能力 | 86 | 51.0 | LS |
基準測試分數 (LLM Stats)
Biology
GPQA
45.5%自報
Chemistry
MMLU-STEM
76.4%自報
Code
HumanEval
83.5%自報
Finance
MMLU
79.7%自報
MMLU-Pro
63.7%自報
TruthfulQA
58.4%自報
TheoremQA
43.0%自報
General
MBPP
0.82 / 100自報
MMLU-Redux
80.0%自報
MultiPL-E
72.8%自報
ARC-C
67.3%自報
MBPP+
63.2%自報
Language
BBH
78.2%自報
Math
GSM8k
94.8%自報
MATH
80.0%自報
Reasoning
HumanEval+
51.2%自報
AA 評測指數
暫無 AA 評測資料
LLM Stats 分類評分
Code80
General70
Healthcare70
Language70
Legal70
Math70
Reasoning70
Finance60
Biology50
Chemistry50
Physics40
定價
暫無定價資料
速度
暫無速度資料
可用提供商
(LS 內部計價單位)暫無提供商資料