ERNIE 4.5 300B A47B
BaiduProprietary
説明
ERNIE 4.5 is an enhanced version of ERNIE 4.0 with improved reasoning capabilities, better instruction following, and stronger performance across multiple domains including mathematics, coding, and creative writing. Features advanced knowledge integration, multilingual support, and optimized thinking capabilities. This 21B parameter model uses A3B quantization for efficient inference.
リリース日
2025-06-30
パラメータ
21.0B
コンテキスト長
123K
モダリティ
text
能力レーダー
32
general
27
coding
55
reasoning
48
science推定
0
agents
0
multimodal
専門的な科学ベンチマークが利用できない場合、Scienceは推論プロキシを使用して推定します。
ランキング
| ドメイン | #順位 | スコア | ソース |
|---|---|---|---|
| Code Ranking | 311 | 23.0 | AA |
| General Ranking | 343 | 32.0 | AA |
| Math Reasoning | 163 | 54.0 | AA |
| Reasoning | 101 | 29.0 | LS |
| Science | 194 | 48.0 | AA |
ベンチマークスコア (LLM Stats)
Biology
GPQA
74.0%自己申告
Factuality
SimpleQA
1.8%自己申告
Finance
MMLU
41.9%自己申告
MMLU-Pro
16.0%自己申告
General
ARC-E
60.7%自己申告
PIQA
55.2%自己申告
MMLU-Redux
43.2%自己申告
C-Eval
40.7%自己申告
ARC-C
40.6%自己申告
MBPP+
40.2%自己申告
CMMLU
39.8%自己申告
AGIEval
28.5%自己申告
Language
Winogrande
51.3%自己申告
CLUEWSC
48.6%自己申告
BBH
30.4%自己申告
Math
DROP
28.6%自己申告
GSM8k
25.2%自己申告
MATH
12.4%自己申告
Reasoning
HellaSwag
33.0%自己申告
HumanEval+
25.0%自己申告
AA評価指数
Math Index41.3
Intelligence Index15.0
Coding Index14.5
Math 5000.9
Gpqa0.8
Mmlu Pro0.8
Aime0.5
Livecodebench0.5
Aime 250.4
Ifbench0.4
Scicode0.3
Terminalbench Hard0.1
Hle0.0
Lcr0.0
Tau20.0
LLM Statsカテゴリスコア
Biology70
Chemistry70
Physics60
General40
Language40
Reasoning40
Finance30
Healthcare30
Legal30
Math30
Factuality0
価格設定
入力価格$0.28 / 1M tokens
出力価格$1.1 / 1M tokens
混合価格(3:1)$0.485 / 1M tokens
速度
トークン/秒24.6 tokens/s
初トークン遅延1.71s
初回答遅延1.71s
利用可能なプロバイダー
(LS内部単位)| プロバイダー | 入力価格 | 出力価格 |
|---|---|---|
| Novita | 400K | 4.0M |