Passer au contenu principal

Mi:dm K 2.5 Pro Preview

Korea Telecom
Date de sortie
2025-12-11
Paramètres
Longueur du contexte
Modalités

Radar de capacités

57
general
51
coding
78
reasoning
45
scienceest.
70
agents
0
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Classement codage308
28.0
AA
Classement général113
62.0
AA
Raisonnement mathématique89
79.0
AA
Science223
46.0
AA

Scores de benchmarks (LLM Stats)

Aucune donnée de benchmark disponible

Indices d'évaluation AA

Math Index
78.7
Mmlu Pro
0.8
Aime 25
0.8
Gpqa
0.7
Livecodebench
0.6
Tau2
0.5
Ifbench
0.5
Scicode
0.3
Lcr
0.1
Hle
0.1
Terminalbench Hard
0.0

Scores par catégorie LLM Stats

Aucune donnée de score par catégorie disponible

Tarification

Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec0.0
Délai du premier token0.00s
Temps de réponse0.00s

Classement des Prix par Fournisseur

Aucune donnée de fournisseur disponible

Sources externes