Passer au contenu principal

Sarvam 105B (high)

SarvamOpen WeightApache 2.0 · Commercial OK

Description

Sarvam-105B is Sarvam AI's flagship open-source Mixture-of-Experts reasoning model built for complex reasoning, coding, and agentic workflows. It uses 128 sparse experts with Multi-head Latent Attention for efficient long-context inference and was pre-trained on 12 trillion tokens spanning code, mathematics, multilingual, and web data.

Date de sortie
2026-03-06
Paramètres
105.0B
Longueur du contexte
Modalités

Radar de capacités

16
general
12
coding
74
reasoning
44
scienceest.
50
agents
10
multimodal

Science utilise un proxy de raisonnement lorsque les benchmarks scientifiques dédiés ne sont pas disponibles.

Classements

Domaine#RangScoreSource
Agents & Tools74
50.0
LS
Code Ranking428
9.0
AA
General Ranking344
32.0
AA
Science202
47.0
AA

Scores de benchmarks (LLM Stats)

Agents

BrowseComp49.5%Aut.

Biology

GPQA78.7%Aut.

Code

SWE-Bench Verified45.0%Aut.

Creativity

Arena-Hard v271.0%Aut.

Finance

MMLU90.6%Aut.
MMLU-Pro81.7%Aut.

General

IFEval84.8%Aut.
LiveCodeBench v671.7%Aut.

Math

MATH-50098.6%Aut.
AIME 202596.7%Aut.
HMMT2585.8%Aut.
HMMT 202585.8%Aut.
Beyond AIME69.1%Aut.
Humanity's Last Exam11.2%Aut.

Indices d'évaluation AA

Intelligence Index
18.2
Coding Index
9.8
Gpqa
0.7
Tau2
0.5
Ifbench
0.3
Scicode
0.3
Hle
0.1
Terminalbench Hard
0.0
Lcr
0.0

Scores par catégorie LLM Stats

Finance
90
Healthcare
90
Language
90
Legal
90
Structured Output
80
Biology
80
Chemistry
80
General
80
Instruction Following
80
Math
80
Physics
80
Writing
70
Creativity
70
Reasoning
70
Agents
50
Code
50
Frontend Development
50
Search
50
Vision
10

Tarification

Prix d'entréeGratuit
Prix de sortieGratuit
Prix mixte (3:1)Gratuit

Vitesse

Tokens/sec105.5 tokens/s
Délai du premier token1.24s
Temps de réponse20.19s

Fournisseurs disponibles

(Unités internes LS)

Aucune donnée de fournisseur disponible

Sources externes