Saltar al contenido principal

Sarvam 105B (high)

SarvamOpen WeightApache 2.0 · Commercial OK

Descripción

Sarvam-105B is Sarvam AI's flagship open-source Mixture-of-Experts reasoning model built for complex reasoning, coding, and agentic workflows. It uses 128 sparse experts with Multi-head Latent Attention for efficient long-context inference and was pre-trained on 12 trillion tokens spanning code, mathematics, multilingual, and web data.

Fecha de lanzamiento
2026-03-06
Parámetros
105.0B
Longitud del contexto
Modalidades

Radar de capacidades

16
general
12
coding
74
reasoning
44
scienceest.
50
agents
10
multimodal

Science usa un proxy de razonamiento cuando los benchmarks científicos dedicados no están disponibles.

Rankings

Dominio#PosiciónPuntuaciónFuente
Agents & Tools74
50.0
LS
Code Ranking428
9.0
AA
General Ranking344
32.0
AA
Science202
47.0
AA

Puntuaciones de benchmarks (LLM Stats)

Agents

BrowseComp49.5%Aut.

Biology

GPQA78.7%Aut.

Code

SWE-Bench Verified45.0%Aut.

Creativity

Arena-Hard v271.0%Aut.

Finance

MMLU90.6%Aut.
MMLU-Pro81.7%Aut.

General

IFEval84.8%Aut.
LiveCodeBench v671.7%Aut.

Math

MATH-50098.6%Aut.
AIME 202596.7%Aut.
HMMT2585.8%Aut.
HMMT 202585.8%Aut.
Beyond AIME69.1%Aut.
Humanity's Last Exam11.2%Aut.

Índices de evaluación AA

Intelligence Index
18.2
Coding Index
9.8
Gpqa
0.7
Tau2
0.5
Ifbench
0.3
Scicode
0.3
Hle
0.1
Terminalbench Hard
0.0
Lcr
0.0

Puntuaciones por categoría LLM Stats

Finance
90
Healthcare
90
Language
90
Legal
90
Structured Output
80
Biology
80
Chemistry
80
General
80
Instruction Following
80
Math
80
Physics
80
Writing
70
Creativity
70
Reasoning
70
Agents
50
Code
50
Frontend Development
50
Search
50
Vision
10

Precios

Precio de entradaGratis
Precio de salidaGratis
Precio mixto (3:1)Gratis

Velocidad

Tokens/seg105.5 tokens/s
Retraso del primer token1.24s
Tiempo hasta la respuesta20.19s

Proveedores disponibles

(Unidades internas LS)

No hay datos de proveedores disponibles

Fuentes externas