Llama 65B
MetaLlama
Дата выхода
2023-02-24
Параметры
—
Длина контекста
131K
Модальности
text
Радар способностей
2
general
90
coding
80
reasoning
43
scienceоцен.
80
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Общий рейтинг | 532 | 2.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
50.5%Сам.
Code
HumanEval
88.4%Сам.
Finance
MMLU
86.0%Сам.
MMLU-Pro
68.9%Сам.
General
IFEval
92.1%Сам.
MBPP EvalPlus
87.6%Сам.
BFCL v2
77.3%Сам.
Math
MGSM
91.1%Сам.
MATH
77.0%Сам.
Индексы оценки AA
Intelligence Index2.1
Оценки категорий LLM Stats
Instruction Following90
Structured Output90
Code90
Language80
Legal80
Math80
Reasoning80
Finance80
Healthcare80
Tool Calling80
General70
Physics50
Biology50
Chemistry50
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s
Рейтинг цен провайдеров
Нет данных провайдеров