Llama 2 Chat 70B
MetaLlama
Дата выхода
2023-07-18
Параметры
—
Длина контекста
131K
Модальности
text
Радар способностей
15
general
10
coding
16
reasoning
24
scienceоцен.
80
agents
0
multimodal
Science использует прокси на основе рассуждений, когда специализированные научные бенчмарки недоступны.
Рейтинги
| Домен | #Место | Оценка | Источник |
|---|---|---|---|
| Рейтинг кодинга | 450 | 10.0 | AA |
| Общий рейтинг | 475 | 16.0 | AA |
| Математическое мышление | 325 | 14.0 | AA |
| Наука | 456 | 17.0 | AA |
Оценки бенчмарков (LLM Stats)
Biology
GPQA
50.5%Сам.
Code
HumanEval
88.4%Сам.
Finance
MMLU
86.0%Сам.
MMLU-Pro
68.9%Сам.
General
IFEval
92.1%Сам.
MBPP EvalPlus
87.6%Сам.
BFCL v2
77.3%Сам.
Math
MGSM
91.1%Сам.
MATH
77.0%Сам.
Индексы оценки AA
Intelligence Index3.0
Mmlu Pro0.4
Gpqa0.3
Math 5000.3
Livecodebench0.1
Hle0.1
Aime0.0
Оценки категорий LLM Stats
Structured Output90
Instruction Following90
Code90
Language80
Legal80
Math80
Reasoning80
Finance80
Healthcare80
Tool Calling80
General70
Physics50
Biology50
Chemistry50
Цены
Цена вводаБесплатно
Цена выводаБесплатно
Смешанная цена (3:1)Бесплатно
Скорость
Токенов/сек0.0
Задержка первого токена0.00s
Время до первого ответа0.00s
Рейтинг цен провайдеров
Нет данных провайдеров