Llama 3.1 Instruct 405B
MetaLlamaOpen WeightLlama 3.1 Community License
설명
Llama 3.1 405B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks. The model supports 8 languages and has a 128K token context length.
출시일
2024-07-23
파라미터
405.0B
컨텍스트 길이
—
모달리티
text
능력 레이더
32
general
22
coding
23
reasoning
34
science추정
70
agents
0
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Code Ranking | 296 | 25.0 | AA |
| General Ranking | 289 | 37.0 | AA |
| Math Reasoning | 303 | 20.0 | AA |
| Reasoning | 5 | 92.0 | LS |
| Science | 293 | 36.0 | AA |
벤치마크 점수 (LLM Stats)
Biology
GPQA
50.7%자체 보고
Code
HumanEval
89.0%자체 보고
Gorilla Benchmark API Bench
35.3%자체 보고
Finance
MMLU (CoT)
88.6%자체 보고
MMLU
87.3%자체 보고
MMLU-Pro
73.3%자체 보고
General
ARC-C
96.9%자체 보고
MBPP EvalPlus
88.6%자체 보고
IFEval
88.6%자체 보고
BFCL
88.5%자체 보고
Multipl-E HumanEval
75.2%자체 보고
Multipl-E MBPP
65.7%자체 보고
Nexus
58.7%자체 보고
Math
GSM8k
96.8%자체 보고
Multilingual MGSM (CoT)
91.6%자체 보고
DROP
84.8%자체 보고
MATH
73.8%자체 보고
Reasoning
API-Bank
92.0%자체 보고
AA 평가 지수
Intelligence Index17.4
Coding Index14.5
Math Index3.0
Mmlu Pro0.7
Math 5000.7
Gpqa0.5
Ifbench0.4
Livecodebench0.3
Scicode0.3
Lcr0.2
Aime0.2
Tau20.2
Terminalbench Hard0.1
Hle0.0
Aime 250.0
LLM Stats 카테고리 점수
Structured Output90
Instruction Following90
Math90
Finance80
General80
Healthcare80
Language80
Legal80
Reasoning80
Tool Calling70
Code60
Biology50
Chemistry50
Physics50
가격
입력 가격$2.75 / 1M tokens
출력 가격$6.5 / 1M tokens
혼합 가격 (3:1)$3.688 / 1M tokens
속도
토큰/초31.5 tokens/s
첫 토큰 지연0.69s
첫 응답 지연0.69s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다