Llama 3.1 Instruct 70B
MetaLlamaOpen WeightLlama 3.1 Community License
설명
Llama 3.1 70B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks.
출시일
2024-07-23
파라미터
70.0B
컨텍스트 길이
131K
모달리티
text
능력 레이더
28
general
17
coding
20
reasoning
29
science추정
70
agents
0
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Code Ranking | 385 | 15.0 | AA |
| General Ranking | 367 | 30.0 | AA |
| Math Reasoning | 306 | 19.0 | AA |
| Reasoning | 10 | 90.0 | LS |
| Science | 357 | 30.0 | AA |
벤치마크 점수 (LLM Stats)
Biology
GPQA
41.7%자체 보고
Code
HumanEval
80.5%자체 보고
Gorilla Benchmark API Bench
29.7%자체 보고
Finance
MMLU (CoT)
86.0%자체 보고
MMLU
83.6%자체 보고
MMLU-Pro
66.4%자체 보고
General
ARC-C
94.8%자체 보고
IFEval
87.5%자체 보고
MBPP ++ base version
86.0%자체 보고
BFCL
84.8%자체 보고
Multipl-E HumanEval
65.5%자체 보고
Multipl-E MBPP
62.0%자체 보고
Nexus
56.7%자체 보고
Math
GSM-8K (CoT)
95.1%자체 보고
Multilingual MGSM (CoT)
86.9%자체 보고
DROP
79.6%자체 보고
MATH (CoT)
68.0%자체 보고
Reasoning
API-Bank
90.0%자체 보고
AA 평가 지수
Intelligence Index12.5
Coding Index10.9
Math Index4.0
Mmlu Pro0.7
Math 5000.6
Gpqa0.4
Ifbench0.3
Scicode0.3
Livecodebench0.2
Aime0.2
Tau20.2
Lcr0.1
Hle0.0
Aime 250.0
Terminalbench Hard0.0
LLM Stats 카테고리 점수
Structured Output90
Instruction Following90
Finance80
Healthcare80
Language80
Legal80
Math80
Tool Calling70
General70
Reasoning70
Code60
Biology40
Chemistry40
Physics40
가격
입력 가격$0.56 / 1M tokens
출력 가격$0.56 / 1M tokens
혼합 가격 (3:1)$0.56 / 1M tokens
속도
토큰/초33.0 tokens/s
첫 토큰 지연0.62s
첫 응답 지연0.62s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다