Llama 3.1 Instruct 8B
MetaLlamaOpen WeightLlama 3.1 Community License
설명
Llama 3.1 8B Instruct is a multilingual large language model optimized for dialogue use cases. It features a 128K context length, state-of-the-art tool use, and strong reasoning capabilities.
출시일
2024-07-23
파라미터
8.0B
컨텍스트 길이
16K
모달리티
text
능력 레이더
22
general
8
coding
14
reasoning
17
science추정
50
agents
0
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Code Ranking | 420 | 10.0 | AA |
| General Ranking | 418 | 23.0 | AA |
| Math Reasoning | 324 | 14.0 | AA |
| Reasoning | 26 | 83.0 | LS |
| Science | 435 | 17.0 | AA |
벤치마크 점수 (LLM Stats)
Biology
GPQA
30.4%자체 보고
Code
HumanEval
72.6%자체 보고
Gorilla Benchmark API Bench
8.2%자체 보고
Finance
MMLU (CoT)
73.0%자체 보고
MMLU
69.4%자체 보고
MMLU-Pro
48.3%자체 보고
General
ARC-C
83.4%자체 보고
IFEval
80.4%자체 보고
BFCL
76.1%자체 보고
MBPP EvalPlus (base)
72.8%자체 보고
Multipl-E MBPP
52.4%자체 보고
Multipl-E HumanEval
50.8%자체 보고
Nexus
38.5%자체 보고
Math
GSM-8K (CoT)
84.5%자체 보고
Multilingual MGSM (CoT)
68.9%자체 보고
DROP
59.5%자체 보고
MATH (CoT)
51.9%자체 보고
Reasoning
API-Bank
82.6%자체 보고
AA 평가 지수
Intelligence Index11.8
Coding Index4.9
Math Index4.3
Math 5000.5
Mmlu Pro0.5
Ifbench0.3
Gpqa0.3
Tau20.2
Lcr0.2
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.1
Aime 250.0
Terminalbench Hard0.0
LLM Stats 카테고리 점수
Structured Output80
Instruction Following80
Finance60
General60
Healthcare60
Language60
Legal60
Math60
Reasoning60
Tool Calling50
Code40
Biology30
Chemistry30
Physics30
가격
입력 가격$0.1 / 1M tokens
출력 가격$0.1 / 1M tokens
혼합 가격 (3:1)$0.1 / 1M tokens
속도
토큰/초188.5 tokens/s
첫 토큰 지연0.47s
첫 응답 지연0.47s
사용 가능한 프로바이더
(LS 내부 단위)프로바이더 데이터가 없습니다