Llama 3.1 Instruct 405B

MetaLlama오픈 웨이트Llama 3.1 Community License

설명

Llama 3.1 405B Instruct is a large language model optimized for multilingual dialogue use cases. It outperforms many available open source and closed chat models on common industry benchmarks. The model supports 8 languages and has a 128K token context length.

출시일

2024-07-23

파라미터

405.0B

컨텍스트 길이

—

모달리티

text

능력 레이더

general

coding

reasoning

science추정

agents

multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인	#순위	점수	소스
코딩 랭킹	323	25.0	AA
종합 랭킹	327	33.0	AA
수학 추론	303	20.0	AA
추론	5	92.0	LS
과학	318	35.0	AA

벤치마크 점수 (LLM Stats)

Biology

GPQA

50.7%자체 보고

Code

HumanEval

89.0%자체 보고

Gorilla Benchmark API Bench

35.3%자체 보고

Finance

MMLU (CoT)

88.6%자체 보고

MMLU

87.3%자체 보고

MMLU-Pro

73.3%자체 보고

General

ARC-C

96.9%자체 보고

MBPP EvalPlus

88.6%자체 보고

IFEval

88.6%자체 보고

BFCL

88.5%자체 보고

Multipl-E HumanEval

75.2%자체 보고

Multipl-E MBPP

65.7%자체 보고

Nexus

58.7%자체 보고

Math

GSM8k

96.8%자체 보고

Multilingual MGSM (CoT)

91.6%자체 보고

DROP

84.8%자체 보고

MATH

73.8%자체 보고

Reasoning

API-Bank

92.0%자체 보고

AA 평가 지수

Intelligence Index

8.5

Math Index

3.0

Mmlu Pro

0.7

Math 500

0.7

Gpqa

0.5

Ifbench

0.4

Livecodebench

0.3

Scicode

0.3

Lcr

0.2

Aime

0.2

Tau2

0.2

Terminalbench Hard

0.1

Hle

0.0

Aime 25

0.0

LLM Stats 카테고리 점수

Instruction Following

Math

Structured Output

Language

Legal

Reasoning

Finance

General

Healthcare

Tool Calling

Code

Physics

Biology

Chemistry

가격

입력 가격$2.75 / 1M 토큰

출력 가격$6.5 / 1M 토큰

혼합 가격 (3:1)$3.688 / 1M 토큰

속도

토큰/초60.6

첫 토큰 지연0.68s

첫 응답 지연0.68s

공급자 가격 순위

7개 공급자

최저가: Kilo Gateway최고가: Azure

공급자입력출력

1Kilo Gateway최저가

2Venice AI

$1.1

3Meta주요

$2.75

$6.5

4Synthetic

5Abacus

$3.5

6Azure Cognitive Services

$5.33

$16

7Azure

$5.33

$16

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크

LLM Stats Artificial Analysis