메인 콘텐츠로 건너뛰기

Hermes 4 - Llama-3.1 70B (Reasoning)

Nous ResearchLlama

출시일

2025-08-27

파라미터

—

컨텍스트 길이

131K

모달리티

text

능력 레이더

31

general

58

coding

69

reasoning

45

science추정

80

agents

0

multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인	#순위	점수	소스
코딩 랭킹	298	29.0	AA
종합 랭킹	315	34.0	AA
수학 추론	121	69.0	AA
과학	212	47.0	AA

벤치마크 점수 (LLM Stats)

Biology

GPQA

50.5%자체 보고

Code

HumanEval

88.4%자체 보고

Finance

MMLU

86.0%자체 보고

MMLU-Pro

68.9%자체 보고

General

IFEval

92.1%자체 보고

MBPP EvalPlus

87.6%자체 보고

BFCL v2

77.3%자체 보고

Math

MGSM

91.1%자체 보고

MATH

77.0%자체 보고

AA 평가 지수

Math Index

68.7

Intelligence Index

10.0

Mmlu Pro

0.8

Gpqa

0.7

Aime 25

0.7

Livecodebench

0.7

Scicode

0.3

Ifbench

0.3

Tau2

0.2

Hle

0.1

Lcr

0.1

Terminalbench Hard

0.0

LLM Stats 카테고리 점수

Instruction Following

90

Structured Output

90

Code

90

Language

80

Legal

80

Math

80

Reasoning

80

Finance

80

Healthcare

80

Tool Calling

80

General

70

Physics

50

Biology

50

Chemistry

50

가격

입력 가격$0.13 / 1M 토큰

출력 가격$0.4 / 1M 토큰

혼합 가격 (3:1)$0.198 / 1M 토큰

속도

토큰/초87.0

첫 토큰 지연0.66s

첫 응답 지연23.65s

공급자 가격 순위

공급자 가격 순위

2개 공급자

최저가: Nous Research최고가: NanoGPT

공급자입력출력

1Nous Research주요

$0.13

$0.4

2NanoGPT

$0.25

$1.5

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크

Artificial Analysis