메인 콘텐츠로 건너뛰기

Hermes 4 - Llama-3.1 70B (Reasoning)

Nous ResearchLlama
출시일
2025-08-27
파라미터
컨텍스트 길이
131K
모달리티
text

능력 레이더

31
general
58
coding
69
reasoning
45
science추정
80
agents
0
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
코딩 랭킹298
29.0
AA
종합 랭킹315
34.0
AA
수학 추론121
69.0
AA
과학212
47.0
AA

벤치마크 점수 (LLM Stats)

Biology

GPQA50.5%자체 보고

Code

HumanEval88.4%자체 보고

Finance

MMLU86.0%자체 보고
MMLU-Pro68.9%자체 보고

General

IFEval92.1%자체 보고
MBPP EvalPlus87.6%자체 보고
BFCL v277.3%자체 보고

Math

MGSM91.1%자체 보고
MATH77.0%자체 보고

AA 평가 지수

Math Index
68.7
Intelligence Index
10.0
Mmlu Pro
0.8
Gpqa
0.7
Aime 25
0.7
Livecodebench
0.7
Scicode
0.3
Ifbench
0.3
Tau2
0.2
Hle
0.1
Lcr
0.1
Terminalbench Hard
0.0

LLM Stats 카테고리 점수

Instruction Following
90
Structured Output
90
Code
90
Language
80
Legal
80
Math
80
Reasoning
80
Finance
80
Healthcare
80
Tool Calling
80
General
70
Physics
50
Biology
50
Chemistry
50

가격

입력 가격$0.13 / 1M 토큰
출력 가격$0.4 / 1M 토큰
혼합 가격 (3:1)$0.198 / 1M 토큰

속도

토큰/초87.0
첫 토큰 지연0.66s
첫 응답 지연23.65s

공급자 가격 순위

공급자 가격 순위

2개 공급자

최저가: Nous Research최고가: NanoGPT
공급자입력출력
1Nous Research주요
$0.13
$0.4
2NanoGPT
$0.25
$1.5

이 모델의 다양한 API 공급자 간 가격 비교.

외부 링크