메인 콘텐츠로 건너뛰기

Mistral Large (Feb '24)

MistralMistralOpen WeightApache 2.0 · Commercial OK

설명

Mistral Large 3 (675B Instruct 2512) is a state-of-the-art general-purpose Multimodal granular Mixture-of-Experts model with 41B active parameters and 675B total parameters trained from scratch with 3000 H200s. This model is the instruct post-trained version in FP8, fine-tuned for instruction tasks, making it ideal for chat, agentic and instruction based use cases. A no-loss FP8 version to reduce resource requirements. Can be deployed on a node of B200s or H200s. Designed for reliability and long-context comprehension - It is engineered for production-grade assistants, retrieval-augmented systems, scientific workloads, and complex enterprise workflows.

출시일
2024-02-26
파라미터
675.0B
컨텍스트 길이
128K
모달리티
image, text

능력 레이더

21
general
18
coding
23
reasoning
24
science추정
0
agents
75
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Code Ranking355
19.0
AA
General Ranking410
24.0
AA
Math Reasoning288
25.0
AA
Science404
23.0
AA

벤치마크 점수 (LLM Stats)

Biology

GPQA43.9%자체 보고

Code

LiveCodeBench34.4%자체 보고

Factuality

SimpleQA23.8%자체 보고

General

MMMLU85.5%자체 보고

Math

AMC_2022_2352.0%자체 보고

AA 평가 지수

Intelligence Index
9.9
Math 500
0.5
Mmlu Pro
0.5
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Hle
0.0
Aime
0.0

LLM Stats 카테고리 점수

Language
90
Math
70
General
50
Reasoning
50
Biology
40
Chemistry
40
Physics
40
Code
30
Factuality
20

가격

입력 가격$4 / 1M tokens
출력 가격$12 / 1M tokens
혼합 가격 (3:1)$6 / 1M tokens

속도

토큰/초0.0 tokens/s
첫 토큰 지연0.00s
첫 응답 지연0.00s

사용 가능한 프로바이더

(LS 내부 단위)
프로바이더입력 가격출력 가격
Mistral AI500K1.5M

외부 링크