Mistral Large (Feb '24)
MistralMistralOpen WeightApache 2.0 · Commercial OK
설명
Mistral Large 3 (675B Instruct 2512) is a state-of-the-art general-purpose Multimodal granular Mixture-of-Experts model with 41B active parameters and 675B total parameters trained from scratch with 3000 H200s. This model is the instruct post-trained version in FP8, fine-tuned for instruction tasks, making it ideal for chat, agentic and instruction based use cases. A no-loss FP8 version to reduce resource requirements. Can be deployed on a node of B200s or H200s. Designed for reliability and long-context comprehension - It is engineered for production-grade assistants, retrieval-augmented systems, scientific workloads, and complex enterprise workflows.
출시일
2024-02-26
파라미터
675.0B
컨텍스트 길이
128K
모달리티
image, text
능력 레이더
21
general
18
coding
23
reasoning
24
science추정
0
agents
75
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
| 도메인 | #순위 | 점수 | 소스 |
|---|---|---|---|
| Code Ranking | 355 | 19.0 | AA |
| General Ranking | 410 | 24.0 | AA |
| Math Reasoning | 288 | 25.0 | AA |
| Science | 404 | 23.0 | AA |
벤치마크 점수 (LLM Stats)
Biology
GPQA
43.9%자체 보고
Code
LiveCodeBench
34.4%자체 보고
Factuality
SimpleQA
23.8%자체 보고
General
MMMLU
85.5%자체 보고
Math
AMC_2022_23
52.0%자체 보고
AA 평가 지수
Intelligence Index9.9
Math 5000.5
Mmlu Pro0.5
Gpqa0.4
Scicode0.2
Livecodebench0.2
Hle0.0
Aime0.0
LLM Stats 카테고리 점수
Language90
Math70
General50
Reasoning50
Biology40
Chemistry40
Physics40
Code30
Factuality20
가격
입력 가격$4 / 1M tokens
출력 가격$12 / 1M tokens
혼합 가격 (3:1)$6 / 1M tokens
속도
토큰/초0.0 tokens/s
첫 토큰 지연0.00s
첫 응답 지연0.00s
사용 가능한 프로바이더
(LS 내부 단위)| 프로바이더 | 입력 가격 | 출력 가격 |
|---|---|---|
| Mistral AI | 500K | 1.5M |