메인 콘텐츠로 건너뛰기

Llama 3.2 Instruct 90B (Vision)

MetaLlamaOpen WeightLlama 3.2 · Commercial OK

설명

Llama 3.2 90B is a large multimodal language model optimized for visual recognition, image reasoning, and captioning tasks. It supports a context length of 128,000 tokens and is designed for deployment on edge and mobile devices, offering state-of-the-art performance in image understanding and generative tasks.

출시일
2024-09-25
파라미터
90.0B
컨텍스트 길이
모달리티
image, text

능력 레이더

27
general
22
coding
30
reasoning
29
science추정
0
agents
85
multimodal

전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.

랭킹

도메인#순위점수소스
Code Ranking315
23.0
AA
General Ranking334
33.0
AA
Math Reasoning253
33.0
AA
Multimodal Ranking28
81.0
LS
Science355
30.0
AA

벤치마크 점수 (LLM Stats)

Biology

GPQA46.7%자체 보고

Finance

MMLU86.0%자체 보고

General

MMMU60.3%자체 보고
MMMU-Pro45.2%자체 보고

Image To Text

DocVQA90.1%자체 보고
VQAv278.1%자체 보고
TextVQA73.5%자체 보고

Math

MGSM86.9%자체 보고
MATH68.0%자체 보고
MathVista57.3%자체 보고

Multimodal

AI2D92.3%자체 보고
ChartQA85.5%자체 보고
InfographicsQA56.8%자체 보고

AA 평가 지수

Intelligence Index
11.9
Mmlu Pro
0.7
Math 500
0.6
Gpqa
0.4
Scicode
0.2
Livecodebench
0.2
Aime
0.1
Hle
0.0

LLM Stats 카테고리 점수

Finance
90
Language
90
Legal
90
Image To Text
80
Vision
70
Healthcare
70
Math
70
Multimodal
70
Reasoning
70
General
60
Biology
50
Chemistry
50
Physics
50

가격

입력 가격$1.38 / 1M tokens
출력 가격$1.38 / 1M tokens
혼합 가격 (3:1)$1.38 / 1M tokens

속도

토큰/초54.2 tokens/s
첫 토큰 지연0.54s
첫 응답 지연0.54s

사용 가능한 프로바이더

(LS 내부 단위)

프로바이더 데이터가 없습니다

외부 링크