Llama 3.2 Instruct 11B (Vision)
MetaLlama오픈 웨이트Llama 3.2 Community License
설명
Llama 3.2 11B Vision Instruct is an instruction-tuned multimodal large language model optimized for visual recognition, image reasoning, captioning, and answering general questions about an image. It accepts text and images as input and generates text as output.
출시일
2024-09-25
파라미터
10.6B
컨텍스트 길이
131K
모달리티
image, text
능력 레이더
17
general
11
coding
13
reasoning
15
science추정
12
agents
90
multimodal
전용 과학 벤치마크가 없을 때 Science는 추론 프록시를 사용하여 추정합니다.
랭킹
벤치마크 점수 (LLM Stats)
Biology
GPQA
32.8%자체 보고
Finance
MMLU
73.0%자체 보고
General
MMMU
50.7%자체 보고
MMMU-Pro
33.0%자체 보고
Image To Text
DocVQA
88.4%자체 보고
VQAv2 (test)
75.2%자체 보고
Math
MGSM
68.9%자체 보고
MATH
51.9%자체 보고
MathVista
51.5%자체 보고
Multimodal
AI2D
91.1%자체 보고
ChartQA
83.4%자체 보고
AA 평가 지수
Intelligence Index3.3
Math Index1.7
Math 5000.5
Mmlu Pro0.5
Ifbench0.3
Gpqa0.2
Tau20.1
Lcr0.1
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.1
Aime 250.0
Terminalbench Hard0.0
LLM Stats 카테고리 점수
Image To Text90
Language70
Legal70
Multimodal70
Finance70
Vision70
Math60
Reasoning60
Healthcare60
General50
Physics30
Biology30
Chemistry30
가격
입력 가격$0.245 / 1M 토큰
출력 가격$0.245 / 1M 토큰
혼합 가격 (3:1)$0.245 / 1M 토큰
속도
토큰/초85.7
첫 토큰 지연0.55s
첫 응답 지연0.55s
공급자 가격 순위
공급자 가격 순위
10개 공급자
최저가: Cloudflare Workers AI최고가: Azure
공급자입력출력
1Cloudflare Workers AI최저가
$0.0485
$0.676
2Kilo Gateway
$0.049
$0.049
3Cloudflare AI Gateway
$0.049
$0.68
4Inference
$0.055
$0.055
5LLM Gateway
$0.07
$0.33
6Vercel AI Gateway
$0.16
$0.16
7Meta주요
$0.245
$0.245
8OpenRouter
$0.345
$0.345
9Azure Cognitive Services
$0.37
$0.37
10Azure
$0.37
$0.37
이 모델의 다양한 API 공급자 간 가격 비교.