Llama 3.2 Instruct 11B (Vision)
MetaLlamaOpen WeightLlama 3.2 Community License
विवरण
Llama 3.2 11B Vision Instruct is an instruction-tuned multimodal large language model optimized for visual recognition, image reasoning, captioning, and answering general questions about an image. It accepts text and images as input and generates text as output.
रिलीज़ तिथि
2024-09-25
पैरामीटर
10.6B
संदर्भ लंबाई
131K
मोडैलिटीज़
image, text
क्षमता रडार
19
general
7
coding
13
reasoning
15
scienceअनुमानित
0
agents
90
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| Code Ranking | 432 | 8.0 | AA |
| General Ranking | 428 | 21.0 | AA |
| Math Reasoning | 328 | 13.0 | AA |
| Multimodal Ranking | 23 | 84.0 | LS |
| Science | 455 | 14.0 | AA |
बेंचमार्क स्कोर (LLM Stats)
Biology
GPQA
32.8%स्वयं
Finance
MMLU
73.0%स्वयं
General
MMMU
50.7%स्वयं
MMMU-Pro
33.0%स्वयं
Image To Text
DocVQA
88.4%स्वयं
VQAv2 (test)
75.2%स्वयं
Math
MGSM
68.9%स्वयं
MATH
51.9%स्वयं
MathVista
51.5%स्वयं
Multimodal
AI2D
91.1%स्वयं
ChartQA
83.4%स्वयं
AA मूल्यांकन सूचकांक
Intelligence Index8.7
Coding Index4.3
Math Index1.7
Math 5000.5
Mmlu Pro0.5
Ifbench0.3
Gpqa0.2
Tau20.1
Lcr0.1
Scicode0.1
Livecodebench0.1
Aime0.1
Hle0.1
Aime 250.0
Terminalbench Hard0.0
LLM Stats श्रेणी स्कोर
Image To Text90
Vision70
Finance70
Language70
Legal70
Multimodal70
Healthcare60
Math60
Reasoning60
General50
Biology30
Chemistry30
Physics30
मूल्य निर्धारण
इनपुट मूल्य$0.245 / 1M tokens
आउटपुट मूल्य$0.245 / 1M tokens
मिश्रित मूल्य (3:1)$0.245 / 1M tokens
गति
टोकन/सेकंड86.7 tokens/s
पहले टोकन में देरी0.52s
पहले उत्तर में देरी0.52s
उपलब्ध प्रदाता
(LS आंतरिक इकाइयाँ)कोई प्रदाता डेटा उपलब्ध नहीं