LongCat-Flash-Thinking
MeituanOpen WeightMIT · Commercial OK
विवरण
LongCat-Flash-Thinking is Meituan's reasoning model built on the LongCat-Flash foundation with 560B total parameters (MoE, ~27B activated). It introduces a training pipeline specifically tuned for advanced reasoning, featuring Re-thinking Mode that delivers parallel reasoning paths for sophisticated decision-making. Achieves strong performance on mathematical reasoning, agentic tool use, and formal theorem proving benchmarks.
रिलीज़ तिथि
2025-09-22
पैरामीटर
560.0B
संदर्भ लंबाई
—
मोडैलिटीज़
text
क्षमता रडार
80
general
70
coding
90
reasoning
68
scienceअनुमानित
70
agents
0
multimodal
समर्पित विज्ञान बेंचमार्क उपलब्ध न होने पर Science तर्क प्रॉक्सी का उपयोग करके अनुमान लगाता है।
रैंकिंग
| डोमेन | #रैंक | स्कोर | स्रोत |
|---|---|---|---|
| Agents & Tools | 8 | 74.0 | LS |
| Reasoning | 59 | 62.0 | LS |
बेंचमार्क स्कोर (LLM Stats)
Agents
BFCL-v3
74.4%स्वयं
Biology
GPQA
81.5%स्वयं
Code
LiveCodeBench
79.4%स्वयं
SWE-Bench Verified
59.4%स्वयं
Communication
Tau2 Telecom
83.1%स्वयं
Tau2 Retail
71.5%स्वयं
Tau2 Airline
67.5%स्वयं
Finance
MMLU-Pro
82.6%स्वयं
General
MMLU-Redux
89.3%स्वयं
Math
MATH-500
99.2%स्वयं
AIME 2024
93.3%स्वयं
AIME 2025
90.6%स्वयं
Reasoning
ZebraLogic
95.5%स्वयं
ARC-AGI
50.3%स्वयं
AA मूल्यांकन सूचकांक
कोई AA मूल्यांकन डेटा उपलब्ध नहीं
LLM Stats श्रेणी स्कोर
Language90
Math90
Biology80
Chemistry80
Finance80
General80
Healthcare80
Legal80
Physics80
Reasoning80
Structured Output70
Tool Calling70
Agents70
Code70
Communication70
Frontend Development60
Spatial Reasoning50
Vision50
मूल्य निर्धारण
कोई मूल्य डेटा उपलब्ध नहीं
गति
कोई गति डेटा उपलब्ध नहीं
उपलब्ध प्रदाता
(LS आंतरिक इकाइयाँ)कोई प्रदाता डेटा उपलब्ध नहीं