Qwen3.5 27B (Reasoning)

AlibabaQwen开源权重Apache 2.0 · 商用许可

描述

Qwen3.5-27B is a multimodal dense foundation model with 27 billion parameters. It combines strong reasoning, coding, multilingual, long-context, and visual understanding performance in a production-friendly open-weight package with a native 262K context window.

发布日期

2026-02-24

参数规模

27.0B

上下文长度

262K

支持模态

audio, image, text, video

能力雷达图

general

coding

reasoning

science估算

agents

multimodal

Science 在缺少专门科学评测时使用推理能力代理估算。

排行榜排名

领域	#排名	分数	来源
智能体能力模型榜	49	57.0	LS
代码能力榜	82	71.0	AA
通用能力榜	59	74.0	AA
多模态榜	69	70.0	LS
推理能力	58	67.0	LS
科学能力	76	65.0	AA

基准测试分数 (LLM Stats)

3d

SUNRGBD

0.35 / 100自报

Hypersim

0.13 / 100自报

Agents

t2-bench

79.0%自报

BFCL-V4

68.5%自报

AndroidWorld_SR

64.2%自报

WideSearch

61.1%自报

BrowseComp

61.0%自报

FullStackBench en

60.1%自报

TIR-Bench

59.8%自报

FullStackBench zh

57.4%自报

OSWorld-Verified

56.2%自报

VITA-Bench

41.9%自报

Terminal-Bench 2.0

41.6%自报

DeepPlanning

22.6%自报

Biology

GPQA

85.5%自报

Chemistry

SuperGPQA

65.6%自报

Code

SWE-Bench Verified

72.4%自报

Communication

Multi-Challenge

60.8%自报

Embodied

EmbSpatialBench

0.84 / 100自报

Finance

MMLU-Pro

86.1%自报

MMLU-ProX

82.2%自报

General

IFEval

95.0%自报

MMLU-Redux

93.2%自报

C-Eval

90.5%自报

MAXIFE

88.0%自报

Global PIQA

87.5%自报

MMMLU

85.9%自报

MMMU

82.3%自报

Include

81.6%自报

MMStar

81.0%自报

LiveCodeBench v6

80.7%自报

IFBench

76.5%自报

MMMU-Pro

75.0%自报

LongBench v2

60.6%自报

NOVA-63

58.1%自报

SimpleVQA

0.56 / 100自报

Grounding

RefCOCO-avg

0.91 / 100自报

ScreenSpot Pro

70.3%自报

RefSpatialBench

0.68 / 100自报

Healthcare

VideoMMMU

82.3%自报

SlakeVQA

80.0%自报

MedXpertQA

62.4%自报

PMC-VQA

62.4%自报

Image To Text

OCRBench

89.4%自报

Language

LingoQA

82.0%自报

WMT24++

77.6%自报

Long Context

MLVU

85.9%自报

LVBench

73.6%自报

AA-LCR

66.1%自报

MMLongBench-Doc

0.60 / 100自报

Math

HMMT 2025

92.0%自报

HMMT25

89.8%自报

MathVista-Mini

87.8%自报

DynaMath

87.7%自报

MathVision

86.0%自报

CodeForces

0.81 / 3000自报

PolyMATH

71.2%自报

Humanity's Last Exam

48.5%自报

Multimodal

VLMsAreBlind

96.9%自报

93.7%自报

AI2D

92.9%自报

MMBench-V1.1

92.6%自报

OmniDocBench 1.5

88.9%自报

VideoMME w sub.

87.0%自报

VideoMME w/o sub.

82.8%自报

CC-OCR

81.0%自报

CharXiv-R

79.5%自报

MVBench

74.6%自报

MMVU

73.3%自报

BabyVision

44.6%自报

ZEROBench-Sub

0.36 / 100自报

Nuscene

15.2%自报

ZEROBench

0.10 / 100自报

Reasoning

CountBench

0.98 / 100自报

Hallusion Bench

70.0%自报

BrowseComp-zh

62.1%自报

ERQA

60.5%自报

Seal-0

47.2%自报

OJBench

40.1%自报

Spatial Reasoning

RealWorldQA

83.7%自报

Vision

ODinW

41.1%自报

AA 评测指数

Intelligence Index

33.8

Tau2

0.9

Gpqa

0.9

Ifbench

0.8

Lcr

0.7

Scicode

0.4

Terminalbench Hard

0.3

Hle

0.2

LLM Stats 分类评分

Instruction Following

Biology

Image To Text

Language

Legal

Math

Physics

Structured Output

Embodied

Finance

General

Grounding

Chemistry

Text-to-image

Video

Long Context

Multimodal

Reasoning

Spatial Reasoning

Frontend Development

Healthcare

Economics

Vision

Agents

Code

Communication

Tool Calling

Spatial

定价

输入价格$0.3 / 1M tokens

输出价格$2.4 / 1M tokens

混合价格(3:1)$0.825 / 1M tokens

速度

Tokens/秒86.8

首Token延迟1.47s

首回答延迟24.52s

供应商价格排行

10 个供应商

最便宜: Novita最贵: NanoGPT

供应商输入输出

1Novita最便宜

2OrcaRouter

$0.086

$0.688

3OpenRouter

$0.195

$1.56

4Kilo Gateway

$0.195

$1.56

5SiliconFlow (China)

$0.26

$2.09

6Alibaba主要

$0.3

$2.4

7Hugging Face

$0.3

$2.4

8NovitaAI

$0.3

$2.4

9Mixlayer

$0.3

$2.4

10NanoGPT

$0.306

比较该模型在不同 API 供应商之间的定价。

外部链接

LLM Stats Artificial Analysis