Qwen3-235B

Qwen3 旗舰模型，235B MoE 架构，22B 激活参数

MoE235B / 22B active131K context

CLIcURL

bash

xw run qwen3-235b

bash

curl http://localhost:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-235b",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

Models

名称	量化	大小	引擎	平台
`qwen3-235b`	W4A8	~120GB	MindIE	Ascend
`qwen3-235b:bf16`	BF16	~470GB	MindIE	Ascend
`qwen3-235b:i8`	INT8	~235GB	MindIE	Ascend
`qwen3-235b:f8`	FP8	~235GB	MindIE	Ascend
`qwen3-235b:i4`	INT4	~60GB	MindIE	Ascend
`qwen3-235b:bf16:mlguider`	BF16	~470GB	MLGuider	Ascend
`qwen3-235b:i8:mlguider`	INT8	~235GB	MLGuider	Ascend
`qwen3-235b:bf16:vllm`	BF16	~470GB	VLLM	Ascend
`qwen3-235b:i8:vllm`	INT8	~235GB	VLLM	Ascend
`qwen3-235b:bf16:vllm`	BF16	~470GB	VLLM	MACA
`qwen3-235b:i8:vllm`	INT8	~235GB	VLLM	MACA

简介

Qwen3-235B-A22B 是 Qwen3 系列的旗舰模型，采用 MoE（混合专家）架构，总参数量 235B，每个 token 激活 22B 参数。原生支持 32K 上下文长度，通过 YaRN 扩展可达 131K。

核心特性

混合思考模式：支持思考模式（复杂推理、数学、编程）与非思考模式（高效对话）无缝切换
增强推理能力：在数学、代码生成、常识推理上超越 QwQ 和 Qwen2.5
多语言支持：支持 119 种语言和方言
Agent 能力：精准集成外部工具，复杂 Agent 任务表现领先

下载源: ModelScope

Qwen3-235B

Models ​

简介 ​

核心特性 ​

Models

简介

核心特性