Qwen3-235B
Qwen3 旗舰模型,235B MoE 架构,22B 激活参数
MoE235B / 22B active131K context
bash
xw run qwen3-235bbash
curl http://localhost:8000/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "qwen3-235b",
"messages": [{"role": "user", "content": "Hello"}]
}'Models
| 名称 | 量化 | 大小 | 引擎 | 平台 |
|---|---|---|---|---|
qwen3-235b | W4A8 | ~120GB | MindIE | Ascend |
qwen3-235b:bf16 | BF16 | ~470GB | MindIE | Ascend |
qwen3-235b:i8 | INT8 | ~235GB | MindIE | Ascend |
qwen3-235b:f8 | FP8 | ~235GB | MindIE | Ascend |
qwen3-235b:i4 | INT4 | ~60GB | MindIE | Ascend |
qwen3-235b:bf16:mlguider | BF16 | ~470GB | MLGuider | Ascend |
qwen3-235b:i8:mlguider | INT8 | ~235GB | MLGuider | Ascend |
qwen3-235b:bf16:vllm | BF16 | ~470GB | VLLM | Ascend |
qwen3-235b:i8:vllm | INT8 | ~235GB | VLLM | Ascend |
qwen3-235b:bf16:vllm | BF16 | ~470GB | VLLM | MACA |
qwen3-235b:i8:vllm | INT8 | ~235GB | VLLM | MACA |
简介
Qwen3-235B-A22B 是 Qwen3 系列的旗舰模型,采用 MoE(混合专家)架构,总参数量 235B,每个 token 激活 22B 参数。原生支持 32K 上下文长度,通过 YaRN 扩展可达 131K。
核心特性
- 混合思考模式:支持思考模式(复杂推理、数学、编程)与非思考模式(高效对话)无缝切换
- 增强推理能力:在数学、代码生成、常识推理上超越 QwQ 和 Qwen2.5
- 多语言支持:支持 119 种语言和方言
- Agent 能力:精准集成外部工具,复杂 Agent 任务表现领先

