Skip to content

Qwen3-235B

Qwen3 旗舰模型,235B MoE 架构,22B 激活参数

MoE235B / 22B active131K context
bash
xw run qwen3-235b
bash
curl http://localhost:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-235b",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

Models

名称量化大小引擎平台
qwen3-235bW4A8~120GBMindIEAscend
qwen3-235b:bf16BF16~470GBMindIEAscend
qwen3-235b:i8INT8~235GBMindIEAscend
qwen3-235b:f8FP8~235GBMindIEAscend
qwen3-235b:i4INT4~60GBMindIEAscend
qwen3-235b:bf16:mlguiderBF16~470GBMLGuiderAscend
qwen3-235b:i8:mlguiderINT8~235GBMLGuiderAscend
qwen3-235b:bf16:vllmBF16~470GBVLLMAscend
qwen3-235b:i8:vllmINT8~235GBVLLMAscend
qwen3-235b:bf16:vllmBF16~470GBVLLMMACA
qwen3-235b:i8:vllmINT8~235GBVLLMMACA

简介

Qwen3-235B-A22B 是 Qwen3 系列的旗舰模型,采用 MoE(混合专家)架构,总参数量 235B,每个 token 激活 22B 参数。原生支持 32K 上下文长度,通过 YaRN 扩展可达 131K。

核心特性

  • 混合思考模式:支持思考模式(复杂推理、数学、编程)与非思考模式(高效对话)无缝切换
  • 增强推理能力:在数学、代码生成、常识推理上超越 QwQ 和 Qwen2.5
  • 多语言支持:支持 119 种语言和方言
  • Agent 能力:精准集成外部工具,复杂 Agent 任务表现领先

基于 Apache 2.0 许可发布