Skip to content

Qwen3-32B

平衡性能与效率的主力模型,适合大多数生产场景

Dense32B128K context
bash
xw run qwen3-32b
bash
curl http://localhost:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen3-32b",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

Models

名称量化大小引擎平台
qwen3-32bBF16~64GBMindIEAscend
qwen3-32b:bf16BF16~64GBMindIEAscend
qwen3-32b:i8W8A8~32GBMindIEAscend
qwen3-32b:f8FP8~32GBMindIEAscend
qwen3-32b:i4INT4~16GBMindIEAscend
qwen3-32b:bf16:mlguiderBF16~64GBMLGuiderAscend
qwen3-32b:i8:mlguiderW8A8~32GBMLGuiderAscend
qwen3-32b:bf16:vllmBF16~64GBVLLMAscend
qwen3-32b:i8:vllmW8A8~32GBVLLMAscend
qwen3-32b:i4:vllmINT4~16GBVLLMAscend
qwen3-32b:bf16:vllmBF16~64GBVLLMMACA
qwen3-32b:i8:vllmW8A8~32GBVLLMMACA
qwen3-32b:bf16:sglangBF16~64GBSGLangAscend

简介

Qwen3-32B 是 Qwen3 系列中最受欢迎的 Dense 模型,32B 参数量在性能和推理效率之间取得了出色的平衡。支持思考模式与非思考模式切换,适合大多数企业级应用场景。

核心特性

  • 双模式推理:思考模式用于复杂推理,非思考模式用于快速响应
  • 出色性价比:32B 参数量,单机部署友好
  • 全面能力:代码、数学、多语言、长文本综合能力强
  • 生产就绪:经过大规模验证,稳定可靠

基于 Apache 2.0 许可发布