模型库

浏览玄武支持的所有模型。

快速筛选

全部QwenDeepSeekGLMKimi多模态

Qwen 通义千问系列

Qwen3-235B

Qwen (阿里云)

HOT

参数：235B MoE大小：~470GB

W4A8BF16INT8MindIEMLGuider

Qwen3 旗舰模型，235B MoE 架构，22B 激活参数，多语言能力出色

Qwen3-Next-80B

Qwen (阿里云)

NEW

参数：80B MoE大小：~160GB

W8A8BF16MindIEVLLM

下一代 Qwen，Hybrid Transformer-Mamba 架构，3.9B 激活参数，百万上下文

Qwen3-32B

Qwen (阿里云)

参数：32B Dense大小：~64GB

BF16W8A8INT4MindIEMLGuiderVLLM

平衡性能与效率的主力模型，适合大多数场景

Qwen3-30B

Qwen (阿里云)

参数：30B MoE大小：~60GB

BF16INT8INT4MindIEVLLM

轻量 MoE 模型，30B 参数仅 3B 激活，高效推理

Qwen2.5-72B

Qwen (阿里云)

参数：72B Dense大小：~144GB

BF16W8A8INT4MindIEMLGuiderVLLM

Qwen2.5 旗舰 Dense 模型，长文本能力强，稳定可靠

QwQ

Qwen (阿里云)

HOT

参数：32B Dense大小：~64GB

BF16INT8W4A8MindIEMLGuiderVLLM

专注推理的思考模型，擅长数学和代码

Qwen3-Coder

Qwen (阿里云)

参数：32B Dense大小：~64GB

BF16INT8W8A8MindIEMLGuiderVLLM

代码专用模型，支持多种编程语言

DeepSeek 系列

DeepSeek-V3.2

deepseek-ai

HOT

参数：685B MoE大小：~1.3TB

BF16FP8W8A8MindIEMLGuiderVLLM

DeepSeek 最新旗舰模型，685B MoE 架构，性能对标 GPT-4o

DeepSeek-V3.2-Exp

deepseek-ai

NEW

参数：685B MoE大小：~1.3TB

BF16FP8MindIEMLGuiderVLLM

V3.2 实验版本，包含最新优化，推理速度更快

DeepSeek-V3.1

deepseek-ai

参数：671B MoE大小：~1.2TB

BF16INT8W8A8MindIEMLGuiderVLLM

稳定版本，经过大规模生产验证

DeepSeek-Distill-Qwen-32B

deepseek-ai

参数：32B Dense大小：~64GB

BF16INT8W4A8MindIEMLGuiderVLLM

基于 Qwen 架构的蒸馏模型，继承 DeepSeek 能力，推理更高效

Qwen 多模态系列

Qwen3-VL-MoE

Qwen (阿里云)

参数：72B MoE大小：~144GB类型：Vision

BF16INT8MindIEMLGuiderVLLM

视觉语言 MoE 模型，支持图像理解和 OCR

Qwen3-VL-32B

Qwen (阿里云)

参数：32B Dense大小：~64GB类型：Vision

BF16INT8W8A8MindIEMLGuiderVLLM

32B 视觉语言模型，平衡效果与效率

Qwen2.5-VL

Qwen (阿里云)

参数：72B Dense大小：~144GB类型：Vision

BF16INT8MindIEMLGuiderVLLM

Qwen2.5 视觉语言模型，图像理解能力强

GLM 智谱系列

GLM-5

智谱 AI (ZhipuAI)

HOT

参数：745B MoE大小：~419.94GB

BF16INT8W4A8MindIEMLGuiderVLLM

是智谱新一代的旗舰基座模型，面向 Agentic Engineering 打造，能够在复杂系统工程与长程 Agent 任务中提供可靠生产力。

GLM-4.5

智谱 AI (ZhipuAI)

NEW

参数：358B Dense大小：~64GB

BF16INT8W8A8MindIEMLGuiderVLLM

智谱最新一代基座模型，综合能力出色

GLM-4.7-Flash

智谱 AI (ZhipuAI)

参数：31B MoE大小：~18GB

BF16INT8W4A8MindIEMLGuiderVLLM

轻量快速版本，适合低延迟场景

Kimi 月之暗面系列

Kimi-K2-0905

月之暗面 (Moonshot AI)

HOT

参数：1T MoE大小：~2TB

BF16FP8MindIEMLGuiderVLLM

Kimi 旗舰模型，万亿参数 MoE，长文本能力顶尖

Kimi-K2.5

月之暗面 (Moonshot AI)

参数：MoE大小：~1TB

BF16INT8MindIEMLGuiderVLLM

K2 系列优化版，推理效率提升

量化格式说明

格式	精度	显存占用	适用场景
BF16	高	100%	最佳效果，显存充足时首选
FP8	较高	~50%	大模型推荐，精度损失小
INT8 / I8	中	~50%	通用量化，平衡效果和效率
W8A8	中	~50%	权重和激活都量化
INT4 / I4	较低	~25%	极致压缩，适合资源受限场景

推理引擎说明

引擎	类型	说明
MindIE	华为原生	默认引擎，昇腾硬件官方支持，稳定性最佳
MLGuider	玄武自研	深度优化引擎，部分模型性能最优
VLLM	开源社区	功能丰富，支持多种优化技术
SGLang	开源社区	高性能推理引擎，支持结构化生成

模型库 ​

快速筛选 ​

Qwen 通义千问系列 ​

DeepSeek 系列 ​

Qwen 多模态系列 ​

GLM 智谱系列 ​

Kimi 月之暗面系列 ​

量化格式说明 ​

推理引擎说明 ​

模型库

快速筛选

Qwen 通义千问系列

DeepSeek 系列

Qwen 多模态系列

GLM 智谱系列

Kimi 月之暗面系列

量化格式说明

推理引擎说明