模型库
浏览玄武支持的所有模型。
快速筛选
Qwen 通义千问系列
Qwen3-235B
Qwen (阿里云)
Qwen3 旗舰模型,235B MoE 架构,22B 激活参数,多语言能力出色
Qwen3-Next-80B
Qwen (阿里云)
下一代 Qwen,Hybrid Transformer-Mamba 架构,3.9B 激活参数,百万上下文
Qwen3-32B
Qwen (阿里云)
平衡性能与效率的主力模型,适合大多数场景
Qwen3-30B
Qwen (阿里云)
轻量 MoE 模型,30B 参数仅 3B 激活,高效推理
Qwen2.5-72B
Qwen (阿里云)
Qwen2.5 旗舰 Dense 模型,长文本能力强,稳定可靠
QwQ
Qwen (阿里云)
专注推理的思考模型,擅长数学和代码
Qwen3-Coder
Qwen (阿里云)
代码专用模型,支持多种编程语言
DeepSeek 系列
DeepSeek-V3.2
deepseek-ai
DeepSeek 最新旗舰模型,685B MoE 架构,性能对标 GPT-4o
DeepSeek-V3.2-Exp
deepseek-ai
V3.2 实验版本,包含最新优化,推理速度更快
DeepSeek-V3.1
deepseek-ai
稳定版本,经过大规模生产验证
DeepSeek-Distill-Qwen-32B
deepseek-ai
基于 Qwen 架构的蒸馏模型,继承 DeepSeek 能力,推理更高效
Qwen 多模态系列
Qwen3-VL-MoE
Qwen (阿里云)
视觉语言 MoE 模型,支持图像理解和 OCR
Qwen3-VL-32B
Qwen (阿里云)
32B 视觉语言模型,平衡效果与效率
Qwen2.5-VL
Qwen (阿里云)
Qwen2.5 视觉语言模型,图像理解能力强
GLM 智谱系列
GLM-4.5
智谱 AI (ZhipuAI)
智谱最新一代基座模型,综合能力出色
GLM-4.7-Flash
智谱 AI (ZhipuAI)
轻量快速版本,适合低延迟场景
Kimi 月之暗面系列
Kimi-K2-0905
月之暗面 (Moonshot AI)
Kimi 旗舰模型,万亿参数 MoE,长文本能力顶尖
Kimi-K2.5
月之暗面 (Moonshot AI)
K2 系列优化版,推理效率提升
量化格式说明
| 格式 | 精度 | 显存占用 | 适用场景 |
|---|---|---|---|
| BF16 | 高 | 100% | 最佳效果,显存充足时首选 |
| FP8 | 较高 | ~50% | 大模型推荐,精度损失小 |
| INT8 / I8 | 中 | ~50% | 通用量化,平衡效果和效率 |
| W8A8 | 中 | ~50% | 权重和激活都量化 |
| INT4 / I4 | 较低 | ~25% | 极致压缩,适合资源受限场景 |
推理引擎说明
| 引擎 | 类型 | 说明 |
|---|---|---|
| MindIE | 华为原生 | 默认引擎,昇腾硬件官方支持,稳定性最佳 |
| MLGuider | 玄武自研 | 深度优化引擎,部分模型性能最优 |
| VLLM | 开源社区 | 功能丰富,支持多种优化技术 |
| SGLang | 开源社区 | 高性能推理引擎,支持结构化生成 |

