Skip to content

Qwen2.5-72B

Qwen2.5 旗舰 Dense 模型,长文本能力强,稳定可靠

Dense72B128K context
bash
xw run qwen2.5-72b
bash
curl http://localhost:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen2.5-72b",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

Models

名称量化大小引擎平台
qwen2.5-72bBF16~144GBMindIEAscend
qwen2.5-72b:bf16BF16~144GBMindIEAscend
qwen2.5-72b:i8W8A8~72GBMindIEAscend
qwen2.5-72b:f8FP8~72GBMindIEAscend
qwen2.5-72b:i4INT4~36GBMindIEAscend
qwen2.5-72b:bf16:mlguiderBF16~144GBMLGuiderAscend
qwen2.5-72b:i8:mlguiderW8A8~72GBMLGuiderAscend
qwen2.5-72b:bf16:vllmBF16~144GBVLLMAscend
qwen2.5-72b:i8:vllmW8A8~72GBVLLMAscend
qwen2.5-72b:i4:vllmINT4~36GBVLLMAscend
qwen2.5-72b:bf16:vllmBF16~144GBVLLMMACA
qwen2.5-72b:i8:vllmW8A8~72GBVLLMMACA
qwen2.5-72b:bf16:sglangBF16~144GBSGLangAscend

简介

Qwen2.5-72B 是 Qwen2.5 系列的旗舰 Dense 模型,72B 参数量,原生支持 128K 上下文。在代码生成、数学推理、长文本理解等任务上表现出色,是经过大规模生产验证的稳定选择。

核心特性

  • 大参数量:72B Dense 架构,综合能力强
  • 长上下文:原生支持 128K tokens
  • 稳定可靠:Qwen2.5 系列,经过广泛验证
  • 多语言支持:支持 29 种语言

基于 Apache 2.0 许可发布