新增四款模型,覆盖通用对话、代码生成与 OCR 场景。
新增 Omni-Infer 引擎,扩展推理后端选择。xw show --engines 查看可用引擎。
版本化配置系统上线,支持服务器端下发、多版本并存与离线回退。
新增 xw reload 命令,改完配置一条命令生效,无需重启服务,生产环境零停机更新。
运行时迁移为配置驱动架构,支持自定义 Docker 镜像与芯片变体识别(沐曦等)。
runtime_params.yaml 中自定义 Docker 镜像xw ps 输出新增本地端口和容器 IDxw show --engines 展示模型支持的推理引擎xw config info 显示当前配置版本xw ls 仅展示已完全下载的模型quick-install.sh 验证提示runtime_paramsv 前缀)ext_sandboxes 配置结构,减少冗余