跳到主要内容
FAQ

常见问题

Rise VAST、CAMP、ModelX、MAX 产品选型、部署交付、商务合作、客户案例与公司资质——企业 AI 算力管理常见问题集中解答。

产品选型

VAST、CAMP、ModelX、MAX 怎么选?三层架构的边界与组合方式

01 Rise VAST、CAMP、ModelX、MAX 这四款产品我该怎么选?
按照"自下而上、按需叠加"的原则:Rise VAST 解决底层 GPU 虚拟化和异构纳管,是所有上层能力的基础;Rise CAMP 在 VAST 之上提供算力任务的智能调度、集群和多租户管理、配额管理、算力资源的监控和故障诊断;Rise ModelX 提供训推一体的模型服务平台和 AI 网关;Rise MAX 是把以上三层 + 硬件 + 预装模型打包成的一体机,开箱即用。

简单的选择逻辑:
  • 从零起步、不想踩坑 → 直接选 MAX 一体机
  • 已有 GPU 集群、利用率低 → 先上 VAST 把利用率拉起来
  • 已有 GPU 集群、调度策略乱 → 上 CAMP 做精细化调度
  • 想给提供AI开发环境 → 上 CAMP 提供 AI 开发服务
  • 想为企业内部和外部提供模型推理服务 → 直接上 ModelX,可独立运行
  • 大型生产集群、要做完整 MLOps → VAST + CAMP + ModelX 三层叠加
02 三层产品必须一起买吗?能逐步演进吗?
每一层都可以独立采购和部署。常见的演进路径:
  1. 第一阶段——用 VAST 把现有 GPU 集群利用率从 30% 拉到 70%+,看到成本收益
  2. 第二阶段——引入 CAMP 做多团队调度治理,提升算力任务调度效率
  3. 第三阶段——叠加 ModelX 把内部模型服务统一起来
也支持反向路径——先用 ModelX 接管模型服务,后续再下沉到 VAST/CAMP。每一层都基于 Kubernetes,可以热插拔,无需重建集群。
03 我已经有 GPU 集群了,从哪个产品入手最划算?
多数情况下从 VAST 入手 ROI 最高。原因:原生 K8s Device Plugin 只能整卡分配,集群里大量推理服务、Notebook、小模型训练任务"用不满一张卡",导致行业平均 GPU 利用率只有 30%。VAST 通过 vGPU 虚拟化让多个 Pod 共享一张卡,典型场景能把利用率拉到 70%+,相当于原集群的 GPU 数量"变多了 1 倍"。这可以较大幅度提升在硬件采购上的投资回报率。

延伸阅读:GPU 虚拟化技术指南 · GPU 池化加速训练与成本优化
04 如果我只想做模型推理服务,必须先买 VAST 吗?
不需要Rise ModelX 可以独立部署在任何标准 Kubernetes + GPU 集群上,提供模型仓库、推理引擎、AI 网关、Token 治理等完整能力。但VAST 加持效果更好——VAST 的 vGPU 切分能让一张物理卡同时跑多个推理服务,配合 ModelX 的智能路由,整体推理 ROI 可显著提升。

部署与交付

支持的交付形态、PoC 周期、升级路径与运维要求

01 支持哪些交付模式?纯软件 / 一体机 / 公有云?
提供 三种交付形态
  1. 纯软件 License 购买/订阅——客户提供硬件,我们负责软件安装、调优、升级和支持,适合已有 GPU 集群或对硬件有自主选型需求的客户
  2. Rise MAX 软硬一体机——硬件 + 软件 + 预装模型整体交付,1 小时上线,适合追求快速落地的客户
  3. 私有云一站式部署——为大型客户提供从机房规划、硬件采购、网络布线到软件部署的全流程交付
暂不提供公有云 SaaS 模式——所有产品都为私有化部署设计,确保数据不出企业。
02 典型 PoC 周期多长?部署架构和最小起步规模是什么样的?
典型 PoC 周期 2-4 周,包括环境准备、功能验证、性能测试与报告输出——得益于一键部署能力,平台核心组件可实现分钟级安装

平台采用"管控 + 计算分离"的部署架构:管理层基于 Kubernetes 云原生组件构建。测试环境最小起步规模:单节点即可启动 PoC——管理层与 GPU 计算层可复用同一台机器,物理机或虚拟机均可,只要挂载有 GPU 资源。客户可在现有集群的子集上运行,也可以搭建独立的测试环境。
03 安装部署需要客户做什么准备?运维门槛多高?
软件部署客户只需准备:标准 Kubernetes 集群(1.20+)、GPU 节点、网络和存储资源、运维通道(SSH/堡垒机)。一体机部署客户只需准备:标准机柜、电力(220V/32A 双路)、网络上联。日常运维门槛较低——所有组件都有 Web 控制台和完整的可观测性,常规操作(创建租户、调整配额、查看监控)非技术人员也能完成。涉及深度调优或故障处理由原厂认证工程师远程支持。提供原厂运维培训和认证。
04 典型的实施交付周期多长?
生产部署建议:管理层 3 节点高可用,计算层独立扩展,可接入不多于 500 台的 GPU 物理服务器集群。更大环境建议新增集群。同时需要根据规模和业务场景考虑存储平台、镜像仓库等组件的配置。

典型实施交付周期 2-4 周,包括部署架构设计、环境准备和验证、生产部署、功能验证、性能测试、报告输出、现场培训等。后续全程由原厂认证的工程师提供 7×24 支持
05 是否支持多集群、多地域、混合云管理?
支持Rise CAMP 提供联邦集群管理能力,可统一纳管多地域、多机房、多供应商的 Kubernetes 集群,实现跨集群任务调度、资源池化和统一监控。常见部署场景:
  1. 企业有多个 GPU 集群在多个地域的数据中心,需要集中管理、统一分配、统一提供算力服务
  2. 训练在 IDC,推理在边缘——通过 Rise Edge 实现中心训练 + 边缘推理 + OTA 模型分发
  3. 混合云溢出——本地集群打满时溢出到公有云,业务无感切换
06 升级路径是什么?版本更新会影响业务吗?
所有组件支持滚动升级、灰度发布、一键回滚,升级过程业务无感知。每年提供 2-3 个大版本(含新功能)和持续的安全补丁更新,纳入年度服务。升级前会经过版本兼容性测试,确保从任意历史版本可平滑升级到最新版。升级由原厂工程师远程或上门实施,不会出现"必须重建集群"的破坏性变更。也支持客户自行升级——所有版本都提供详细的升级文档和回滚预案。
07 购买 ModelX 后,是否提供模型推理的最佳实践?非标准模型如何支持?
购买 Rise ModelX 后,我们会提供主流开源模型的推理部署最佳实践,包括推荐的推理引擎选型、显存与算力配比建议、以及基于 AI 网关的负载均衡与弹性伸缩配置方案。对于 DeepSeek、Qwen 等热门模型系列,我们有经过生产验证的部署模板,可直接复用。
参考:DeepSeek V3/R1 671B GPU 需求分析 · DeepSeek 一体机方案

对于非标准模型(客户自研模型、私有微调模型、非主流框架模型等),提供三级支持
  1. 自助接入——ModelX 支持符合 OpenAI 兼容 API 规范的任意推理后端,客户可参照文档自行接入
  2. 远程协助——原厂工程师协助完成模型适配和性能基线测试
  3. 深度定制——对于特殊算子、自定义推理管线等复杂场景,双方共同研判技术方案,可能产生额外费用,具体在 PoC 或实施阶段协商确定

商务与合作

License 模型、技术支持、试用政策与培训

01 License 怎么算?按 GPU 卡数还是节点数?
按 GPU 卡数 License 购买/订阅,并根据 GPU 型号分级计价,具体单价请联系销售获取报价单(contact@riseunion.io)。
02 是否提供原厂技术支持?SLA 什么级别?
提供原厂三级技术支持
  1. L1 工单响应——紧急问题 30 分钟响应、普通问题 4 小时响应
  2. L2 远程介入——4 小时内定位
  3. L3 上门支持——重大故障 24 小时到场
关键客户根据需要可以购买驻场服务。

SLA 默认覆盖工作日 9×5,可选配 7×24 小时全年无休服务。所有支持都由原厂工程师直接提供,不外包、不层层转包。同时提供季度健康检查、年度优化巡检、预防性升级等主动服务。
03 试用 / PoC 政策是怎样的?
提供免费 PoC,周期 2-4 周,包括方案设计、环境部署、功能验证、性能测试和最终报告。PoC 阶段由原厂工程师驻场或远程支持,所有测试数据和结论归客户所有。如客户希望进行更长周期的试用(1-3 个月),可签订试用协议,提供有限期 license。PoC 通过率超过 90%——多数客户在试用阶段就能验证 GPU 利用率提升、成本下降等核心收益。
04 是否提供原厂培训和认证?
提供三级原厂培训体系
  1. 用户培训——面向开发者和算法工程师,1 天,讲解如何提交任务、使用模型服务、查看监控
  2. 运维培训——面向 IT 运维人员,2-3 天,讲解日常运维、配额管理、故障排查
  3. 收费的高级培训——面向架构师和深度用户,3-5 天,讲解调度策略调优、性能优化、二次开发
培训可在客户现场或线上进行,培训后提供原厂认证证书。
05 我是代理商,如何成为你们的合作伙伴?
我们有完善的合作伙伴政策,欢迎联系 contact@riseunion.io 了解详情。

客户与案例

落地行业、参考案例与生态合作

01 现有客户主要在哪些行业?规模化生产实践有哪些?
产品已在 金融、政企、交通、教育、医疗、能源 等行业实现大规模生产级落地。公开可查的标杆案例包括:比亚迪(自动驾驶模型训练)、华泰期货(金融 AI 推理)、国家超算济南中心(公共算力服务)、重庆医科大附二院(医疗 AI)、赛宝实验室(科研 MaaS 平台)等。详细案例和行业解决方案请访问行业案例页
02 是否有同行业公开案例可以参考?能否引荐参考客户沟通?
所有公开案例都在行业案例页列出,按行业分类,包含技术方案、部署规模和价值收益。对于潜在客户,我们可以在客户授权的前提下安排同行业参考客户的电话或现场交流,帮助评估实施风险和收益。具体的客户引荐请联系销售(contact@riseunion.io)单独沟通。

公司与资质

技术背景、合规认证与开源贡献

01 公司技术背景如何?有哪些资质和合规认证?
北京睿思智联科技有限公司是国家高新技术企业、北京市专精特新中小企业AIIC 算力池化工作组组长单位,主导起草《异构算力虚拟化及池化系统要求》团体标准,参编《多样性算力软硬协同调优行动计划》。已通过 ISO 9001、ISO 27001、ISO 20000、CMMI3 等国际管理体系认证,拥有 10+ 项计算机软件著作权与专利。产品已在多个金融、政企客户完成 等保 2.0 三级 环境部署。
了解更多:关于睿思智联
02 开源贡献和社区参与情况?
睿思智联是 CNCF Sandbox 项目 HAMi(Heterogeneous AI Computing Virtualization Middleware)的核心贡献者之一,HAMi 是国内最活跃的 GPU 虚拟化开源项目。公司持续向上游贡献代码、参与项目治理,同时把企业级特性(多卡虚拟化、国产芯片支持、生产级高可用等)沉淀到 Rise VAST 商业版。除 HAMi 外,团队也参与 Volcano、Kubernetes 等上游社区。
延伸阅读:HAMi v2.8.0 发布 · HAMi 源码解析
03 公司的融资和发展情况?
公司已完成数千万元融资(梅花创投独家投资),并获 第四范式 战略投资。Rise VAST 是与第四范式联合开发的企业级 AI 算力管理产品。公司持续投入研发,在 AI 算力管理与调度领域保持技术领先。

没找到你的问题?

联系我们的技术与商务团队,获取定制化方案设计与 PoC 支持。

contact@riseunion.io