跳到主要内容
AI 基础设施管理专家

从资源分配,到价值交付

聚得全 · 算得明 · 切得细 · 用得准 · 管得清

6,000+
GPU 纳管
10+
芯片厂商适配
50+
企业客户
30→70%
利用率提升

AI 智算管理架构

三层架构覆盖从异构硬件管理、智能调度到模型服务的完整链路,配合算力运维与运营能力,交付可管、可控、可运营的 AI 基础设施

Rise ModelX

算力即服务 · 管得清:训推一体的 AI 平台,从模型开发、训练到推理服务的全生命周期管理

训推一体

训练与推理在同一平台管理,模型训练完成后一键发布为推理服务,无需两套环境,无需跨平台迁移

模型仓库与推理服务

内置模型广场,支持一键部署推理服务,集成 vLLM/SGLang/MindIE 等主流推理引擎

AI 网关

服务路由、限流配额、MCP 协议转换、多模型效果对比,为 Agent 时代提供企业级流量管控

计量计费

支持资源维度与 Token 维度双轨计费,按 API-KEY 粒度统计分析,实现精细化成本核算

01

异构管理是基础

将不同架构、不同厂商的算力整合成统一的资源池

02

资源利用率是目标

通过池化、切分和调度,最大化硬件投资回报,降低总拥有成本

03

业务敏捷性是结果

快速满足 Agent 的 Token 消费场景,成本感知的试错,关键业务的 SLA 保障

已适配芯片

NVIDIA
ascend
hygon
cambricon
iluvatar
metax
mthread
kunlunxin
enflame
PPU
更多国产厂商持续接入中...

客户声音

来自金融、能源、制造、教育等行业的真实反馈

金融

"部署 Rise VAST 后,600+ 台异构服务器第一次实现了统一纳管。原来各团队独占 GPU,利用率不到 30%;现在通过 vGPU 切分和共享池,整体利用率稳定在 70% 以上。"

某国有银行 · AI 平台负责人

通信

"100+ 台服务器的集群上跑了 500 多个模型服务,Rise CAMP 的优先级调度帮我们解决了在线推理和离线训练抢资源的问题,再也不用半夜爬起来手动调配了。"

某头部运营商 · 智算中心运维主管

制造

"以前每上一个 AI 项目就要采购一批新服务器,现在通过算力池化,现有硬件利用率提升了 60%,新项目直接从资源池申请,上线周期从 3 周缩短到 2 天。"

某制造企业 · 数字化转型总监

科研

"多个研究组共享同一个 GPU 集群,之前经常因为资源冲突影响实验进度。用了 Rise CAMP 的多租户隔离和配额管理后,利用率从 30% 到了 80%,硬件投入省了 40%。"

某研究院 · 计算中心主任

能源

"国产昇腾卡和 NVIDIA 卡混在一起管理一直是我们的痛点。Rise VAST 一套框架全部纳管,运维团队从 6 个人减到 2 个人,故障定位从小时级缩短到分钟级。"

某能源集团 · 信息化部总经理

零售

"智能客服、推荐系统、库存预测十几个模型跑在同一个集群上,用了 vGPU 切分后,同样的业务量硬件投入减少了 30%,推理响应时间反而更快了。"

某零售企业 · CTO

教育

"师生共用算力最怕的就是谁把资源占满了别人用不了。Rise CAMP 的配额管理和资源回收策略完美解决了这个问题,空闲 GPU 自动回收再分配,再也没有投诉了。"

某高校 · 人工智能学院实验室主任

金融

"我们需要同时跑风控、营销、客服三条业务线的模型,每条线的 SLA 要求不一样。优先级调度让在线风控永远有资源保障,离线训练在闲时自动填充,一套集群顶过去三套。"

某金融机构 · AI 中台架构师

规模化验证

600+
服务器统一纳管
国有银行生产环境
500+
模型服务部署
头部运营商智算中心
30→70%
GPU 利用率提升
多客户生产验证
40%
硬件投入节省
科研院所共享集群
3周→2天
项目上线周期
制造业数字化转型

两大场景,差异化管理

推理 / 开发 / 测试
  • 任务短、高频、按需访问
  • 大小模型混合,波动大
  • GPU 分片 / 动态调度,按需使用
  • 开箱即用的开发环境,随时可用的算力
训练 / 微调
  • 任务长、连续运行
  • 资源占用高、带宽高
  • 单机多卡 / 多机多卡,长时间占用
  • 分布式调度、快速故障定位、自动回收资源

应用场景

训推一体

训练与推理在同一平台统一管理,从数据处理、模型微调到推理部署全流程打通,训练完成后一键发布为推理服务,无需跨平台迁移。

Agent 时代的多模型混部

将 7B 路由模型、14B 总结模型、8B Embedding 模型精准切分到同一张 80G 卡(20G + 30G + 30G),硬隔离互不影响,单卡变三卡。

国产信创算力池化

统一纳管 NVIDIA H20、昇腾 910B、昆仑芯 P800 等多架构集群,突破原厂固定切分限制,按需动态分配,资源利用率提升至 80-90%。

多集群统一运营

跨地域、跨架构的多 K8s 集群统一管理,基于团队和项目的资源配额,按资源和模型双维度计量计费,实现精细化成本核算。

核心优势

自主可控

  • 自研 vGPU 虚拟化,零侵入架构
  • 10+ 国产芯片厂商适配认证
  • 10+ 计算机软件著作权与专利

生产验证

  • 服务中石油、国家电网、济南超算等标杆客户
  • 纳管 6000+ GPU 的大规模集群实战经验
  • 覆盖金融、能源、制造、教育等行业

开放生态

  • HAMi 开源社区核心维护者
  • 支持 Volcano 原生调度器扩展
  • API / WebUI / MCP 多协议接入

标准引领

  • 工委会 AI 算力池化工作组组长单位
  • 主导起草《异构算力虚拟化及池化系统要求》
  • 国家高新技术企业 · ISO 27001 · CMMI3