About DeepPolicy

用工业智能体,重塑流程工业的优化控制范式

深策云控(DeepPolicy)源自中国科学院深圳先进技术研究院,以面向工程应用的强化学习技术为核心,专注为流程工业、能源、半导体、制冷系统等关键行业提供自主优化工业智能体系统,推动工业控制从被动响应走向主动优化。

7
+
自研强化学习核心算法
10
+
企业深度合作
30
%+
全厂综合能效提升
40
+
高水平学术论文

Research Origin

源自中国科学院深圳先进技术研究院

团队深耕强化学习、最优控制与工业系统建模多年,长期承担国家级重点课题,在 NeurIPS、ICML、AAAI 等顶级会议与期刊发表论文 40+ 篇,将前沿算法与真实工业过程建立起稳定的工程化通路。

强化学习最优控制工业系统建模安全探索离线策略评估模仿学习多智能体NeurIPS / ICML / AAAI
Research Pillars
01

算法研究

围绕工程可落地的强化学习,持续投入安全约束、样本效率、离线训练等方向。

02

平台工程

把实验室算法沉淀为可交付的平台底座 ReinforceOS / ReinforceLab / ReinforceBox。

03

现场实践

深入石化、能源、数据中心等一线现场,以真实工况反哺研究,形成闭环迭代。

Milestones

从研究走向产业

不同阶段的关键节点,见证算法如何在真实工业场景中逐步落地。

Phase 01
2022

技术积累

深耕强化学习算法研究,成功攻克环境干扰与观测信息趋势等难题。在顶级国际期刊已发表多篇论文,并获中美欧日相关专利授权。

Phase 02
2023

技术验证

工业智能体初步成型,核心技术在日本东京工厂完成实际场景验证,获业界认可。同期完成与华为在制冷系统节能方向合作。

Phase 03
2024

寻找合作

公司正式成立并运营,工业智能体整体架构基本完善。面向流程工业广泛寻求适配场景与合作伙伴,并加速技术落地与商业化进程。

Phase 04
2025

行业验证

工业智能体实现场景化应用验证。在石油化工与材料化工领域开始实际部署,助力提质增效;在制冷系统与数据中心完成部署,降低制冷能耗。

Phase 05
2026

产品平台发布

正式发布 ReinforceOS、ReinforceLab、ReinforceBox 三大产品,构建「平台—验证—终端」完整闭环。

Ecosystem Partners

与行业龙头并肩验证

我们与国内领先的 DCS 控制系统供应商与流程工业企业建立长期合作,在真实装置上完成算法验证与规模化部署。

DCS Partner

DCS 控制系统伙伴

与主流 DCS 系统深度协同,策略下发到工艺装置。

Process Industry

流程工业龙头企业

在石化与化工装置完成真实工况下的算法验证。

Data Center

大型数据中心运营商

冷站群控 / PUE 优化 / 能效管理落地验证。

Research Ally

科研院所与高校

依托中科院等科研资源,持续推进算法前沿研究。

已与 10+ 家头部企业建立深度合作关系,持续扩展中。

Core Capabilities

我们做什么

围绕「算法 — 平台 — 终端」三层构建完整能力栈,让策略可训练、可验证、可部署、可运维。

01

工业智能体

基于强化学习的自主决策体,在约束下持续寻优,替代传统规则与手动整定。

02

优化控制平台

面向工艺对象的数据接入、环境建模、策略训练与在线评估一体化工程底座。

03

数据验证回放

基于离线数据完成算法校核、策略回放与收益预估,降低现场试错成本。

04

边缘控制终端

工业级 AI 控制盒,支持与 DCS / PLC 协同,在现场完成低时延闭环控制。

05

云边协同

云端训练 / 边缘部署 / 双向同步,策略可远程升级、现场自适应。

06

能效与稳定性

围绕 PUE、单耗、稳定率等关键指标持续优化,实现可度量的业务收益。

07

安全与合规

引入约束强化学习与安全探索机制,严格保护工艺边界与生产安全。

08

行业复用

覆盖石化、电力、水务、半导体、数据中心等多行业模板,快速场景迁移。

Industry Scenes

我们服务的真实现场

覆盖石油化工、材料化工、造纸与制冷系统等真实现场,每一个场景都在用真实工况反哺算法,持续打磨强化学习的工程化边界。

石油化工
Petrochemical01

石油化工

工业智能体实时汇聚装置区、管线与储运环节的千万级数据,动态调优反应温度、压力及物料配比,在保障安全联锁的同时,提升产品质量稳定性,降低能耗与碳排放,并提前预警泄漏、腐蚀等隐患。

了解更多
材料化工
Material Chemistry02

材料化工

工业智能体通过分析配料、反应、分离、纯化、干燥、煅烧等工艺的多变量耦合关系,自动寻优配方与工序参数,减少批次质量波动,从中试介入缩短新产品从小试到量产的周期。

了解更多
造纸业
Paper Industry03

造纸业

工业智能体联动打浆、流送、干燥与卷取工段,不固定人工专家经验,实时调整浓度、车速及蒸汽用量,在稳定成纸定量与水分的同时降低成本损耗与烘干部能耗。

了解更多
制冷系统
Refrigeration04

制冷系统

工业智能体结合冷负荷预测与环境变化,自主决策压缩机启停、频率,冷凝压力设定及出风口风量,使制冷效率始终贴近最优能效曲线,维持空间温度稳定,并推送异常工况诊断建议。

了解更多

Mission & Vision

让先进算法,真正走进工业现场

我们相信,下一代工业控制的胜负手,不在于更多的传感器或更大的数据库,而在于「能自我优化的策略」。

让工业控制自我进化
Mission

让工业控制自我进化

以强化学习为内核,为流程工业、能源、半导体、制冷等关键行业提供可交付、可验证、可持续进化的自主优化智能体,帮助真实生产过程从"被动响应"迈向"主动优化"。

成为全球工业智能优化的底座
Vision

成为全球工业智能优化的底座

打造覆盖平台、验证、终端的全链路产品体系,让每一个关键装置都能在算法的持续协同下,更安全、更高效、更低碳地运行。

Contact Us

开启一次可验证的合作

如果您所在的企业正在寻找一条可落地的工业智能优化路径,欢迎与我们取得联系。

在线留言

科研中心 深圳

广东省深圳市南山区西丽学苑大道1068号F栋3层

中国科学院深圳先进技术研究院·材料人工智能研究中心

研发中心 北京

北京市丰台区汽车博物馆西路10号院9号楼4层406-2185

北京深策云控科技有限公司

业务中心 马鞍山

安徽省马鞍山市花山区马鞍山软件园E1科研楼

马鞍山深策云控科技有限公司