主要收获
- 自动化对于现代补丁管理、漏洞优先级排序、配置监控以及修复工作流而言至关重要。
- 不受管控的自主安全执行(包括补丁部署、配置更改或自动化修复)会在停机可能导致安全或财务后果的环境中引入运营风险。
- 在电网、生产线或国防网络中,若在错误的时间窗口内实施变更,绝非微不足道的不便,而是一起事件。
- 该领域由三个框架规范:NERC CIP(能源/公用事业)、IEC 62443(工业控制系统)和 NIST SP 800-82(ICS 安全)。这三个框架均强调对安全变更进行有据可查的授权、验证、测试及问责。
- 当审批环节、政策和审计追踪被纳入流程时,自动化工作流可以支持治理。但当“系统决定”取代了可追责的人为授权时,它们就会成为一种风险。
- 人工智能在分析层能带来最大价值:按风险等级排序的发现结果、配置漂移信号、按优先级排序的补丁列表,而非在执行层。
- 有效的模式:AI 提供信息,人类授权行动,每次变更都会记录在可追溯的身份下。
在变电站,某个补丁在维护窗口之外被部署。在生产周期内,自动化修复系统修改了一条防火墙规则。在任何操作员审查之前,一项配置变更已在分布式运营技术(OT)网络中传播开来。
虽然具体情况各不相同,但故障模式却如出一辙:自动化系统在未经人工授权的情况下自行执行操作,等到有人察觉时,变更已经推送到生产环境。
自动化现已成为现代安全运营不可或缺的一部分,尤其是在漏洞利用时间窗口和补丁部署窗口不断缩短的背景下。风险并不在于自动化本身,而在于那种在缺乏可追溯的人工审批、运营背景以及记录在案的授权轨迹的情况下,实施会影响生产环境的变更的自主安全执行行为。
在关键基础设施环境中,这些决策会带来运营风险,而建立规范的人工监督机制正是为了防范此类风险。
代理式人工智能与操作理论环境的不匹配
当前这波基于代理的人工智能平台浪潮,反映了自主执行如何正在重塑安全运营,特别是在以速度为首要设计目标的企业IT环境中。
关键基础设施的运行面临着截然不同的制约因素。
电网中的保护继电器无法在运行周期中途重启。控制生产线的可编程逻辑控制器(PLC)的配置变更无法在几秒内回滚。在生产运行过程中触发的自动化修复步骤会影响物理流程,而不仅仅是服务器。
在这些环境中,安全团队需要针对一个不同的问题来评估自主能力:不是“它能多快做出响应?”,而是“一旦出错,由谁负责?”
下次审计将提出的合规问题
在您即将进行的下一次 NERC CIP 或 IEC 62443 审计之前,请回答以下问题:您当前的安全平台是否会生成一份带有时间戳的记录,明确记载了每项安全变更的授权人?
NERC CIP-007要求对大电网系统中网络资产的每一项变更都制定具体的补丁管理程序:包括有据可查的评估、测试证据和部署时间表。IEC 62443-2-3规定了工业自动化和控制系统中补丁管理及配置变更的授权职责,包括每项操作的责任归属。NIST SP 800-82明确指出,工业控制系统(ICS)的安全变更必须在部署前(而非部署后)进行风险评估、验证测试,并与运营相关方进行协调。
当通过基于策略的审批、部署环、维护窗口控制以及详细的审计日志将治理机制嵌入流程时,自主工作流即可支持这种控制模型。
但当自主执行掩盖了授权链时,它就不符合该模型。变更发生后,日志显示系统已采取行动,而审计员会询问是谁批准了该操作。如果不存在可追溯的人为授权事件,该记录便是不完整的。
由人工控制且记录了授权步骤的平台会生成审计轨迹。而不受管控的自主平台则会引发法律责任。
安全平台作为攻击面
安全管理平台本质上拥有特权访问权限。一个被授权在数百个部署环境中推送配置变更、部署补丁并管理策略的平台,正是攻击者会优先针对的资产。
当该平台自主运行时,攻击面会显著扩大。一旦自主系统遭到入侵,在人工操作员察觉到入侵之前,攻击者便可在所有已连接的部署环境中大规模执行操作。攻击者将继承该平台的执行权限,并同时将其用于补丁管理、配置更改和策略执行。
这绝非纸上谈兵。2026年初,一款广泛部署的补丁管理平台中存在三个关键的零日漏洞,导致攻击者可在企业环境中进行未经身份验证的远程代码执行。美国网络安全与基础设施安全局(CISA)已将这些漏洞及类似漏洞列为“已知被利用的漏洞”,要求立即进行修复。一旦此类漏洞导致自主平台遭到入侵,在任何警报触发之前,攻击者便能向所有连接的终端设备推送恶意更改。
一个在执行变更前需要人工审批的平台可以限制这种影响范围。如果执行前需要人工审批,仅凭被盗的凭据就很难触发大规模的自动化变更。
人工智能在安全架构中的定位
反对无监管的自主执行这一观点,并非反对在安全领域应用人工智能或自动化。人工智能在适当的层面上能发挥最大价值:分析、优先级排序、协调支持以及决策赋能。
CISA 的指导文件一再强调,可视性缺口是关键基础设施组织在管理分布式资产时面临的核心挑战。人工智能直接解决了这一问题:汇总事件数据、关联不同部署环境中的信号、标记配置漂移,并筛选出优先级较高的发现结果供人工审查。虽然最终决策仍由分析师作出,但人工智能能帮助他们更快地做出决策,并提供更优质的信息。
在基于风险排序的漏洞和补丁管理方面,这一方法的优势最为显著。通过根据可利用性、资产关键性和暴露程度快速对数百个漏洞进行排序,安全团队便能获得一份按优先级排序的清单,从而在维护窗口期内采取行动,而非面对一堆需要自行筛选的原始数据。
同样的原理也适用于配置异常:AI 会扫描数百个终端设备;由人工决定需要回滚哪些更改以及何时回滚。
对于安全平台中的任何人工智能功能而言,真正有意义的问题不是“它能否自主行动?”,而是“它能否提高安全团队的工作效率?”
这些是不同的设计理念,在受监管的环境中,这种区别至关重要。
“人工控制的安全管理”在实践中是怎样的
由人工主导的安全管理并不意味着效率低下,而是指结构化的安全管理:人工智能挖掘信息,自动化加速工作流程,而人类则负责决策。每一项操作都会以可追溯的身份信息为依据进行记录。
实际操作中:一个集中式仪表盘会汇总所有已连接部署中的安全事件、端点补丁合规性、配置健康状况以及异常检测结果。管理员会审查按风险等级排序的检测结果,评估运维背景(包括目标站点当前是否处于维护窗口期,或者针对特定硬件的配置变更是否已通过验证),并通过经过深思熟虑的授权步骤启动相应操作。
对于管理分布式环境的组织而言,这需要一个能够通过单一界面覆盖所有部署的平台,包括无法采用云端管理的物理隔离和离线环境。该平台提供了管理员所需的数据,使其能够自信地采取行动。
OPSWAT 是如何OPSWAT 这一问题的
My Central Management是OPSWAT 专为该运营模式打造的集中式安全管理系統。它通过一个可在云端、本地及物理隔离环境中通用的统一界面,为安全团队提供对补丁状态、配置合规性及终端健康状况的全面可视化监控。
安全管理员会审查检测结果、配置部署策略,并根据维护时段安排启动更新。该平台甚至支持针对物理隔离环境的离线补丁更新。每项操作均由管理员发起,这不仅能生成 NERC CIP、IEC 62443 和 NIST SP 800-82 所要求的授权记录,还能最大限度地降低管理平面遭入侵时的影响。
EPAM 如何为全球员工保障了 70,000 台设备的安全
EPAM Systems(一家全球性的数字平台工程和软件开发服务提供商,在30个国家拥有约40,000名员工)面临着日益增大的压力,需要在不影响工作效率的前提下,保障这支以BYOD(自带设备)为主的分布式员工队伍的安全。通过采用My Central Management MetaDefender 该公司对全球员工、客户和承包商使用的70,000多台设备实现了可视化管理与合规控制。
该平台使EPAM的安全团队能够验证设备合规性、检测未经授权的应用程序、识别未修补的漏洞并执行访问策略,且全程不会影响用户的工作效率。EPAM还集成了MetaDefender 用于扫描上传至其中央存储的文件,在高峰期每天处理超过5000万个文件。安全团队能够全面掌握情况,每一项决策都由他们自主决定。点击此处阅读完整案例。
常见问题
自主人工智能是否适用于关键基础设施的安全运营?
但如果系统在未经人工授权的情况下,自行执行会影响生产的变更,情况就不同了。在关键基础设施领域——包括电网、制造业、国防和金融系统——若在错误的时间执行安全操作,或对错误的系统执行安全操作,可能会影响物理流程、引发违规行为,或为安全事件的发生创造条件。
在分析、优先级排序、协调和报告等环节,人工智能是合适且有价值的:对风险进行排序、呈现发现结果、标记异常情况。授权决策应仍由人工操作员作出。
在运营技术(OT)环境中,自主安全决策存在哪些风险?
分为三类:运维类、合规类和对抗类。从运维角度来看,任何在维护窗口之外执行或未经硬件特定验证的自主操作,都可能影响生产流程,而不仅仅是服务器。
从合规性的角度来看,NERC CIP、IEC 62443 和 NIST SP 800-82 均强调对安全变更进行有据可查的授权、测试、验证和问责。只有当自主工作流能够保留清晰的授权记录时,才能满足这些要求。
当遭到入侵的自主平台在操作员介入之前,就在互联的部署环境中执行更改时,就会出现对抗性风险。
关键基础设施组织应如何在安全运营中应用人工智能?
在不会引入执行风险的情况下,将人工智能应用于能够创造价值的领域:按风险等级排序的漏洞分级处理、配置漂移检测、异常关联分析,以及按优先级排序的发现结果供人工审查。
应避免使用那些将人工智能的分析价值与不受约束的执行权限混为一谈的平台。需评估该平台是否能生成贵方合规框架所要求的授权记录。如果答案是“由系统决定”,那么在受监管的关键基础设施环境中,这并不构成充分的授权记录。
掌握主动权,同时不放弃控制权
在关键基础设施安全领域,速度固然重要,但真正重要的是采取经授权行动的平均时间,而非未经核查的自动化行动的平均时间。
一个能够接收按风险等级排序且结合具体情境的检测结果,并能在规定的维护窗口期内授权采取应对措施的安全团队,才算运作有效。而将这一决策权委托给无法判断维护窗口是否开放、或生产线上是否处于生产周期中的系统的团队,则是在承担不必要的风险。

My OPSWAT Central Management 通过单一界面,提供集中式监控、端点补丁管理、配置合规性及系统健康状况可视化功能,该Central Management 可跨云端、本地及物理隔离环境运行,且所有可能影响生产环境的操作均需经人工授权,并以可追溯的身份进行日志记录。
OPSWAT 为关键基础设施OPSWAT 基于人工智能的网络安全解决方案。My OPSWAT Central Management 提供这一功能的地方,同时符合受监管行业所需的人工监督要求。
