当KunLun的PFAE技术检测到某个内存板发生了轻微异常,并且有演变为严重故障的趋势时,KunLun的管理页面上会出现预告警提示,这时用户只需在管理界面上找到预告警中标记的具有潜在故障的内存板对应的图标,点击图标上的热插拔按钮触发内存热移除命令,便可自动完成接下来的操作:
1. 系统固件会通知操作系统迁移潜在故障内存上的数据;2. 操作系统完成内存数据迁移后删除对应的资源管理信息;3. 系统固件删除潜在故障内存板对应的系统地址编码信息,并控制硬件系统给内存板断电。

用户此时只需打开机柜抽出故障内存板,更换故障内存条,然后,将内存板插回到机柜中,再次点击热插拔按钮触发内存热添加命令,便可自动完成包括内存的加电、电气特性配置、系统地址分配和创建管理信息等操作。整个热移除和热添加的过程中,用户的业务都不会出现中断。
KunLun开放架构小型机不仅支持内存在线热替换,也可支持CPU的在线热替换。视频中记录了在华为实验室中进行的CPU和内存的在线热替换操作演示。
暂时禁止评论













闽公网安备 35020302000061号