CPU / 内存使用率:识别是否存在资源瓶颈。
并发任务数:监控当前正在执行的备份/恢复/同步任务数量。
网络吞吐量:关注数据传输速度,评估是否存在网络拥塞。
任务成功率:备份或恢复任务失败率超过阈值时需及时告警。
快照数量与大小:监控快照占用的存储空间,避免存储耗尽。
资源占用:包含云主机、云存储等资源占用情况。
告警等级分布:统计当前告警的等级(信息、警告、严重),优先处理高等级告警。
事件趋势:观察一定周期内(如 7 天、30 天)告警数量变化,及时发现潜在问题。