设置监控告警
Redis Standalone 监控告警是通过云监控告警服务为集群服务器的资源和服务提供监控管理。当集群监控项超过阈值时触发告警,并通过短信、邮件等形式发送告警通知。
-
支持设置统一通知策略。
-
支持绑定指标告警策略,自定义告警规则和监控项,及时监控 Redis Standalone 各项指标状态。
-
可自定义监控项:
CPU利用率
、内存使用率
、磁盘使用量
、节点服务状态
、被拒绝的 Key 个数
、Keyspace 未命中数
、Client 连接数最大值
、内存使用率最大值
、命中率最大值
、节点角色
-
可自定义监控周期:
1分钟
、5分钟
-
前提条件
- 已获取管理控制台登录账号和密码,且已获取集群操作权限。
- 已创建 Redis Standalone 集群,且集群状态为活跃。
绑定指标告警策略
Redis Standalone 支持对每个缓存节点配置指标告警策略。当业务发生异常时,会触发用户设定的告警阈值,并发送短信或邮件通知用户。
-
在集群管理页面,点击集群 ID,进入集群详情页面。
-
在告警页签,选择节点,并点击列表上方绑定指标告警策略。
-
在弹出的指标告警策略配置窗口,选择指标告警策略,并点击提交。
说明
若无可选指标告警策略,请参考创建指标告警策略。
-
返回告警页签,选中已绑定指标告警策略节点,可查看配置的指标和告警历史。
创建指标告警策略
-
在指标告警策略配置窗口,点击创建指标告警策略,弹出创建告警策略窗口。
-
配置告警基本参数。
名称 :输入告警策略名称。
对象范围 :默认为平台监控
。
告警类型 :默认为指标告警
,即对集群指标进行监控告警。
资源类型 :默认为集群节点
。 监控周期 :可选择1分钟
和5分钟
。默认为5分钟
,免费使用。 -
点击下一步,配置告警规则。
点击添加规则,并可配置指标规则阈值和告警级别,一个策略可添加多条指标规则。告警规则配置取值说明,请参见告警规则。说明
有多条指标规则时,任何一条规则满足条件都会触发告警。
-
点击下一步,配置告警行为。
发送通知 :选择是否发送告警通知,默认为是
。
触发条件 :选择告警触发条件,可选择资源变为告警时
或资源恢复正常时
。
告警次数 :当资源持续处于告警状态时,连续发送通知的次数。最多为100次。
通知列表 :选择告警通知列表。 -
确认配置无误后,点击提交,返回指标告警策略配置窗口,即可选择新创建的告警策略。
说明
更多告警策略管理说明,请参见云监控 CloudSat 告警服务。
告警规则
告警 | 推荐值 | 描述 | |
---|---|---|---|
CPU利用率 | 90% | 检测 CPU 使用率。若 CPU 过高会导致性能下降、崩溃等。 | |
内存使用率 | 90% | 检测内存使用率。若持续增高会导致 Redis 不可用。 | |
磁盘使用量 | 90% | 检测硬盘使用率。若磁盘满会导致 Redis 数据无法落盘。 | |
节点服务状态 | 异常 | 检测服务是否可用。 告警提示异常时,可能该节点 Redis 已崩溃。 |
|
被拒绝的 Key 个数 | 1 | 检测由 maxmemory 限制而导致被驱逐的 Key 的数量。被拒绝的 Key 个数过多,可能会影响访问速度。 | |
Keyspace 未命中数 | Keyspace 命中数 的 10% | 检测缓存中没有数据,需要去数据库加载,可能导致性能下降。 | |
Client 连接数最大值 | maxclients 参数的 80% | 检测最大连接数。建议配置为 maxclients 参数的 80%,或根据业务情况调整。 | |
内存使用率最大值 | 90% | 检测允许 Redis 使用内存的使用率。内存使用率过高,可能会导致 Redis 降速,不可用。 | |
命中率最大值 | - | 检查在 main dictionary 字典中成功查到的 Key 个数。 | |
节点角色 | 主节点、从节点 | 检测节点角色。可检测主从节点是否进行了故障转移。如果故障转移了,可能影响服务。 |
设置统一通知策略
节点绑定指标告警策略后,通过设置统一通知策略,可将告警通知统一发送至一个通知列表。
注意
设置统一通知策略后,节点绑定的指标告警策略所关联的通知列表,将无法收到告警通知,请注意运维业务分配情况。
-
在集群管理页面,点击集群 ID,进入集群详情页面。
-
在告警页签,点击通知策略模块下设置。
-
在弹出的通知策略配置窗口,选择通知策略,并点击提交。
-
返回告警页签,查看配置的统一通知策略。