监控指标项 id k kind_ index_name desc level thres thresrange uni un
统一数据平台监控与运维系统用户手册 南大通用数据技术股份有限公司 - 185 - i n d name _id hold t 1 u s 可用 类 host_avail ability 服务器是否可 用,不可用时 报警 1 unava ilabl e available/un available -- 2 u s 可用 类 agent_avai lability 监控平台 agent 是否可 用,不可用时 报警 1 unava ilabl e available/un available -- 3 g s 操作 系统 类 cpu_avg_lo ad_1m cpu 最后1 分 钟进程的平均 个数,超过阈 值时报警 3 10 >=1 个 4 g s 操作 系统 类 cpu_avg_lo ad_5m cpu 最后5 分 钟进程的平均 个数,超过阈 值时报警 3 10 >=1 个 5 g s 操作 系统 类 cpu_avg_lo ad_15m cpu 最后15 分 钟进程的平均 个数,超过阈 值时报警 3 10 >=1 个 6 g s 操作 系统 类 cpu_user cpu 处于用户 模式的时间百 分比,超过阈 值时报警 3 80 1-100 % 7 g s 操作 系统 类 cpu_system cpu 处于系统 模式的时间百 分比,超过阈 值时报警 3 80 1-100 % 8 g s 操作 系统 类 cpu_idle cpu 处于空闲 模式的时间百 分比,超过阈 值时报警 3 80 1-100 % 9 g s 操作 系统 类 cpu_usage cpu 使用率, 超过阈值时报 警 3 80 1-100 %
统一数据平台监控与运维系统用户手册 - 186 - 南大通用数据技术股份有限公司 10 g s 操作 系统 类 memory_use d 内存使用大 小,超过阈值 时报警 3 80 >=1 G G 11 g s 操作 系统 类 memory_swa p_free 内存交换空间 空闲大小,低 于阈值时报警 3 10 >=1 G G 12 g s 操作 系统 类 memory_usa ge 内存使用率, 超过阈值时报 警 3 80 >=1 % % 13 g s 操作 系统 类 disk_free 磁盘空间空闲 大小,低于阈 值时报警 3 100 >=1 G G 14 g s 操作 系统 类 disk_rops 磁盘每秒中读 操作数,超过 阈值时报警 3 1200 >=1 次 /s ti /s 15 g s 操作 系统 类 disk_wops 磁盘每秒钟写 操作数,超过 阈值时报警 3 1200 >=1 次 /s ti /s 16 g s 操作 系统 类 disk_rmb 磁盘每秒钟读 取字节数,超 过阈值时报警 3 1000 >=1 M M 17 g s 操作 系统 类 disk_wmb 磁盘每秒钟写 入字节数,超 过阈值时报警 3 1000 >=1 M M 18 g s 操作 系统 类 disk_usage 磁盘使用率, 超过阈值时报 警 3 80 1-100 % % 19 g s 操作 系统 类 net_receiv e_bytes 网络接收字节 数,超过阈值 时报警 3 81920 0 >=1 B B 20 g s 操作 系统 类 net_receiv e_packets 网络接收包 数,超过阈值 时报警 3 10000 >=1 包 pa e 21 g s 操作 系统 类 net_transm it_bytes 网络发送字节 数,超过阈值 时报警 3 81920 0 >=1 B B 22 g 操作 net_transm 网络发送包 3 10000 >=1 包 pa
统一数据平台监控与运维系统用户手册 南大通用数据技术股份有限公司 - 187 - s 系统 类 it_packets 数,超过阈值 时报警 23 g p 进程 状态 类 gclusterd_ state gcluster 进 程是否开启, 关闭时报警 2 CLOSE OPEN/CLOSE -- 24 g p 进程 状态 类 gbased_sta te gnode 进程是 否开启,关闭 时报警 2 CLOSE OPEN/CLOSE -- 25 g p 进程 状态 类 syncserver _state 同步进程是否 开启,关闭时 报警 2 CLOSE OPEN/CLOSE -- 26 g p 进程 状态 类 gcware_sta te 加载进程是否 开启,关闭时 报警 2 CLOSE OPEN/CLOSE -- 27 g p 进程 状态 类 gclusterd_ memory_use d gcluster 进 程使用内存大 小,超过阈值 时报警 3 65535 >=1 M 28 g p 进程 状态 类 gbased_mem ory_used gnode 进程使 用内存大小, 超过阈值时报 警 3 65535 >=1 M 29 g p 进程 状态 类 syncserver _memory_us ed 同步进程使用 内存大小,超 过阈值时报警 3 65535 >=1 M 30 g p 进程 状态 类 gcware_mem ory_used 加载进程使用 内存大小,超 过阈值时报警 3 65535 >=1 M 31 g c 集群 状态 类 gcluster_d ata_state gcluster 数 据状态,不等 于阈值时报警 3 0 >=0 -- 32 g c 集群 状态 类 gnode_data _state gnode 数据状 态,不等于阈 值时报警 3 0 >=0 -- 33 d b 数据 库状 态类 tablespace _used_size 表空间占用磁 盘空间,超过 阈值时报警 4 1024 >=1 G
统一数据平台监控与运维系统用户手册 - 188 - 南大通用数据技术股份有限公司 34 d b 数据 库状 态类 database_u sed_size 数据库占用磁 盘空间,超过 阈值时报警 4 1024 >=1 G G 35 e x e c s q l 执行 状态 类 sql_execut e_time SQL 执行超时 时间,执行超 过阈值时报警 (当前值为条 数) 4 600 >=1 分 钟 mi 36 g c 执行 状态 类 session_nu m 服务器会话 数,超过阈值 时报警 4 300 >=1 个 a 37 g s 操作 系统 类 disk_used 磁盘已使用空 间大小,超过 阈值时报警 3 2048 >=1 G G 38 g s 操作 系统 类 disk_io_pe r 磁盘IO 使用 率 4 80 1-100 % pe nt 39 g s 操作 系统 类 system_dis k_usage 系统盘使用 率,超过阈值 报警 3 80 1-100 % % 40 g s 操作 系统 类 data_disk_ usage 数据盘使用 率,超过阈值 报警 3 80 1-100 % % 41 g s 操作 系统 类 data_disk_ used 数据盘已使用 大小 -- -- -- G G 42 g s 操作 系统 类 data_disk_ free 数据盘剩余大 小 -- -- -- G G