监控指标项
id
k
kind_
index_name
desc
level
thres
thresrange
uni
un
统一数据平台监控与运维系统用户手册
南大通用数据技术股份有限公司
- 185 -
i
n
d
name
_id
hold
t
1
u
s
可用
类
host_avail
ability
服务器是否可
用,不可用时
报警
1
unava
ilabl
e
available/un
available
--
2
u
s
可用
类
agent_avai
lability
监控平台
agent 是否可
用,不可用时
报警
1
unava
ilabl
e
available/un
available
--
3
g
s
操作
系统
类
cpu_avg_lo
ad_1m
cpu 最后1 分
钟进程的平均
个数,超过阈
值时报警
3
10
>=1
个
4
g
s
操作
系统
类
cpu_avg_lo
ad_5m
cpu 最后5 分
钟进程的平均
个数,超过阈
值时报警
3
10
>=1
个
5
g
s
操作
系统
类
cpu_avg_lo
ad_15m
cpu 最后15 分
钟进程的平均
个数,超过阈
值时报警
3
10
>=1
个
6
g
s
操作
系统
类
cpu_user
cpu 处于用户
模式的时间百
分比,超过阈
值时报警
3
80
1-100
%
7
g
s
操作
系统
类
cpu_system
cpu 处于系统
模式的时间百
分比,超过阈
值时报警
3
80
1-100
%
8
g
s
操作
系统
类
cpu_idle
cpu 处于空闲
模式的时间百
分比,超过阈
值时报警
3
80
1-100
%
9
g
s
操作
系统
类
cpu_usage
cpu 使用率,
超过阈值时报
警
3
80
1-100
%
统一数据平台监控与运维系统用户手册
- 186 -
南大通用数据技术股份有限公司
10
g
s
操作
系统
类
memory_use
d
内存使用大
小,超过阈值
时报警
3
80
>=1
G
G
11
g
s
操作
系统
类
memory_swa
p_free
内存交换空间
空闲大小,低
于阈值时报警
3
10
>=1
G
G
12
g
s
操作
系统
类
memory_usa
ge
内存使用率,
超过阈值时报
警
3
80
>=1
%
%
13
g
s
操作
系统
类
disk_free
磁盘空间空闲
大小,低于阈
值时报警
3
100
>=1
G
G
14
g
s
操作
系统
类
disk_rops
磁盘每秒中读
操作数,超过
阈值时报警
3
1200
>=1
次
/s
ti
/s
15
g
s
操作
系统
类
disk_wops
磁盘每秒钟写
操作数,超过
阈值时报警
3
1200
>=1
次
/s
ti
/s
16
g
s
操作
系统
类
disk_rmb
磁盘每秒钟读
取字节数,超
过阈值时报警
3
1000
>=1
M
M
17
g
s
操作
系统
类
disk_wmb
磁盘每秒钟写
入字节数,超
过阈值时报警
3
1000
>=1
M
M
18
g
s
操作
系统
类
disk_usage
磁盘使用率,
超过阈值时报
警
3
80
1-100
%
%
19
g
s
操作
系统
类
net_receiv
e_bytes
网络接收字节
数,超过阈值
时报警
3
81920
0
>=1
B
B
20
g
s
操作
系统
类
net_receiv
e_packets
网络接收包
数,超过阈值
时报警
3
10000
>=1
包
pa
e
21
g
s
操作
系统
类
net_transm
it_bytes
网络发送字节
数,超过阈值
时报警
3
81920
0
>=1
B
B
22
g
操作
net_transm
网络发送包
3
10000
>=1
包
pa
统一数据平台监控与运维系统用户手册
南大通用数据技术股份有限公司
- 187 -
s
系统
类
it_packets
数,超过阈值
时报警
23
g
p
进程
状态
类
gclusterd_
state
gcluster 进
程是否开启,
关闭时报警
2
CLOSE
OPEN/CLOSE
--
24
g
p
进程
状态
类
gbased_sta
te
gnode 进程是
否开启,关闭
时报警
2
CLOSE
OPEN/CLOSE
--
25
g
p
进程
状态
类
syncserver
_state
同步进程是否
开启,关闭时
报警
2
CLOSE
OPEN/CLOSE
--
26
g
p
进程
状态
类
gcware_sta
te
加载进程是否
开启,关闭时
报警
2
CLOSE
OPEN/CLOSE
--
27
g
p
进程
状态
类
gclusterd_
memory_use
d
gcluster 进
程使用内存大
小,超过阈值
时报警
3
65535
>=1
M
28
g
p
进程
状态
类
gbased_mem
ory_used
gnode 进程使
用内存大小,
超过阈值时报
警
3
65535
>=1
M
29
g
p
进程
状态
类
syncserver
_memory_us
ed
同步进程使用
内存大小,超
过阈值时报警
3
65535
>=1
M
30
g
p
进程
状态
类
gcware_mem
ory_used
加载进程使用
内存大小,超
过阈值时报警
3
65535
>=1
M
31
g
c
集群
状态
类
gcluster_d
ata_state
gcluster 数
据状态,不等
于阈值时报警
3
0
>=0
--
32
g
c
集群
状态
类
gnode_data
_state
gnode 数据状
态,不等于阈
值时报警
3
0
>=0
--
33
d
b
数据
库状
态类
tablespace
_used_size
表空间占用磁
盘空间,超过
阈值时报警
4
1024
>=1
G
统一数据平台监控与运维系统用户手册
- 188 -
南大通用数据技术股份有限公司
34
d
b
数据
库状
态类
database_u
sed_size
数据库占用磁
盘空间,超过
阈值时报警
4
1024
>=1
G
G
35
e
x
e
c
s
q
l
执行
状态
类
sql_execut
e_time
SQL 执行超时
时间,执行超
过阈值时报警
(当前值为条
数)
4
600
>=1
分
钟
mi
36
g
c
执行
状态
类
session_nu
m
服务器会话
数,超过阈值
时报警
4
300
>=1
个
a
37
g
s
操作
系统
类
disk_used
磁盘已使用空
间大小,超过
阈值时报警
3
2048
>=1
G
G
38
g
s
操作
系统
类
disk_io_pe
r
磁盘IO 使用
率
4
80
1-100
%
pe
nt
39
g
s
操作
系统
类
system_dis
k_usage
系统盘使用
率,超过阈值
报警
3
80
1-100
%
%
40
g
s
操作
系统
类
data_disk_
usage
数据盘使用
率,超过阈值
报警
3
80
1-100
%
%
41
g
s
操作
系统
类
data_disk_
used
数据盘已使用
大小
--
--
--
G
G
42
g
s
操作
系统
类
data_disk_
free
数据盘剩余大
小
--
--
--
G
G