服务器监控服务器监控(包括性能指标与包括性能指标与web应用程序应用程序)
服务器监控
在搭建服务器时,除了部署webapp之外,还需要服务的异常信息与服务器性能指标进行监控,一旦有异常则通知管理员。
服务器使用Linux+Nginx-1.9.15+Tomcat7+Java搭建的。
编写脚本检测错误日志和服务器性能指标,一旦新生错误日志或者性能降低到设定的阈值时,则使用云监控将报警上传到云账
号。
服务运行监控
错误日志包含以下三个方面:
nginx 错误信息监控(nginx.conf配置)
${NGINX_HOME}/logs/error.log
tomcat 错误信息监控(server.xml配置)
${TOMCAT_HOME}/logs/catalina.out
webapp错误信息监控(log4j)
${WEBAPP_HOME}/log/error
机器性能指标
一般都会使用linux系统的机器作为服务器,那么当在上面搭建服务时,需要对一些常用的性能指标进行监控,那么一般包含
哪些指标呢?下面对其进行一些总结,欢迎补充…
指标
1.CPU(Load) CPU使用率/负载
2.Memory 内存
3.Disk 磁盘空间
4.Disk I/O 磁盘I/O
5.Network I/O 网络I/O
6.Connect Num 连接数
7.File Handle Num 文件句柄数
…
CPU
1.说明
机器的CPU占有率越高,说明机器处理越忙,运算型任务越多。一个任务可能不仅会有运算部分,还会有I/O(磁盘I/O与网络
I/O)部分,当在处理I/O时,时间片未完其CPU也会释放,因此某个时间点的CPU占有率没有太大的意义,因此需要计算一段
时间内的平均值,那么平均负载(Load Average)这个指标便能很好得对其进行表征。平均负载:它是根据一段时间内占有CPU
的进程数目和等待CPU的进程数目计算出来的,其中等待CPU的进程不包括处于wait状态的进程,比如在等待I/O的进程,即
指那些就绪状态的进程,运行只缺CPU这个资源。具体如何计算可以参见Linux内核代码,计算出一个数之后,然后除以CPU
核数,结果:
<=3 则系统性能较好。
<=4 则系统性能可以,可以接收。
>5 则系统性能负载过重,可能会发生严重的问题,那么就需要扩容了,要么增加核,要么分布式集群。
2.查看命令
vmstat
vmstat n m