巡检服务器有哪些指标,网络设备巡检

文章 3年前 (2021) admin
0
巡检服务器有哪些指标,网络设备巡检

Q1:服务器巡检

内容来自用户:yyzxwxy
服务器周巡检报告(一)服务器硬件检查检查项|检查操作|参考标准|巡检情况|机柜防尘网|观察机柜及服务器的防尘网上的灰尘|是否有灰尘堵塞导致气流不畅1|系统风扇运转检查|感觉进风和出风是否正常|主机和磁盘柜的所有风扇运转正常2|系统运装噪音检查|服务器运转声音|噪音是否过大,有无异常声音|系统电源指示灯检查|观察液晶面板、电源指示灯、硬盘报警灯等显示|指示灯显示情况正常|服务器硬盘工作状态|硬盘指示灯指示是否正常|绿色闪烁|检查网线是否连接正常|检查网线与交换机之间的连线是否正常,以及双机心跳网线连接是否正常|交换机连接主机的所有端口指示灯为长亮|服务器网卡工作状态|服务器插上网线后,若有数据传输,则网卡指示灯呈现规律性闪烁;若闪烁不正常或指示灯指示颜色不正常,则说明系统数据传输将不正常|网卡指示灯正常闪烁|服务器电源连接检查|电源连接线是否有松动、接触不良等情况|服务器外壳整体检查|服务器整体是否有移动或损害痕迹|服务器机房温度|机房的温度是否异常变动,温度数值多少|参考值温度:20℃-26℃|服务器机房湿度|机房的湿度是否异常变动,湿度计数值多少|参考值温度:45%-60%|服务器机房静电防护|防静电地板是否损坏,防静电设备是否正常|服务器标签检查|标签是否松动、脱落,字体是否模糊不清|

Q2:PC服务器要怎么巡检及建档?

这个简单啊,如果是机房的话,应该有一本机房巡检记录本,按照时间和巡检人员还有巡检内容进行认真、正式、完整地登记,而且还要建立一个服务器故障登记表、按照服务器品牌和型号、序列号、所在机柜的位置、网路接口、硬件配置等等经行登记并入配置库中,如发生更改和故障要及时登记,日常巡检吗,也就看服务器的故障指示灯什么的,比方说IBM 的一般如果有故障都有黄灯报警的,正常是蓝灯,可以根据故障灯和故障代码进行简单的故障解决,比方CPU,MEM,LOG,BRD等等报警灯,可以判断是那些故障,故障对应其他指示灯你可以在IBM 官方网站搜索http://redoufu.com/。

Q3:Windows服务器巡检报告

内容来自用户:彡彡九图文
Windows服务器巡检报告篇一:pc服务器巡检报告服务器巡检报告(每周)客户签字:工程师签字:第一联-公司?第二联-用户篇二:服务器巡检报告中原区xxx局Ibmx3650服务器巡检报告巡检时间:20XX/8/19服务器是系统重要的业务运行平台,对服务器进行巡检能够及时发现服务器的隐患,以便于改善和优化服务器的性能;观察服务器的运行状况,及时对设备进行调整,保证服务器24小时不间断的工作;帮助客户采集服务器日志信息,及时记录服务器日志信息4本次巡检主要包含以下几个方面:1、2、3、4、服务器物理硬件巡检机房环境巡检服务器系统日志分析检查硬件运行声音是否异常一、服务器硬件情况Ibmx3650服务器是20XX年底Ibm推出的一款服务器,本单位用的服务器是20XX年9月20号出厂的,已过质保期(原厂三年质保)5下面是在Ibm官网上查询到的信息:cpu:Inter至强e5335(2.0ghz),属于Inter公司20XX年的产品,在服务器上已经淘汰使用,性能不及现在市面上普通电脑上使用的I5处理器6内存:本单位使用的服务器还是早期的2g内存,现在的服务器上标配都是8g及以上内存,2g内存根本无法满足现在的业务处理能力7RAID:本单位机器只有一块硬盘,没有做任务RAID阵列,无法保护数据的安全,即使有异地硬盘备份,也不可能达到数据实时存储8三、服务器系统日志分析

Q4:AIX小型机服务器巡检操作

1、机器型号# uname -uMIBM,7029-6E3 IBM,01100550A2、检查系统硬件设备故障灯是否有亮3、系统错误报告# errpt -d H -T PERM //硬件的错误报告IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTIONBFE4C025 0530085308 P H sysplanar0 UNDETERMINED ERRORBFE4C025 0529091308 P H sysplanar0 UNDETERMINED ERROR# errpt -d S -T PERM //软件的错误报告# errpt -aj *******|more //具体的错误信息# errpt -d H -T PERM>/tmp/hwerror.log //可以把错误的报告存成一个文件4、有否给 root 用户的错误报告# mailMail [5.2 UCB] [AIX 5.X] Type ? for help."/var/spool/mail/root": 5 messages 3 new 5 unread U 1 root Thu May 15 09:53 24/884 "diagela message from p615" U 2 root Fri May 16 04:07 24/884 "diagela message from p615">N 3 root Sat May 24 13:08 23/874 "diagela message from p615"5、检查 hacmp.out, smit.log, bootlog 等# lssrc -g cluster/#>lssrc -g clusterSubsystem Group PID Status clstrmgrES cluster 16334 active一般上 hacmp.out 的位置: /usr/sbin/cluster/ 或者 /tmp/然后找到最近的 hacmp.out 文件,察看有没有错误信息6、文件系统检查# df -kFilesystem 1024-blocks Free %Used Iused %Iused Mounted on/dev/hd4 131072 101568 23% 2268 4% //dev/hd2 1441792 31256 98% 36056 11% /usr/dev/hd9var 131072 117048 11% 418 2% /var看看有没有超过 90% 使用率的,建议用户改善7、逻辑卷有否 "stale" 的状态# lsvg -l rootvgLV NAME TYPE LPs PPs PVs LV STATE MOUNT POINThd5 boot 1 1 1 closed/syncd N/Ahd6 paging 4 4 1 open/syncd N/Ahd8 jfslog 1 1 1 open/syncd N/Ahd4 jfs 1 1 1 open/syncd /hd2 jfs 11 11 1 open/syncd /usrhd9var jfs 1 1 1 open/syncd /var如果系统还有其他卷组,也需要察看8、内存交换区的使用率是否超过 70%# lsps -aPage Space Physical Volume Volume Group Size %Used Active Auto Typehd6 hdisk0 rootvg 512MB 1 yes yes lv 9、系统性能是否有瓶颈# topas# vmstat 1 10kthr memory page faults cpu----- ----------- ------------------------ ------------ ----------- r b avm fre re pi po fr sr cy in sy cs us sy id wa 0 0 110029 408618 0 0 0 0 0 0 4 602 75 0 1 99 0 0 0 110031 408616 0 0 0 0 0 0 1 562 54 1 0 99 0 0 0 110031 408616 0 0 0 0 0 0 3 628 84 0 0 99 0# iostat 1 10tty: tin tout avg-cpu: % user % sys % idle % iowait 0.0 394.0 0.0 0.0 100.0 0.0Disks: % tm_act Kbps tps Kb_read Kb_wrtnhdisk0 0.0 0.0 0.0 0 0hdisk1 0.0 0.0 0.0 0 0cd0 0.0 0.0 0.0 0 010、网络与通讯检查# ifconfig -a # netstat -inName Mtu Network Address Ipkts Ierrs Opkts Oerrs Collen0 1500 link#2 0.9.6b.3e.6.ac 1964 0 534 0 0en0 1500 192.168.0 192.168.0.11 1964 0 534 0 0lo0 16896 link#1 267 0 413 0 0lo0 16896 127 127.0.0.1 267 0 413 0 0# netstat -rn //察看路由情况Routing tablesDestination Gateway Flags Refs Use If Exp GroupsRoute Tree for Protocol Family 2 (Internet):127/8 127.0.0.1 U 7 142 lo0 - -192.168.0.0 192.168.0.11 UHSb 0 0 en0 - - =># vi /etc/hosts //察看 hosts 文件有否特殊的定义# ping ****#lsattr -El inet0 //路由的检测authm 65536 Authentication Methods True hostname h24 Host Name True gateway Gateway True route net,,0,172.16.23.81 Route True bootup_option no Serial Optical Network Interface True rout6 FDDI Network Interface True 11、有否符合要求的系统备份第一次去可以先询问客户关于备份的策略# ls -l /image.data //看看系统有没有备份的 image 文件,记录最后备份日期-rw-r--r-- 1 root system 9600 May 19 17:31 /image.data # lsvg -l rootvg //察看有否符合要求的数据备份和保护LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINThd4 jfs 1 1 1 open/syncd /hd2 jfs 11 11 1 open/syncd /usrhd10opt jfs 1 1 1 open/syncd /optoraclelv jfs2 80 160 1 open/syncd /oracleloglv00 jfs2log 1 1 1 open/syncd N/Atestlv jfs 10 20 1 closed/syncd /tmp/test如何察看数据保护方式 RAID10/RAID5,RAID 的Hotspare 属性是否打开 #smitty ssaraid? Change/Show Attributes of an SSA RAID Array 检查Enable Use of Hot Spares属性是否为YES 12、系统 Dump 设置是否正确# sysmpdev -lprimary /dev/hd6 secondary /dev/sysmpnull directory /var/adm/ras forced flag TRUE always allow mp FALSE mp compression OFF# sysmpdev P p /dev/hd6 s /dev/sysmpnull# sysmpdev -P -c13、HACMP 测试# /usr/sbin/cluster/diag/clconfig -v '-tr' // Cluster Verification 输出结果无Fail# /lssrc -g cluster14、maxpout, minpout 系统参数如果系统中运行了HACMPsmitty chgsysy,将High/Low water mark从0/0修改为33/24# lsattr -El sys0|grep maxpout //maxpout 用途: 对文件指定未决 I/O 的最大数目值: 缺省值:0(不检查);范围:0 到 n(n 应该是 4 的倍数加 1)# lsattr -El sys0|grep minpout//指定一个基点,在该基点处,已达到 maxpout 的程序可以继续写入文件值: 缺省值:0(不检查);范围:0 到 n(n 应该是 4 的倍数,且大于或等于 4 小于 maxpout)15、syncd 参数# grep syncd /sbin/rc.boot //sync() 被 syncd 调用的间隔时间nohup /usr/sbin/syncd 10 > /dev/null 2>&1 &值: 缺省值:60;范围:1 到任何正整数 显示: grep syncd /sbin/rc.boot 或 vi /sbin/rc.boot 更改: 更改在下次引导后有效,而且是永久有效9备用方法是使用命令 kill 来终止守护程序 syncd 并用命令 /usr/sbin/syncd interval 从命令行重新启动它10 诊断: 当 syncd 正在运行时,文件的 I/O 被阻塞了11 调整: 在缺省级别上,这个参数几乎不影响性能12不推荐对这个参数进行更改13为了保持数据完整性对于 HACMP而使 syncd interval 明显缩小,会导致性能下降14更改命令为: #vi /sbin/rc.boot 16、aio 参数 //异步 I/O 可调参数# lsdev -C|grep aio察看状态是否是 available # lsattr -El aio0minservers 1 MINIMUM number of servers True maxservers 10 MAXIMUM number of servers True maxreqs 4096 Maximum number of REQUESTS True kprocprio 39 Server PRIORITY True autoconfig available STATE to be configured at system restart True fastpath enable State of fast path True# smit aio //可以更改参数17、检查 errdaemon, srcmstr 是否正常运行# ps -ef|grep err# ps -ef|grep src18、 系统硬件诊断# diag -> Diagnostic Routines -> System Verification -> All Resources -> F7 或者 Esc+719、补丁程序 PTF 是否满足要求,当前系统补丁版本#oslevel -r5300-04#instfix -i|grep All filesets for 5.3.0.0_AIX_ML were found. All filesets for 5300-01_AIX_ML were found. All filesets for 5300-02_AIX_ML were found. All filesets for 5300-03_AIX_ML were found. All filesets for 5300-04_AIX_ML were found. All filesets for 5300-05_AIX_ML were found.# lscfg -vp //检查所有设备的微码20、收集系统信息放到/tmp/ibmsupt# snap -ac //运行#snap -ac,生成文件snap+s/n.pax.Z

Q5:如何巡检mysql数据库服务器

可以通过监控show slave status\G命令输出的Seconds_Behind_Master参数的值来判断,是否有发生主从延时15  其值有这么几种:  NULL - 表示io_thread或是sql_thread有任何一个发生故障,也就是该线程的Running状态是No,而非Yes.  0 - 该值为零,是我们极为渴望看到的情况,表示主从复制良好,可以认为lag不存在16  正值 - 表示主从已经出现延时,数字越大表示从库落后主库越多17  负值 - 几乎很少见,只是听一些资深的DBA说见过,其实,这是一个BUG值,该参数是不支持负值的,也就是不应该出现18

Q6:有没有PC服务器Windows操作系统巡检脚本

服务器系统和一般电脑系统的区别:1、性能的稳定性,服务器版本的要比普通版本要高得多;2、在文件管理或网络应用上,服务器版本能更好的发挥功效;3、在图形及娱乐上来说,普通的系统要比服务器有着更好的功效;4、服务器版本的安全性及可协调性要比普通版本高;5、服务器在用户管理及多用户管理,以及权限等等方面有着很大的优势 服务器硬件和操作系统上安装的应用软件通常是Internet/Intranet服务器端应用、企业或商业关键应用等19而台式机通常针对个人应用、图形应用20两者的定位是完全不一样的21服务器系统主要有Windows Server、Unix或者Linux22

版权声明:admin 发表于 2021年11月24日 上午8:18。
转载请注明:巡检服务器有哪些指标,网络设备巡检 | 热豆腐网址之家

相关文章