公司刚做完网络升级,最怕的就是服务断了没人知道。特别是半夜切完流量,第二天一早用户投诉打爆电话,这种事不少见。其实只要花几分钟做个连通性测试,就能避免大部分问题。
先从最基础的ping开始
别看ping简单,它能告诉你服务器到底通不通。比如你升级了核心交换机,可以立刻在办公网里找个终端ping一下关键业务服务器:
ping 192.168.10.50
如果连续几条都超时,那说明路由或防火墙策略可能没配对,得赶紧查。偶尔丢一两个包也不用太紧张,可能是设备正在收敛。
telnet测端口更实用
光通还不行,还得确认服务起来了。比如财务系统用的是8080端口,不能只靠网页打开慢不慢来判断。直接用telnet测端口更快:
telnet 192.168.10.50 8080
连上了就是白屏也别慌,说明TCP三次握手成功了,服务是活着的。如果提示“无法连接”或者“连接超时”,那就要去服务器上查服务状态和防火墙规则。
批量检测用脚本省事
要是你管着十几台服务器,一个个ping太费劲。写个简单的shell脚本跑一遍就行:
#!/bin/bash
for ip in 192.168.10.{1..20}
do
ping -c 2 $ip > /dev/null
if [ $? -eq 0 ]; then
echo "$ip 可达"
else
echo "$ip 不可达"
fi
done
这个脚本能快速扫出哪些IP段在升级后失联,特别适合割接后第一时间排查。
别忘了DNS和网关
有时候服务器本身没问题,但客户端解析不了域名。网络升级常涉及DNS变更,建议在本地执行nslookup验证:
nslookup api.company.com
看看返回的IP是不是最新的。另外,默认网关有没有配错也很关键,尤其是跨VLAN通信恢复后,很多问题其实是网关指向不对导致的。
实际案例:上周一家客户做完光纤改造,内部系统打不开。现场同事一顿查交换机配置,折腾两小时。后来我让他们直接ping数据库服务器,发现根本不在一个子网里——原来是DHCP分配了旧的网段。改完地址立马恢复正常。
网络升级后的连通性测试不用多复杂,关键是快、准、全。动手之前列好要测的IP和端口,按顺序过一遍,比事后救火强得多。