一断网,你们第一反应是什么?
很多人的反应是:
- “是不是网线坏了?”
- “是不是运营商炸了?”
- “是不是服务器崩了?”
但在真实工作中,网络工程师第一件事不是猜,而是按步骤查。
网络工程师排错,有一个非常重要的原则:
先查最基础、最容易出问题、成本最低的地方
也可以总结成一句口诀:
先物理,后逻辑;先本地,后远端;先下层,后上层第一步:先看物理层
无论多高级的网络工程师,断网时第一眼一定看物理层。
具体会查什么?
- 网线插没插好
- 网口指示灯亮不亮
- 交换机、路由器有没有断电
- 光猫、ONU 是否在线
原因很简单:
物理问题最多、也最容易解决
而且现实中,
80% 的“重大网络故障”,最后发现都是低级问题。
第二步:看本机网络状态
确认物理没问题后,工程师会立刻看本机:
- 有没有拿到 IP 地址
- IP 是不是 169.254.x.x
- 网关、DNS 在不在
如果连 IP 都没有:
问题大概率在 DHCP 或接入层。
这一层还没通,根本不用急着查服务器。
第三步:ping,从近到远
接下来就是大家熟悉的 ping,但注意顺序。
工程师一般会这样 ping:
1️⃣ ping 本机 IP
2️⃣ ping 默认网关
3️⃣ ping 内网其他设备
4️⃣ ping 外网 IP(如 8.8.8.8)
5️⃣ ping 域名
每一步,其实都在定位“断在哪一段”。
这一步的核心目的只有一个:
判断网络断在“哪一层、哪一跳”。
第四步:查 DNS
如果发现:
- ping IP 没问题
- 但 ping 域名不通 / 网页打不开
工程师会立刻怀疑 DNS。
会查:
- DNS 地址对不对
- DNS 服务器能不能访问
- 是否被篡改或劫持
“能 ping IP,不能上网,先想 DNS。”
第五步:查设备和链路状态
如果问题不是在终端,就开始查网络设备:
- 接口是否 up/down
- 链路是否切换到了备链路
- 端口有没有被 shutdown
- 是否有异常流量或广播风暴
这一步通常在:
上完成。
第六步:再看服务器和应用
注意顺序:这是后面的步骤,不是第一步。
如果:
- 网络层正常
- 传输层正常
但服务还是用不了,才会查:
- Web 服务是否启动
- 端口是否监听
- 应用是否崩溃
很多新手一断网就说“服务器挂了”,
在工程师眼里,这是典型的“跳步骤”。
断网时,网络工程师不是靠经验“拍脑袋”,而是靠分层、分段、由简到繁的排错流程。
真正厉害的工程师,不是知道得多,而是排错顺序不乱。
1️⃣ 电和线 →
2️⃣ IP 和配置 →
3️⃣ ping 路径 →
4️⃣ DNS →
5️⃣ 网络设备 →
6️⃣ 服务器 / 应用
一步没通,不跳下一步。
热门跟贴