一断网,你们第一反应是什么?

很多人的反应是:

  • “是不是网线坏了?”
  • “是不是运营商炸了?”
  • “是不是服务器崩了?”

但在真实工作中,网络工程师第一件事不是猜,而是按步骤查

打开网易新闻 查看精彩图片

网络工程师排错,有一个非常重要的原则:

先查最基础、最容易出问题、成本最低的地方

也可以总结成一句口诀:

先物理,后逻辑;先本地,后远端;先下层,后上层
第一步:先看物理层

无论多高级的网络工程师,断网第一眼一定看物理层

具体会查什么?

  • 网线插没插好
  • 网口指示灯亮不亮
  • 交换机、路由器有没有断电
  • 光猫、ONU 是否在线

原因很简单:

物理问题最多、也最容易解决

而且现实中,

80% 的“重大网络故障”,最后发现都是低级问题

第二步:看本机网络状态

确认物理没问题后,工程师会立刻看本机

  • 有没有拿到 IP 地址
  • IP 是不是 169.254.x.x
  • 网关、DNS 在不在

如果连 IP 都没有:

问题大概率在 DHCP 或接入层。

这一层还没通,根本不用急着查服务器

第三步:ping,从近到远

接下来就是大家熟悉的 ping,但注意顺序。

工程师一般会这样 ping:

1️⃣ ping 本机 IP

2️⃣ ping 默认网关

3️⃣ ping 内网其他设备

4️⃣ ping 外网 IP(如 8.8.8.8)

5️⃣ ping 域名

打开网易新闻 查看精彩图片

每一步,其实都在定位“断在哪一段”。

这一步的核心目的只有一个:

判断网络断在“哪一层、哪一跳”。

第四步:查 DNS

如果发现:

  • ping IP 没问题
  • 但 ping 域名不通 / 网页打不开

工程师会立刻怀疑 DNS

会查:

  • DNS 地址对不对
  • DNS 服务器能不能访问
  • 是否被篡改或劫持

“能 ping IP,不能上网,先想 DNS。”

第五步:查设备和链路状态

如果问题不是在终端,就开始查网络设备

  • 接口是否 up/down
  • 链路是否切换到了备链路
  • 端口有没有被 shutdown
  • 是否有异常流量或广播风暴

这一步通常在:

上完成。

第六步:再看服务器和应用

注意顺序:这是后面的步骤,不是第一步。

如果:

  • 网络层正常
  • 传输层正常

但服务还是用不了,才会查:

  • Web 服务是否启动
  • 端口是否监听
  • 应用是否崩溃

很多新手一断网就说“服务器挂了”,

在工程师眼里,这是典型的“跳步骤”。

断网时,网络工程师不是靠经验“拍脑袋”,而是靠分层、分段、由简到繁的排错流程。

打开网易新闻 查看精彩图片

真正厉害的工程师,不是知道得多,而是排错顺序不乱。

1️⃣ 电和线 →

2️⃣ IP 和配置 →

3️⃣ ping 路径 →

4️⃣ DNS →

5️⃣ 网络设备 →

6️⃣ 服务器 / 应用

一步没通,不跳下一步。