解决一个IP路由选择问题
大学时曾旁听过计算机专业的专业课-"计算机网络"(我非科班出身,只能偷偷旁听),现在还能清晰地记得当初他们使用的教材是高教社影印版的《计算机网络——自顶向下方法与Internet特色》。不过记忆中课程的内容却渐渐模糊了。有些当时并没有深刻地理解的概念,现在依旧没理解,因为平时少有涉及。
上周在搭建CI环境时遇到了两个服务器(均安装的是RHEL 5.5 OS)之间网络不通的问题。这两个服务器分处于两个不同的局域网网段:服务器A IP为10.10.12.xxx,服务器B的IP为10.10.13.yyy,从A到B无法Ping通,但B到A是没有问题的。这时恰巧一位系统工程师同事到开发大厅办事,我就顺便请他帮忙解决这个问题。
不知道是因为有急事呢,还是我没有说清楚问题所在,他在A主机上先是删除了若干路由,然后又在/etc/rc.local中添加了一条路由:"route add -net 10.10.0.0 gw 10.10.12.1 netmask 255.255.0.0",生效后,A主机居然可以Ping通主机B了,问题解决了,他也就匆忙离开了。
我也本以为这样就可以了,但不久我就发现A主机无法连上DNS Server了,要知道在路由表被修改之前是可以的。无奈之下,我只能自己尝试去搞定了。首先先注释掉rc.local中的那条新增静态路由,然后reboot系统,让系统恢复到之前的路由表配置(通过route命令增删的路由都是临时路由)。
接下来,就是查找各种资料,重新认知一下IP路由选择的原理。经典的《TCP/IP协议-卷1》一直躺在家中的书柜里,手头上只有《Linux系统管理技术手册(Linux Administration Handbook)》这本书。不过还好,这本书也足够经典,里面对TCP/IP网络的讲解更实际,也更具可操作性。
说到路由,我们不得不回顾一下IP地址。IP地址不是孤立的,或者说一个孤立的IP地址是信息不完整的。我们无法通过一个孤立的IP地址来确定下什么。我们需要将它与子网掩码结合一起来使用。掩码就是用来指示IP地址中网络地址部分和主机地址之间的边界的。举例来说:如果一台主机配置的IP地址为10.10.12.105,子网掩码为255.255.255.0,那么这台主机所在的物理网络的地址就是(10.10.12.105 & 255.255.255.0) = 10.10.12.0,而最后那个字节用于主机地址分配,主机编号可以从1到254(0是网络地址,255是该网络的广播地址)。这台主机与网内的其他主机可以直接通信,无需经由任何中间设备的转发,它网内的兄弟主机编号可以是104,106…等等。
好了,我们有了网络地址的概念了,一切就会变得好办多了。接下来我们看一下A主机当前路由表(通过route或netstat -rn命令),看看它为何无法连到主机B。
-bash-3.2$ route
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
10.10.12.0 * 255.255.252.0 U 0 0 0 eth0
169.254.0.0 * 255.255.0.0 U 0 0 0 eth0
default 10.10.12.1 0.0.0.0 UG 0 0 0 eth0
这里有三条路由,与问题相关的是第一条和第三条。而169.254.0.0是zeroconf产生的IP地址,称为Link Local Addresses,Mac OS X, Windows和比较新的Linux都支持这类地址。其作用是无需配置即可联网,比DHCP还简单,不需要服务器,只要把电脑设备间用网线连接在一起即可。这条路由与本文无关,故这里一笔带过。
关于route命令结果中各个列的含义这里就不细说了。我们来看一下当尝试从A主机向B主机发送数据包时会发生什么呢?我们假设B主机的IP地址为10.10.13.222。当A主机构造好IP包后,会到路由表中查询路由。简单地说就是逐条路由匹配,直到匹配成功后,将IP包发往对应路由记录的Destinaion网络中去。如果没有匹配的路由,则将该包发往默认(default)路由对应的gateway设备。
在这个例子中,我们会用10.10.13.222与各条路由记录匹配。如果10.10.13.222 & Genmask == Destination,我们就说匹配成功。显然通过计算,10.10.13.222和第一条路由记录就匹配成功了:10.10.13.222 & 255.255.252.0 = 10.10.12.1,那目的IP地址为10.10.13.222的IP包就会被发往网内。但是IP层的下面的链路层和物理层会发现10.10.13.222根本不属于本网络,发送失败。这就是为何从A主机无法ping通B主机的原因。再细致看看,原来是第一条路由的Genmask配置错了,本来应该配置为255.255.255.0,但是却配置成了255.255.252.0,这无意中为该物理网络做了"扩容"。修正后的路由表如下:
-bash-3.2$ route
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
10.10.12.0 * 255.255.255.0 U 0 0 0 eth0
169.254.0.0 * 255.255.0.0 U 0 0 0 eth0
default 10.10.12.1 0.0.0.0 UG 0 0 0 eth0
修正后,我们再来走一遍上述的流程。为到10.10.13.222的IP包匹配路由,经计算发现无可成功匹配的记录,则该IP包采用默认路由,也就是第三条路由,通过eth0网口转到10.10.12.1这个gateway设备上了。后者会将该IP包转发到10.10.13.0这个网络中去,这就实现了位于两个不同网络中的两台主机A与B之间的互联互通了。
另外要说的是上面这些路由数据是从哪里来的呢?在Redhat Linux中,这些数据是在网卡初始化时由系统读取网卡配置文件而得来的。在Redhat中,网卡配置文件位于:/etc/systconfig/network-scripts下,文件名是ifcfg-eth0,…。
评论