2000server如何设置负载均衡-CSDN社区

Davelu 2003-09-17

打赏
举报

Internet的快速增长使多媒体网络服务器，特别是Web服务器，面对的访问者数量快速增加，网络服务器需要具备提供大量并发访问服务的能力。例如Yahoo每天会收到数百万次的访问请求，因此对提供大负载Web服务的服务器来讲，CPU、I/O处理能力很快会成为瓶颈。

　　简单的提高硬件性能并不能真正解决这个问题，因为单台服务器的性能总是有限的，一般来讲，一台PC服务器所能提供的并发访问处理能力大约为1000个，更为高档的专用服务器能够支持3000-5000个并发访问，这样的能力还是无法满足负载较大的网站的要求。尤其是网络请求具有突发性，当某些重大事件发生时，网络访问就会急剧上升，从而造成网络瓶颈，例如在网上发布的克林顿弹劾书就是很明显的例子。必须采用多台服务器提供网络服务，并将网络请求分配给这些服务器分担，才能提供处理大量并发服务的能力。

　　当使用多台服务器来分担负载的时候，最简单的办法是将不同的服务器用在不同的方面。按提供的内容进行分割时，可以将一台服务器用提供新闻页面，而另一台用提供游戏页面；或者可以按服务器的功能进行分割，将一台服务器用提供静态页面访问，而另一些用提供CGI等需要大量消耗资源的动态页面访问。然而由网络访问的突发性，使得很难确定那些页面造成的负载太大，如果将服务的页面分割的过细就会造成很大浪费。事实上造成负载过大的页面常常是在变化中的，如果要经常按照负载变化来调整页面所在的服务器，那势必对管理和维护造成极大的问题。因此这种分割方法只能是大方向的调整，对大负载的网站，根本的解决办法还需要应用负载均衡技术。

　　负载均衡的思路下多台服务器为对称方式，每台服务器都具备等价的地位，都可以单独对外提供服务而无须其它服务器的辅助。然通过某种负载分担技术，将外部发送来的请求均匀分配到对称结构中的某一台服务器上，而接收到请求的服务器都独立响应客户机的请求。由建立内容完全一致的Web服务器并不复杂，可以使用服务器同步更新或者共享存储空间等方法来完成，因此负载均衡技术就成为建立一个高负载Web站点的关键性技术。
　　1、基特定服务器软件的负载均衡

　　很多网络协议都支持“复位向”功能，例如在HTTP协议中支持Location指令，接收到这个指令的浏览器将自动复位向到Location指明的另一个URL上。由发送Location指令比起执行服务请求，对Web服务器的负载要小的多，因此可以根据这个功能来设计一种负载均衡的服务器。任何时候Web服务器认为自己负载较大的时候，它就不再直接发送回浏览器请求的网页，而是送回一个Locaction指令，让浏览器去服务器集群中的其它服务器上获得所需要的网页。

　　在这种方式下，服务器本身必须支持这种功能，然而具体实现起来却有很多困难，例如一台服务器如何能保证它复位向过的服务器是比较空闲的，并且不会再次发送Location指令？Location指令和浏览器都没有这方面的支持能力，这样很容易在浏览器上形成一种死循环。因此这种方式实际应用当中并不多见，使用这种方式实现的服务器集群软件也较少。有些特定情况下可以使用CGI（包括使用FastCGI或mod_perl扩展来改善性能）来仿真这种方式去分担负载，而Web服务器仍然保持简洁、高效的特性，此时避免Location循环的任务将由用户的CGI程序来承担。

　　2、基DNS的负载均衡

　　由基服务器软件的负载均衡需要改动软件，因此常常是得不偿失，负载均衡最好是在服务器软件之外来完成，这样才能利用现有服务器软件的种种优势。最早的负载均衡技术是通过DNS服务中的随机名字解析来实现的，在DNS服务器中，可以为多个不同的地址配置同一个名字，而最终查询这个名字的客户机将在解析这个名字时得到其中的一个地址。因此，对同一个名字，不同的客户机会得到不同的地址，他们也就访问不同地址上的Web服务器，从而达到负载均衡的目的。

　　例如如果希望使用三个Web服务器来响应对www.exampleorg.org.cn的HTTP请求，就可以设置该域的DNS服务器中关该域的数据包括有与下面例子类似的结果：

　　www1 IN A 192.168.1.1
　　www2 IN A 192.168.1.2
　　www3 IN A 192.168.1.3
　　www IN CNAME www1
　　www IN CNAME www2
　　www IN CNAME www3
　　此外部的客户机就可能随机的得到对应www的不同地址，那随的HTTP请求也就发送给不同地址了。

　　DNS负载均衡的优点是简单、易行，并且服务器可以位互联网的任意位置上，当前使用在包括Yahoo在内的Web站点上。然而它也存在不少缺点，一个缺点是为了保证DNS数据及时更新，一般都要将DNS的刷新时间设置的较小，但太小就会造成太大的额外网络流量，并且更改了DNS数据之也不能立即生效；第二点是DNS负载均衡无法得知服务器之间的差异，它不能做到为性能较好的服务器多分配请求，也不能了解到服务器的当前状态，甚至会出现客户请求集中在某一台服务器上的偶然情况。

　　3、反向代理负载均衡

　　使用代理服务器可以将请求转发给内部的Web服务器，使用这种加速模式显然可以提升静态网页的访问速度。因此也可以考虑使用这种技术，让代理服务器将请求均匀转发给多台内部Web服务器之一上，从而达到负载均衡的目的。这种代理方式与普通的代理方式有所不同，标准代理方式是客户使用代理访问多个外部Web服务器，而这种代理方式是多个客户使用它访问内部Web服务器，因此也被称为反向代理模式。

　　实现这个反向代理能力并不能算是一个特别复杂的任务，但是在负载均衡中要求特别高的效率，这样实现起来就不是十分简单的了。每针对一次代理，代理服务器就必须打开两个连接，一个为对外的连接，一个为对内的连接，因此对连接请求数量非常大的时候，代理服务器的负载也就非常之大了，在最反向代理服务器会成为服务的瓶颈。例如，使用Apache的mod_rproxy模块来实现负载均衡功能时，提供的并发连接数量受Apache本身的并发连接数量的限制。一般来讲，可以使用它来对连接数量不是特别大，但每次连接都需要消耗大量处理资源的站点进行负载均衡，例如搜寻。

　　使用反向代理的好处是，可以将负载均衡和代理服务器的高速缓存技术结合在一起，提供有益的性能，具备额外的安全性，外部客户不能直接访问真实的服务器。并且实现起来可以实现较好的负载均衡策略，将负载可以非常均衡的分给内部服务器，不会出现负载集中到某个服务器的偶然现象。

　　4、基NAT的负载均衡技术

　　网络地址转换为在内部地址和外部地址之间进行转换，以便具备内部地址的计算器能访问外部网络，而当外部网络中的计算器访问地址转换网关拥有的某一外部地址时，地址转换网关能将其转发到一个映像的内部地址上。因此如果地址转换网关能将每个连接均匀转换为不同的内部服务器地址，此外部网络中的计算器就各自与自己转换得到的地址上服务器进行通信，从而达到负载分担的目的。

　　地址转换可以通过软件方式来实现，也可以通过硬件方式来实现。使用硬件方式进行操作一般称为交换，而当交换必须保存TCP连接信息的时候，这种针对OSI网络层的操作就被称为第四层交换。支持负载均衡的网络地址转换为第四层交换机的一种重要功能，由它基定制的硬件芯片，因此其性能非常优秀，很多交换机声称具备400MB-800MB的第四层交换能力，然而也有一些资料表明，在如此快的速度下，大部分交换机就不再具备第四层交换能力了，而仅仅支持第三层甚至第二层交换。
　　然而对大部分站点来讲，当前负载均衡主要是解决Web服务器处理能力瓶颈的，而非网络传输能力，很多站点的互联网连接带宽总共也不过10MB，只有极少的站点能够拥有较高速的网络连接，因此一般没有必要使用这些负载均衡器这样的昂贵设备。
使用软件方式来实现基网络地址转换的负载均衡则要实际的多，除了一些厂商提供的解决方法之外，更有效的方法是使用免费的自由软件来完成这项任务。其中包括Linux Virtual Server Project中的NAT实现方式，或者本文作者在FreeBSD下对natd的修订版本。一般来讲，使用这种软件方式来实现地址转换，中心负载均衡器存在带宽限制，在100MB的快速以太网条件下，能得到最快达80MB的带宽，然而在实际应用中，可能只有40MB-60MB的可用带宽。

　　5、扩展的负载均衡技术

　　上面使用网络地址转换来实现负载分担，毫无疑问所有的网络连接都必须通过中心负载均衡器，那如果负载特别大，以至台的服务器数量不再在是几台、十几台，而是上百台甚至更多，即便是使用性能优秀的硬件交换机也回遇到瓶颈。此时问题将转变为，如何将那多台服务器分布到各个互联网的多个位置，分散网络负担。当然这可以通过综合使用DNS和NAT两种方法来实现，然而更好的方式是使用一种半中心的负载均衡方式。

　　在这种半中心的负载均衡方式下，即当客户请求发送给负载均衡器的时候，中心负载均衡器将请求打包并发送给某个服务器，而服务器的响应请求不再返回给中心负载均衡器，而是直接返回给客户，因此中心负载均衡器只负责接受并转发请求，其网络负担就较小了。

　　同样，这种方式的硬件实现方式也非常昂贵，但是会根据厂商的不同，具备不同的特殊功能，例如对SSL的支持等。

　　由这种方式比较复杂，因此实现起来比较困难，它的起点也很高，当前情况下网站并不需要这大的处理能力。

　　比较上面的负载均衡方式，DNS最容易，也最常用，能够满足一般的需求。但如果需要进一步的管理和控制，可以选用反向代理方式或NAT方式，这两种之间进行选择主要依赖缓冲是不是很重要，最大的并发访问数量是多少等条件。而如果网站上对负载影响很厉害的CGI程序是由网站自己开发的，也可以考虑在程序中自己使用Locaction来支持负载均衡。半中心化的负载分担方式至少在国内当前的情况下还不需要。

Davelu 2003-09-17

打赏
举报

集群的概念容易和一些概念(SMP 、NUMA、MPP、分布处理)相混淆，其主要区别在资源被共享和复制的级别不同。它们是按SMP、NUMA、MPP、集群、分布处理从最紧密到最松散的排列。

　　SMP(多处理系统)：这种系统是在一台计算机里有多个CPU,CPU之间的地位是平等的，它们共享内存空间和I/O设备。其工作方法是由操作系统负责将任务分解成多个并发进程，然后让其在不同的CPU上运行。

　　NUMA(非统一内存存取)：这种系统可以让多处理计算机的CPU比SMP更高效地共享本地内存，CPU可以更快速地存取单一的内存区域，不过如需要也可以用间接方式存取其他区域的内存，这种方法是让某些CPU在给定范围的物理内存中有更大的优先使用权。

　　MPP(巨型并行处理)：这种系统的节点都有自己的CPU，并有自己的专有资源。此种结构相对独立，但各个节点一般没有完全存取I/O的能力。

　　集群：集群系统是由独立的计算机组成，但有控制管理工具统一管理。

　　分布处理：它是比我们要构筑的集群系统更松散的连接，一般是任务在不同的地方完成，没有可以作为整体管理的单一实体。

　　以上的聚合方式有紧有疏，它们都有自己的适用范围，这里就不多说了，有兴趣可自己找些资料看，这里只是想让大家了解它所处的位置。

　　1、实现负载均衡的方法

　　集群的目的是共享和高效地利用资源，提供大型运算，提供负载均衡分配请求压力以及出现故障时能够进行切换实现高可用性。

　　限于篇幅，本文只对负载均衡的实现做些介绍(针对TurboLinux Cluster Server)。通过对相关软件的分析，实现集群负载的功能是通过流量管理实现的，具体有这样几种实现方法：直接路由(Direct forwarding)、网络地址转换(NAT)、隧道技术(Tunneling)。
　　1.1 直接路由(Direct forwarding)

　　当参与集群的计算机和作为控制管理的计算机在同一个网段时可以用此法，控制管理的计算机接收到请求包时直接送到参与集群的节点。优点是返回给客户的流量不经过控制主机，速度快开销少。

　　1.2 网络地址转换(NAT)

　　这种方法可能大家较熟悉，地址转换器有能被外界访问到的合法IP地址，它修改来自专有网络的流出包的地址，外界看起来包是来自地址转换器本身，当外界包送到转换器时，它能判断出应该将包送到内部网的哪个节点。优点是节省IP地址，能对内部进行伪装；缺点是效率低，因为返回给请求方的流量经过转换器。

　　1.3 隧道技术(Tunneling)

　　这种方式是在集群的节点不在同一个网段时可用的转发机制，是将IP包封装在其他网络流量中的方法，为了安全的考虑，应该使用隧道技术中的VPN,也可使用租用专线。

　　集群所能提供的服务是基于TCP/IP的Web服务、Mail服务、News服务、DNS服务、Proxy服务器等等，下面我们将就具体的产品TurboLinux Cluster Server 来实现一个进行负载均衡集群系统，用于提供Web和FTP的服务。

　　2、四台服务器的负载均衡实例

　　所提供的服务：Web、FTP。

　　系统的实现目的：做一个较完善负载均衡的系统，以便能用到其中的较多的功能。

　　采用设备状况：使用四台服务器，其中3台装TurboLinux Cluster Server,1台安装Windows 2000 Sever。
　　2.1 系统安装

　　1.在两台服务器上安装TurboLinux， apache和wu-ftpd也要安装，因为集群要提供这种服务,安装完后重启，挂接光驱在目录/mnt/cdrom下，执行./TLCS-install,然后按提示完全安装。

　　2.在一台服务器上安装Windows 2000 Server，要安装Internet Information Server 5.0。

　　2.2 系统配置

　　1.设置各台服务器的IP地址、子网掩码、路由等，调通网络，将一台TurboLinux服务器设置成DNS服务器,使其能够正向解析和反向解析。服务器名此例为 pc1,域为test.com。

　　2.配置Cluster Server。执行Turbolinux clusteradmin,设置情况如下(注：箭头连接的是选单选项，箭头所指为下级选单，最后冒号后为设置情况)。

--------------------------------------------------------------------------------

ClusterServer Configuration→Cluster Services→Application Stability Agents:
　　(1)http为默认的服务，不用设置
　　(2)ftp----/usr/lib/ftpAgent
ClusterServer Configuration→Cluster Services→Service Settings:
　　(1)http,80:TCP,sticky
　　(2)ftp,21:TCP,ftp
ClusterServer Configuration→Servers Configuration：
　　(1) pc1 (pc1.test.com),direct,ping
　　(2) pc2 (pc2.test.com),direct,ping
　　(3) pc3 (pc3.test.com),direct,ping
　　(4) pc4 (pc4.test.com),direct,ping
ClusterServer Configuration→Advance Traffic Managers：
　　(1)Advance Traffic Manager System: pc1.test.com
　　(2)Advance Traffic Manager Setting: 默认值
ClusterServer Configuration→Virtual Severs:
　　(1)主机为：pc1.test.com
　　(2)sendmail:master@pc1.test.com
　　(3)Server pool name: ServerGroup1
ClusterServer Configuration→Globle Settings:

--------------------------------------------------------------------------------

　　网络设置：netmask 255.255.255.0

　　2.3 配置集群各接点

　　因为TurboLinux Cluster Server 本身能被工具自动同步，所以只需配置Windows 2000 Server：
开始→设置→控制面板→添加新硬件→下一步→添加/排除设备故障→添加新设备→否，我想从列表选择硬件→其他设备→Microsoft:Microsoft Loopback Adapter→完成。

　　桌面上右键单击"网上邻居"→属性→TCP/IP→设置IP地址、缺省网关，子网掩码(注：先设成：255.255.255.0)。

　　开始→运行→regedit→找到注册表中跟Microsoft Loopback Adapter相关的项，将子网掩码改成：255.255.255.255。

　　配置系统以便运行合适的服务、并配置适合控制管理器管理的配置，以便可在控制管理器中使用。

　　2.4 在管理选单中执行内容同步

　　选tlcs_content_sync，输入密码，将复制控制管理计算机中的服务内容。

　　在管理选单中执行设置同步

　　选tlcs_config_sync，输入密码，将复制控制管理计算机中的设置。

　　现在已经可以进入运行状态，可将客户端连接在服务器的交换机上，客户端可以请求Web和FTP服务，需要查看运行情况可以用控制台从https://pc1.test.com:910管理。

　　在计算机技术中集群负载平衡是自成体系的，目前它是一个热门技术也是一个高端应用，Internet/Intranet中使用集群负载平衡方案的地方十分广泛，尤其是大中型网站都难脱离这种技术，直接路由(Direct forwarding)、网络地址转换(NAT)、隧道技术(Tunneling)都会因需要而被采用。

Davelu 2003-09-17

打赏
举报

集群的概念容易和一些概念(SMP 、NUMA、MPP、分布处理)相混淆，其主要区别在资源被共享和复制的级别不同。它们是按SMP、NUMA、MPP、集群、分布处理从最紧密到最松散的排列。

　　SMP(多处理系统)：这种系统是在一台计算机里有多个CPU,CPU之间的地位是平等的，它们共享内存空间和I/O设备。其工作方法是由操作系统负责将任务分解成多个并发进程，然后让其在不同的CPU上运行。

　　NUMA(非统一内存存取)：这种系统可以让多处理计算机的CPU比SMP更高效地共享本地内存，CPU可以更快速地存取单一的内存区域，不过如需要也可以用间接方式存取其他区域的内存，这种方法是让某些CPU在给定范围的物理内存中有更大的优先使用权。

　　MPP(巨型并行处理)：这种系统的节点都有自己的CPU，并有自己的专有资源。此种结构相对独立，但各个节点一般没有完全存取I/O的能力。

　　集群：集群系统是由独立的计算机组成，但有控制管理工具统一管理。

　　分布处理：它是比我们要构筑的集群系统更松散的连接，一般是任务在不同的地方完成，没有可以作为整体管理的单一实体。

　　以上的聚合方式有紧有疏，它们都有自己的适用范围，这里就不多说了，有兴趣可自己找些资料看，这里只是想让大家了解它所处的位置。

　　1、实现负载均衡的方法

　　集群的目的是共享和高效地利用资源，提供大型运算，提供负载均衡分配请求压力以及出现故障时能够进行切换实现高可用性。

　　限于篇幅，本文只对负载均衡的实现做些介绍(针对TurboLinux Cluster Server)。通过对相关软件的分析，实现集群负载的功能是通过流量管理实现的，具体有这样几种实现方法：直接路由(Direct forwarding)、网络地址转换(NAT)、隧道技术(Tunneling)。
　　1.1 直接路由(Direct forwarding)

　　当参与集群的计算机和作为控制管理的计算机在同一个网段时可以用此法，控制管理的计算机接收到请求包时直接送到参与集群的节点。优点是返回给客户的流量不经过控制主机，速度快开销少。

　　1.2 网络地址转换(NAT)

　　这种方法可能大家较熟悉，地址转换器有能被外界访问到的合法IP地址，它修改来自专有网络的流出包的地址，外界看起来包是来自地址转换器本身，当外界包送到转换器时，它能判断出应该将包送到内部网的哪个节点。优点是节省IP地址，能对内部进行伪装；缺点是效率低，因为返回给请求方的流量经过转换器。

　　1.3 隧道技术(Tunneling)

　　这种方式是在集群的节点不在同一个网段时可用的转发机制，是将IP包封装在其他网络流量中的方法，为了安全的考虑，应该使用隧道技术中的VPN,也可使用租用专线。

　　集群所能提供的服务是基于TCP/IP的Web服务、Mail服务、News服务、DNS服务、Proxy服务器等等，下面我们将就具体的产品TurboLinux Cluster Server 来实现一个进行负载均衡集群系统，用于提供Web和FTP的服务。

　　2、四台服务器的负载均衡实例

　　所提供的服务：Web、FTP。

　　系统的实现目的：做一个较完善负载均衡的系统，以便能用到其中的较多的功能。

　　采用设备状况：使用四台服务器，其中3台装TurboLinux Cluster Server,1台安装Windows 2000 Sever。
　　2.1 系统安装

　　1.在两台服务器上安装TurboLinux， apache和wu-ftpd也要安装，因为集群要提供这种服务,安装完后重启，挂接光驱在目录/mnt/cdrom下，执行./TLCS-install,然后按提示完全安装。

　　2.在一台服务器上安装Windows 2000 Server，要安装Internet Information Server 5.0。

　　2.2 系统配置

　　1.设置各台服务器的IP地址、子网掩码、路由等，调通网络，将一台TurboLinux服务器设置成DNS服务器,使其能够正向解析和反向解析。服务器名此例为 pc1,域为test.com。

　　2.配置Cluster Server。执行Turbolinux clusteradmin,设置情况如下(注：箭头连接的是选单选项，箭头所指为下级选单，最后冒号后为设置情况)。

--------------------------------------------------------------------------------

ClusterServer Configuration→Cluster Services→Application Stability Agents:
　　(1)http为默认的服务，不用设置
　　(2)ftp----/usr/lib/ftpAgent
ClusterServer Configuration→Cluster Services→Service Settings:
　　(1)http,80:TCP,sticky
　　(2)ftp,21:TCP,ftp
ClusterServer Configuration→Servers Configuration：
　　(1) pc1 (pc1.test.com),direct,ping
　　(2) pc2 (pc2.test.com),direct,ping
　　(3) pc3 (pc3.test.com),direct,ping
　　(4) pc4 (pc4.test.com),direct,ping
ClusterServer Configuration→Advance Traffic Managers：
　　(1)Advance Traffic Manager System: pc1.test.com
　　(2)Advance Traffic Manager Setting: 默认值
ClusterServer Configuration→Virtual Severs:
　　(1)主机为：pc1.test.com
　　(2)sendmail:master@pc1.test.com
　　(3)Server pool name: ServerGroup1
ClusterServer Configuration→Globle Settings:

--------------------------------------------------------------------------------

　　网络设置：netmask 255.255.255.0

　　2.3 配置集群各接点

　　因为TurboLinux Cluster Server 本身能被工具自动同步，所以只需配置Windows 2000 Server：
开始→设置→控制面板→添加新硬件→下一步→添加/排除设备故障→添加新设备→否，我想从列表选择硬件→其他设备→Microsoft:Microsoft Loopback Adapter→完成。

　　桌面上右键单击"网上邻居"→属性→TCP/IP→设置IP地址、缺省网关，子网掩码(注：先设成：255.255.255.0)。

　　开始→运行→regedit→找到注册表中跟Microsoft Loopback Adapter相关的项，将子网掩码改成：255.255.255.255。

　　配置系统以便运行合适的服务、并配置适合控制管理器管理的配置，以便可在控制管理器中使用。

　　2.4 在管理选单中执行内容同步

　　选tlcs_content_sync，输入密码，将复制控制管理计算机中的服务内容。

　　在管理选单中执行设置同步

　　选tlcs_config_sync，输入密码，将复制控制管理计算机中的设置。

　　现在已经可以进入运行状态，可将客户端连接在服务器的交换机上，客户端可以请求Web和FTP服务，需要查看运行情况可以用控制台从https://pc1.test.com:910管理。

　　在计算机技术中集群负载平衡是自成体系的，目前它是一个热门技术也是一个高端应用，Internet/Intranet中使用集群负载平衡方案的地方十分广泛，尤其是大中型网站都难脱离这种技术，直接路由(Direct forwarding)、网络地址转换(NAT)、隧道技术(Tunneling)都会因需要而被采用。