一个比较棘手的问题是关于负载均衡的

把调用的接口部署在了两台服务器上，但是服务器又没有配置nginx来做负载均衡，也不好再加，希望能用程序来实现，请问一下这具体应该怎么实现，拜托望大家帮忙想想办法

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

7条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
余_x 2016-06-23 11:11
关注
前几天看到一篇关于负载均衡的文章，希望对楼主有所帮助
一、什么是负载均衡
假设我有两个模块（或者两个系统）：module-A和module-B，A依赖B提供服务。当用户请求过来的时候，A就会去请求B，让B根据请求进行某些处理（比如：根据单词id查对应的单词），完成后把结果返回给A，A再对这个结果进行处理。然而，为了保证服务稳定，有可能B服务有很多台机器，A遇到这个时候就犯难了：我该去找B的哪台机器取数据呢？

最常见的一个case就是nginx：比如我们的web逻辑服务器是jetty或者tomcat，一般会有多台，nginx就需要配置这多台机器：
upstream simplemain.com {
server 192.168.1.100:8080;
server 192.168.1.101:8080;
}

那这些机器是怎么样选择的呢？实际就是负载均衡算法。

包含两个层面：
1、负载：就是后端系统的承载能力。比如同等条件下，一个1核cpu-1G内存的机器的承载能力一般会比8核cpu-8G内存的机器要差；相同配置下，一个cpu利用率为80%的机器比30%的承载能力一般要差等等。
2、均衡：保证后端请求的平衡。比如：在同等情况下，分配到多台机器的请求要相当；有些情况下，同一用户尽可能分配到同一台机器等等。

所以，负载均衡的算法实际上就是解决跨系统调用的时候，在考虑后端机器承载情况的前提下，保证请求分配的平衡和合理。
二、为什么要有负载均衡呢？
1、很明显，如果我们不去考虑后端的承载情况，有可能直接就把某台机器压垮了（比如cpu利用率已经80%了，再给大量的请求直接就干死了），更严重的会直接造成雪崩（一台压死了，对应的请求又压倒其他某台机器上，又干死一台……），从而致使服务瘫痪。
2、如果我们均衡算法选的不好，就会导致后端资源浪费。比如：如果选择一致Hash算法，可以很好利用cache的容量。而如果用随机，有可能就会让cache效果大打折扣（每台机器上都要缓存几乎相同的内容）。
所以，用负载均衡应该是一个比较好的选择。
三、具体怎么做
1、先来看负载算法：
既然要解决后端系统的承载能力，那我们就有很多方式，常见的有以下几种：
A、简单粗暴有效的：手工配置！
大家是不是觉得这个听起来很山寨呢？其实不是。这种方式对于中小系统来讲是最有效最稳定的。因为后端机器的性能配置、上面部署了哪些服务、还能有多大的承载能力等等，我们是最清楚的。那我们在配置的时候，就可以明确的告诉调用者，你只能分配多大的压力到某台服务器上，多了不行！

比如，我们经常看到nginx的配置：
upstream simplemain.com {
server 192.168.1.100:8080 weight=30;
server 192.168.1.101:8080 weight=70;
}
就是说，虽然有两台后端的服务器，但是他们承载能力是不一样的，有一个能力更强，我们就给他70%的压力；有一个更弱，我们就给他30%的压力。这样，nginx就会把更多的压力分配给第二台。

这种方式配置简单，而且很稳定，基本不会产生分配的抖动。不过，带来的问题就是分配很固定，不能动态调整。如果你的后端服务器有一段时间出现性能抖动（比如有其他服务扰动了机器的稳定运行，造成cpu利用率一段时间升高），前端调用者就很难根据实际的情况重新分配请求压力。所以，引入了第二种方法。

B、动态调整。
这种方案会根据机器当前运行的状态和历史平均值进行对比，发现如果当前状态比历史的要糟糕，那么就动态减少请求的数量。如果比历史的要好，那么就可以继续增加请求的压力，直到达到一个平衡。

具体怎么做呢？
首先，刚开始接入的时候，我们可以计算所有机器对于请求的响应时间，算一个平均值。对于响应较快的机器，我们可以多分配一些请求。如果请求多了导致响应减慢，这个时候就会逐步和其他机器持平，说明这台机器达到了相应的平衡。

接着，当接入达到平衡以后，就可以统计这台机器平均的响应时间。如果某一段响应请求变慢了（同时比其他机器都要慢），就可以减少对他请求的分配，将压力转移一部分到其他机器，直到所有机器达到一个整体的平衡。

这种方案是不是看起来很高级呢？他的好处在于可以动态的来平衡后面服务器的处理能力。不过，任何事物都有两面性。这种方案如果遇到极端情况，可能会造成系统雪崩！当某台机器出现短暂网络抖动的时候，他的响应就可能变慢，这个时候，前端服务就会将他的请求分配给其他的机器。如果分配的很多，就有可能造成某些机器响应也变慢。然后又将这些机器的请求分配给另外的……如此这般，那些勤勤恳恳的机器终将被这些请求压死。

所以，更好的方案，将两者结合。一方面静态配置好承载负荷的一个范围，超过最大的就扔掉；另一方面动态的监控后端机器的响应情况，做小范围的请求调整。

2、均衡算法
均衡算法主要解决将请求如何发送给后端服务。经常会用到以下四种算法：随机（random）、轮训（round-robin）、一致哈希（consistent-hash）和主备（master-slave）。

比如：我们配置nginx的时候，经常会用到这样的配置：
upstream simplemain.com {
ip_hash;
server 192.168.1.100:8080;
server 192.168.1.101:8080;
}

这个配置就是按ip做hash算法，然后分配给对应的机器。

接下来我们详细的看看这几个算法是如何来工作的。

A、随机算法。
顾名思义，就是在选取后端服务器的时候，采用随机的一个方法。在具体讲这个算法之前，我们先来看看一个例子，我们写如下C语言的代码:
#include
#include

int main()
{
srand(1234);
printf("%d\n", rand());
return 0;
}

我们用srand函数给随机算法播了一个1234的种子，然后再去随机数，接着我们编译和链接gcc rand.c -o rand

在计算机算法中通常采用的是一种伪随机的算法。我们会先给算法放一个种子，然后根据一定的算法将种子拿来运算，最后得到一个所谓的随机值。我们将上面的算法做一个小小的改动，将1234改为time(NULL)，效果就不一样了：
#include
#include
#include

int main()
{
srand((int)time(NULL));
printf("%d\n", rand());
return 0;
}

time这个函数会获取当前秒数，然后将这个值作为种子放入到伪随机函数，从而计算出的伪随机值会因为秒数不一样而不同。

具体来看一下java源代码里如何来实现的。我们常用的java随机类是java.util.Random这个类。他提供了两个构造函数：
public Random() {
this(seedUniquifier() ^ System.nanoTime());
}

public Random(long seed) {
if (getClass() == Random.class)
this.seed = new AtomicLong(initialScramble(seed));
else {
//subclass might have overriden setSeed
this.seed = new AtomicLong();
setSeed(seed);
}
}

我们可以看到，这个类也是需要一个种子。然后我们获取随机值的时候，会调用next函数：
protectedint next(int bits) {
long oldseed, nextseed;
AtomicLong seed = this.seed;
do {
oldseed = seed.get();
nextseed = (oldseed * multiplier + addend) & mask;
} while (!seed.compareAndSet(oldseed, nextseed));
return (int)(nextseed>>> (48 - bits));
}
这个函数会利用种子进行一个运算，然后得到随机值。所以，我们看起来随机的一个算法，实际上跟时间是相关的，跟算法的运算是相关的。并不是真正的随机。

好了，话归正题，我们用随机算法怎么样做请求均衡呢？比如，还是我们之前那个nginx配置：
upstream simplemain.com {
server 192.168.1.100:8080 weight=30;
server 192.168.1.101:8080 weight=70;
}
我们有两台机器，分别需要承载30%和70%的压力，那么我们算法就可以这样来写（伪代码）：
bool res = abs(rand()) % 100 < 30
这句话是什么意思呢？
1、我们先产生一个伪随机数：rand()
2、将这个伪随机数的转化为非负数: abs(rand())
3、将这个数取模100，将值转化到[0,100)的半开半闭区间：abs(rand()) % 100
4、看这个数是否落入了前30个数的区间[0,30)：abs(rand()) % 100 < 30
如果随机是均匀的话，他们落到[0,100)这个区间里一定是均匀的，所以只要在[0,30)这个区间里，我们就分给第一台机器，否则就分给第二台机器。

B、轮训算法。
轮训算法就像是挨个数数一样（123-123-123……），一个个的轮着来。
upstream simplemain.com {
server 192.168.1.100:8080 weight=30;
server 192.168.1.101:8080 weight=70;
}
还是这个配置，我们就可以这样来做（为了方便，我们把第一台机器叫做A，第二台叫做B）：
1、我们先给两台机器做个排序的数组：array = [ABBABBABBB]
2、我们用一个计数指针来标明现在数组的位置：idx = 3
3、当一个请求来的时候，我们就把指针对应的机器选取出来，并且指针加一，挪到下一个位置。
这样，十个请求，我们就可以保证有3个一定是A，7个一定是B。

轮训算法在实际中也有使用，但是因为要维护idx指针，所以是有状态的。我们经常会用随机算法取代。

C、一致哈希算法。
Hash要解决的是两个问题：
1、散列的不变性：就是同一个请求（比如：同一个用户id）尽量的落入到一台机器，不要因为时间等其他原因，落入到不同的机器上了；
2、异常以后的分散性：当某些机器坏掉（或者增加机器），原来落到同一台机器的请求（比如：用户id为1，101，201），尽量分散到其他机器，不要都落入其他某一台机器。这样对于系统的冲击和影响最小。

有了以上两个原则，这个代码写起来就很好写了。比如我们可以这样做(假定请求的用户id=100）：
1、我们将这个id和所有的服务的IP和端口拼接成一个字符串：
str1 = "192.168.1.100:8080-100"
str2 = "192.168.1.101:8080-100"

2、对这些字符串做hash，然后得到对应的一些整数：
iv1 = hash(str1)
iv2 = hash(str2)

3、对这些整数做从大到小的排序，选出第一个。

好，现在来看看我们的这个算法是否符合之前说的两个原则。
1、散列的不变性：很明显，这个算法是可重入的，只要输入一样，结果肯定一样；
2、异常以后的分散性：当某台机器坏掉以后，原本排到第一的这些机器就被第二位的取代掉了。只要我们的hash算法是分散的，那么得到排到第二位的机器就是分散的。
D、主备算法。
核心的思想是将请求尽量的放到某个固定机器的服务上（注意这里是尽量），而其他机器的服务则用来做备份，如果出现问题就切换到另外的某台机器的服务上。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(6条)

报告相同问题？

关注问题

常见负载均衡服务器介绍
2022-08-24 10:06

summer_west_fish的博客在实际应用中，在 Web 服务器集群之前总会有一台负载均衡服务器，负载均衡设备的任务就是作为 Web 服务器流量的入口，挑选最合适的一台 Web 服务器，将客户端的请求转发给它处理，实现客户端到真实服务端的透明转发...
服务器负载均衡算法
2022-10-22 16:49

哈欠大王爱学习的博客所以，简单轮询算法是一个静态算法，它的适用场景为服务器的性能相近，服务类型比较简单，且每条流对服务器造成的业务负载大致相等。如果服务器S1、S2、S3、S4的权重依次为2、1、1、1，则Hash表中S1、S2、S3、S4权重...
负载均衡器到底是个啥？
2024-07-16 14:31

因_果_律的博客 负载均衡器也被称为“负载分配装置”，顾名思义，其目的是将服务器上的“负荷”适当地“平衡”分散。“Load（负荷）”和“Balancer（平衡器）”组成了Load Balancer。服务器的死活监视是确认处理请求的服务器是否...
什么是负载均衡，看完文章秒懂
2021-07-07 18:52

爱铭网络的博客一、负载均衡简介 1.1. 大型网站面临的挑战大型网站都要面对庞大的用户量，高并发，海量数据等挑战。为了提升系统整体的性能，可以采用垂直扩展和水平扩展两种方式。垂直扩展：在网站发展早期，可以从...
LVS负载均衡服务器搭建
2022-08-02 18:26

无奈的码农的博客使用LVS技术要达到的目标是：通过LVS提供的负载均衡技术和Linux操作系统实现一个高性能，高可用的服务器群集，它具有良好的可靠性、可扩展性和可操作性。从而以低廉的成本实现最优的服务性能。......
分布式调用 - 那些关于负载均衡的一二事儿
2024-11-26 21:22

小小工匠的博客每个网络区域都会存在一个或者多个服务器集群，这里会通过硬件负载均衡器（例如 F5）将请求负载均衡到具体的服务器集群，这个过程就是硬件负载均衡。最后，在集群内通过 Nginx 这样的软件负载均衡器将请求分配到对应...
防火墙——服务器负载均衡
2022-06-04 15:49

静下心来敲木鱼的博客 服务器负载均衡技术将多个服务器组成服务器集群，对外体现为一台逻辑上的服务器，并保证了流量可以比较平均的分配到各个服务器上，避免出现一个服务器满负荷运行、另一个服务器却空闲的情况。
同一个服务器启动多个docker配置负载均衡
2021-12-24 16:34

计算机辅助工程的博客创建django项目容器和nginx容器：参考：...https://blog.csdn.net/datouniao1/article/details/103856583 nginx负载均衡配置办法：参考：https://blog.csdn.net/wsbgmofo/article/details/79088186 参考：...
什么是服务器负载均衡 有什么作用,什么是负载均衡？为什么需要服务器负载均衡！...
2021-07-29 13:34

crazyboy92的博客 负载均衡的定义是是由多台服务器以对称的方式组成一个服务器集合，每台服务器都具有等价的地位，都可以单独对外提供服务而无须其他服务器的辅助。通过某种负载分担技术，将外部发送来的请求均匀分配到对称结构中的某...
搭建Keepalived+Nginx高可用负载均衡服务器
2022-02-06 09:06

小白*进阶ing的博客有一个应用服务器集群(cluster)，有很多应用服务器组成一个集群 服务器三高高可用：服务器能否能24*365不间断提供服务，服务器容灾性高高并发：同一时间上，服务器能够同时容纳的用户连接数高性能：服务器处理...
没有解决我的问题, 去提问

一个比较棘手的问题是关于负载均衡的

7条回答 默认 最新

7条回答默认最新