爱上口袋的天空 2024-05-23 16:09 采纳率: 100%
浏览 16
已结题

java微服务节点假死,网关路由时长延迟

 一个java微服务项目,使用了eureka、hystrix、ribbon、zuul`等技术,目前服务是集群分布式架构,每个服务存在4个节点,有时候项目其中一个节点内存溢出了,出现了假死状态,无法提供服务,但是网关zuul+ribbon转发请求的时候,还是会将请求转发到这台坏的节点,直到一直访问不通,才会自动转发到其它节点,最后再返回数据,这个请求中间大概花费了10~20秒左右,严重影响整体性能。这种节点假死eureka因为自我保护机制也不会剔除它。
  • 写回答

24条回答 默认 最新

  • 专家-赤兔[在线] 全栈领域优质创作者 2024-05-23 16:09
    关注

    引自免费微信小程序:皆我百晓生

    为了解决这个问题,我们需要对Java微服务中的几个关键组件进行调整,包括Eureka、Hystrix和Ribbon。以下是具体的步骤和配置建议:

    1. 优化Eureka客户端配置: 在Eureka客户端(即各个微服务应用)的配置文件中,增加Eureka心跳检测的相关配置,让Eureka更快速地发现节点故障。

      eureka:
        client:
          register-with-eureka: true
          fetch-registry: true
          serviceUrl:
            defaultZone: http://eureka-server:8761/eureka/
          # 增加心跳间隔时间和最大空闲时间
          heartbeatIntervalSeconds: 5 # 默认30秒,这里设置为5秒
          leaseRenewalIntervalInSeconds: 5 # 默认30秒,这里设置为5秒
          leaseExpirationDurationInSeconds: 15 # 默认90秒,这里设置为15秒
      
    2. 启用Hystrix熔断器的快速失败机制: Hystrix可以更快地识别服务调用失败,并进入降级策略。在Hystrix配置中,减少circuitBreaker.requestVolumeThresholdhiristrix.command.default.execution.isolation.thread.timeoutInMilliseconds的值。

      @Configuration
      public class HystrixConfig {
      
          @Bean
          public HystrixCommandProperties hystrixCommandProperties() {
              return new HystrixCommandPropertiesBuilder()
                      .setCircuitBreakerRequestVolumeThreshold(5) // 设置最小请求数量,低于此数量不触发熔断
                      .setExecutionIsolationThreadTimeoutInMilliseconds(1000) // 熔断阈值,超过这个时间未完成则熔断
                      .build();
          }
      }
      
    3. 配置Ribbon超时和重试: 调整Ribbon的连接超时、读取超时以及重试次数,使其在网络不稳定或目标服务响应慢的情况下能更快地失败并尝试其他可用的服务实例。

      ribbon:
        ReadTimeout: 3000 # 设置读取超时时间,单位毫秒,默认2000ms
        ConnectTimeout: 3000 # 设置连接超时时间,单位毫秒,默认2000ms
        MaxAutoRetries: 0 # 设置重试次数,默认为1
        MaxAutoRetriesNextServer: 0 # 设置在所有服务器上重试的最大次数,仅当MaxAutoRetries > 0时有效
      
    4. 使用Hystrix仪表盘监控: 配置Hystrix Dashboard以便实时监控各个服务的健康状况,及时发现问题。

    5. 考虑使用Spring Cloud Gateway: 如果可能,考虑将Zuul升级到Spring Cloud Gateway,因为它提供了更好的容错能力和更细粒度的控制。

    6. 优雅退场与服务重启: 当检测到服务节点异常时,可以设计一个监控系统,自动重启出问题的服务实例,确保服务始终在线。

    通过上述配置,你应该能显著缩短请求延迟,提高系统的健壮性和稳定性。同时,结合日志监控和报警系统,以便在问题发生时及时处理。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(23条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 5月30日
  • 已采纳回答 5月30日
  • 创建了问题 5月23日

悬赏问题

  • ¥15 Java与Hbase相关问题
  • ¥20 bash代码推送不上去 git fetch origin master #失败了
  • ¥15 LOL外服加入了反作弊系统,现在游戏录像rofl文件离线都无法打开
  • ¥45 工程软件单片机设计课题要求
  • ¥15 在centos7安装conda
  • ¥15 c#调用yolo3 dll文件获取的数据对不上
  • ¥20 WPF 如何实现多语言,label 和cs(live Charts)中是否都能翻译
  • ¥15 STM32F103上电短路问题
  • ¥15 打开软件提示错误:failed to get wglChoosePixelFormatARB
  • ¥15 (标签-python|关键词-char)