Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

feat: 限流-CPU使用率自适应限流 #186

Open
wants to merge 12 commits into
base: main
Choose a base branch
from

Conversation

WTIFS
Copy link
Contributor

@WTIFS WTIFS commented Oct 30, 2023

Please provide issue(s) of this PR:
Fixes #165

To help us figure out who should review this PR, please put an X in all the areas that this PR affects.

  • Configuration
  • Docs
  • Performance and Scalability
  • Naming
  • HealthCheck
  • Test and Release

Please check any characteristics that apply to this pull request.

  • Does not have any user-facing changes. This may include API changes, behavior changes, performance improvements, etc.

BBR

BBR CPU 自适应限流组件参考了 TCP BBR 的思想,以及 阿里 Sentinel 的算法。

传统的限流思路为:超过一定负载就拦截流量进入,负载恢复就放开流量,这样做有延迟性,最终是按照果来调节因,无法取得良好效果。

BBR 的思路为:根据应用的请求处理时间、请求成功数、最大并发数这些指标,计算当前应用能承载的最大并发请求量,再对比当前系统并发量,判断是否应当拦截本次流量,即所谓"自适应"。

BBR 的源码实现可参考:

插件设计

本插件将 BBR 限流器适配成 QuotaBucket 接口(主要实现 GetQuotaWithRelease 判断限流方法),以及 ServiceRateLimiter 接口(实现 InitQuota 初始化方法)。

由于 BBR 限流需要记录请求通过数、当前并发数、请求耗时,因此没有复用原来 QuotaBucket 接口中的 GetQuota 方法,而是新增了一个方法 GetQuotaWithRelease,该方法相比于 GetQuota 方法,返回参数中多了一个 func(),供业务方在业务逻辑处理完成后调用。

由于 CPU 使用率指标为实例单机指标,因此 CPU 限流只适用于单机限流,不适用于分布式限流,未实现分布式限流器需要实现的接口。

初始化 InitQuota

kratos - BBR 初始化需要三个入参:

CPUThreshold: CPU使用率阈值,超过该阈值时,根据应用过去能承受的负载判断是否拦截流量 
window: 窗口采样时长,控制采样多久的数据
bucket: 桶数,BBR 会把 window 分成多个 bucket,沿时间轴向前滑动。如 window=1s, bucket=10 时,整个滑动窗口用来保存最近 1s 的采样数据,每个小的桶用来保存 100ms 的采样数据。当时间流动之后,过期的桶会自动被新桶的数据覆盖掉

这三个入参,从 apitraffic.Rule 结构体中解析,直接使用了结构体中的 MaxAmountValidDurationPrecision 字段

判断限流 GetQuotaWithRelease

调用了 BBR 的 Allow() 方法

其内部执行 shouldDrop() 方法,其执行流程如下:

img.jpg

流程中比较关键的一步是计算应用可承受的最大请求量,由下列方法计算:

func (l *BBR) maxInFlight() int64 {
	return int64(math.Floor(float64(l.maxPASS()*l.minRT()*l.bucketPerSecond)/1000.0) + 0.5)
}
  • maxPass * bucketPerSecond / 1000 为每毫秒处理的请求数
  • l.minRT() 为 单个采样窗口中最小的响应时间
  • 0.5为向上取整
  • 当CPU利用率过载时,就需要通过上述预期公式进行干预。在服务运行期间持续统计当前服务的请求数,即 inFlight,通过在滑动窗口内的所有buckets中比较得出最多请求完成数 maxPass,以及最小的耗时 minRT,相乘就得出了预期的最佳请求数 maxInFlight
  • maxInFlight 表示系统能同时处理的最多请求数,这个水位是一个平衡点,保持该水位可以最大化系统的处理能力,超过该水位则会导致请求堆积。
  • 通过 inFlightmaxInFlight 对比,如果前者大于后者那么就已经过载,进而拒绝后续到来的请求防止服务过载。

plugin/ratelimiter/bbr/README.md Outdated Show resolved Hide resolved
plugin/ratelimiter/bbr/bucket.go Outdated Show resolved Hide resolved
plugin/ratelimiter/bbr/core/bbr.go Outdated Show resolved Hide resolved
@chuntaojun
Copy link
Member

可以贴一个配置的图看下在北极星的配置吗

@chuntaojun
Copy link
Member

代码文件的 license header 需要加上

@WTIFS
Copy link
Contributor Author

WTIFS commented Nov 24, 2023

@chuntaojun polaris-console 的 PR:polarismesh/polaris-console#256

配置界面如下:
image

Copy link
Member

@daheige daheige left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

good idea!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

限流:支持自适应限流
3 participants