常见限流算法对比与令牌桶详解#

一、四种限流算法对比#

1. 固定窗口计数器#

原理：在固定时间窗口内统计请求数，超过阈值则拒绝。

优点：实现简单，内存占用小缺点：存在”临界问题” - 窗口边界可能出现 2 倍流量突刺

1
窗口1: [0s-1s] 允许100个请求
2
窗口2: [1s-2s] 允许100个请求
3
问题：0.9s-1.1s 可能通过200个请求

2. 滑动窗口计数器#

原理：将时间窗口切分成多个小格子，统计滑动时间范围内的请求总数。

优点：解决固定窗口的临界问题，更平滑缺点：需要存储多个时间格子的计数，内存占用较大

3. 漏桶算法 (Leaky Bucket)#

原理：请求进入漏桶，以恒定速率流出处理。桶满则溢出拒绝。

优点：流量整形效果好，输出绝对平滑缺点：无法应对突发流量，即使系统空闲也无法快速处理

1
     请求 ↓↓↓
2
    ┌─────────┐
3
    │  漏桶   │
4
    │ ~~~~~~  │
5
    └────↓────┘
6
      恒定速率流出

4. 令牌桶算法 (Token Bucket) ⭐#

原理：以恒定速率生成令牌放入桶中，请求需获取令牌才能通过。

优点：

✅ 支持突发流量 - 桶中积累的令牌可一次性使用
✅ 既能限制平均速率，又有弹性
✅ 适合大多数业务场景

缺点：实现相对复杂

二、令牌桶算法详解#

工作原理#

1
令牌生成器 → 恒定速率r
2
                ↓
3
    ┌──────────────────┐
4
    │   令牌桶 (容量c) │
5
    │   🪙🪙🪙🪙🪙     │
6
    └──────────────────┘
7
           ↓ 获取令牌
8
        请求处理

核心机制：

令牌以固定速率 r 生成（如每秒 100 个）
桶的容量为 c（如最多存 200 个令牌）
请求到达时尝试获取令牌：
- 有令牌：获取成功，请求通过
- 无令牌：拒绝请求或等待
令牌满了会丢弃新生成的令牌

为什么支持突发流量？#

假设：r=100/s，c=200

平稳期：1 秒内最多处理 100 个请求（消耗=生成）
突发期：如果之前系统空闲，桶中积累了 200 个令牌，此时可瞬间处理 200 个请求
限制：突发过后，仍按 100/s 的平均速率处理

三、实现方式对比#

单机实现#

使用本地变量存储令牌数和时间戳
适合单体应用
性能高，无网络开销

分布式实现#

常见方案：

Redis + Lua 脚本：保证原子性，适合中小规模
Redis + 限流中间件（如 Sentinel）
独立限流服务（如 Envoy Rate Limit Service）

核心挑战：

原子性：令牌获取必须是原子操作
一致性：多实例间的令牌计数同步
性能：减少网络调用开销

四、代码实现#

Java 实现（单机版）#

1
import java.util.concurrent.TimeUnit;
2
import java.util.concurrent.locks.ReentrantLock;
3

4
/**
5
 * 令牌桶限流器
6
 */
7
public class TokenBucketRateLimiter {
8
    // 桶的容量
9
    private final long capacity;
10
    // 令牌生成速率（每秒）
11
    private final long refillRate;
12
    // 当前令牌数
13
    private long tokens;
14
    // 上次刷新时间
15
    private long lastRefillTime;
16
    // 线程安全锁
17
    private final ReentrantLock lock = new ReentrantLock();
18

19
    /**
20
     * @param capacity 桶容量（最大令牌数）
21
     * @param refillRate 每秒生成的令牌数
22
     */
23
    public TokenBucketRateLimiter(long capacity, long refillRate) {
24
        this.capacity = capacity;
25
        this.refillRate = refillRate;
26
        this.tokens = capacity; // 初始化时桶是满的
27
        this.lastRefillTime = System.nanoTime();
28
    }
29

30
    /**
31
     * 尝试获取指定数量的令牌
32
     * @param tokensRequired 需要的令牌数
33
     * @return 是否成功获取
34
     */
35
    public boolean tryAcquire(long tokensRequired) {
36
        lock.lock();
37
        try {
38
            refill();
39
            if (tokens >= tokensRequired) {
40
                tokens -= tokensRequired;
41
                return true;
42
            }
43
            return false;
44
        } finally {
45
            lock.unlock();
46
        }
47
    }
48

49
    /**
50
     * 获取1个令牌
51
     */
52
    public boolean tryAcquire() {
53
        return tryAcquire(1);
54
    }
55

56
    /**
57
     * 阻塞式获取令牌，直到成功
58
     * @param tokensRequired 需要的令牌数
59
     * @param timeout 超时时间
60
     * @param unit 时间单位
61
     * @return 是否在超时前获取成功
62
     */
63
    public boolean acquire(long tokensRequired, long timeout, TimeUnit unit)
64
            throws InterruptedException {
65
        long deadline = System.nanoTime() + unit.toNanos(timeout);
66

67
        while (System.nanoTime() < deadline) {
68
            if (tryAcquire(tokensRequired)) {
69
                return true;
70
            }
71
            // 计算需要等待的时间
72
            long waitTime = (tokensRequired - tokens) * 1_000_000_000L / refillRate;
73
            if (waitTime > 0) {
74
                Thread.sleep(Math.min(waitTime / 1_000_000, 100));
75
            }
76
        }
77
        return false;
78
    }
79

80
    /**
81
     * 补充令牌
82
     */
83
    private void refill() {
84
        long now = System.nanoTime();
85
        long elapsedTime = now - lastRefillTime;
86

87
        // 计算这段时间应该生成的令牌数
88
        long tokensToAdd = (elapsedTime * refillRate) / 1_000_000_000L;
89

90
        if (tokensToAdd > 0) {
91
            tokens = Math.min(capacity, tokens + tokensToAdd);
92
            lastRefillTime = now;
93
        }
94
    }
95

96
    /**
97
     * 获取当前可用令牌数
98
     */
99
    public long getAvailableTokens() {
100
        lock.lock();
101
        try {
102
            refill();
103
            return tokens;
104
        } finally {
105
            lock.unlock();
106
        }
107
    }
108

109
    // 使用示例
110
    public static void main(String[] args) throws InterruptedException {
111
        // 创建限流器：容量200，每秒生成100个令牌
112
        TokenBucketRateLimiter limiter = new TokenBucketRateLimiter(200, 100);
113

114
        System.out.println("=== 测试突发流量 ===");
115
        // 模拟突发：瞬间150个请求
116
        int successCount = 0;
117
        for (int i = 0; i < 150; i++) {
118
            if (limiter.tryAcquire()) {
119
                successCount++;
120
            }
121
        }
122
        System.out.println("突发150个请求，通过: " + successCount);
123
        System.out.println("剩余令牌: " + limiter.getAvailableTokens());
124

125
        System.out.println("\n=== 测试持续流量 ===");
126
        // 模拟持续请求
127
        for (int i = 0; i < 5; i++) {
128
            Thread.sleep(1000); // 等待1秒
129
            int pass = 0;
130
            for (int j = 0; j < 120; j++) {
131
                if (limiter.tryAcquire()) {
132
                    pass++;
133
                }
134
            }
135
            System.out.println("第" + (i+1) + "秒: 尝试120个请求，通过 " + pass);
136
        }
137

138
        System.out.println("\n=== 测试阻塞获取 ===");
139
        boolean acquired = limiter.acquire(10, 2, TimeUnit.SECONDS);
140
        System.out.println("阻塞获取10个令牌: " + (acquired ? "成功" : "超时"));
141
    }
142
}

Go 实现（单机版）#

1
package main
2

3
import (
4
  "fmt"
5
  "sync"
6
  "time"
7
)
8

9
// TokenBucket 令牌桶限流器
10
type TokenBucket struct {
11
  capacity       int64         // 桶容量
12
  refillRate     int64         // 每秒生成的令牌数
13
  tokens         int64         // 当前令牌数
14
  lastRefillTime time.Time     // 上次刷新时间
15
  mu             sync.Mutex    // 互斥锁
16
}
17

18
// NewTokenBucket 创建令牌桶
19
func NewTokenBucket(capacity, refillRate int64) *TokenBucket {
20
  return &TokenBucket{
21
    capacity:       capacity,
22
    refillRate:     refillRate,
23
    tokens:         capacity, // 初始化时桶是满的
24
    lastRefillTime: time.Now(),
25
  }
26
}
27

28
// TryAcquire 尝试获取指定数量的令牌
29
func (tb *TokenBucket) TryAcquire(tokensRequired int64) bool {
30
  tb.mu.Lock()
31
  defer tb.mu.Unlock()
32

33
  tb.refill()
34

35
  if tb.tokens >= tokensRequired {
36
    tb.tokens -= tokensRequired
37
    return true
38
  }
39
  return false
40
}
41

42
// TryAcquireOne 尝试获取1个令牌
43
func (tb *TokenBucket) TryAcquireOne() bool {
44
  return tb.TryAcquire(1)
45
}
46

47
// Acquire 阻塞式获取令牌，直到成功或超时
48
func (tb *TokenBucket) Acquire(tokensRequired int64, timeout time.Duration) bool {
49
  deadline := time.Now().Add(timeout)
50

51
  for time.Now().Before(deadline) {
52
    if tb.TryAcquire(tokensRequired) {
53
      return true
54
    }
55

56
    // 计算需要等待的时间
57
    tb.mu.Lock()
58
    tb.refill()
59
    waitTokens := tokensRequired - tb.tokens
60
    tb.mu.Unlock()
61

62
    if waitTokens > 0 {
63
      waitTime := time.Duration(waitTokens*1e9/tb.refillRate) * time.Nanosecond
64
      if waitTime > 100*time.Millisecond {
65
        waitTime = 100 * time.Millisecond
66
      }
67
      time.Sleep(waitTime)
68
    }
69
  }
70
  return false
71
}
72

73
// refill 补充令牌（需要在持有锁的情况下调用）
74
func (tb *TokenBucket) refill() {
75
  now := time.Now()
76
  elapsed := now.Sub(tb.lastRefillTime)
77

78
  // 计算这段时间应该生成的令牌数
79
  tokensToAdd := int64(elapsed.Seconds() * float64(tb.refillRate))
80

81
  if tokensToAdd > 0 {
82
    tb.tokens += tokensToAdd
83
    if tb.tokens > tb.capacity {
84
      tb.tokens = tb.capacity
85
    }
86
    tb.lastRefillTime = now
87
  }
88
}
89

90
// GetAvailableTokens 获取当前可用令牌数
91
func (tb *TokenBucket) GetAvailableTokens() int64 {
92
  tb.mu.Lock()
93
  defer tb.mu.Unlock()
94

95
  tb.refill()
96
  return tb.tokens
97
}
98

99
func main() {
100
  // 创建限流器：容量200，每秒生成100个令牌
101
  limiter := NewTokenBucket(200, 100)
102

103
  fmt.Println("=== 测试突发流量 ===")
104
  // 模拟突发：瞬间150个请求
105
  successCount := 0
106
  for i := 0; i < 150; i++ {
107
    if limiter.TryAcquireOne() {
108
      successCount++
109
    }
110
  }
111
  fmt.Printf("突发150个请求，通过: %d\n", successCount)
112
  fmt.Printf("剩余令牌: %d\n", limiter.GetAvailableTokens())
113

114
  fmt.Println("\n=== 测试持续流量 ===")
115
  // 模拟持续请求
116
  for i := 0; i < 5; i++ {
117
    time.Sleep(1 * time.Second)
118
    pass := 0
119
    for j := 0; j < 120; j++ {
120
      if limiter.TryAcquireOne() {
121
        pass++
122
      }
123
    }
124
    fmt.Printf("第%d秒: 尝试120个请求，通过 %d\n", i+1, pass)
125
  }
126

127
  fmt.Println("\n=== 测试阻塞获取 ===")
128
  acquired := limiter.Acquire(10, 2*time.Second)
129
  if acquired {
130
    fmt.Println("阻塞获取10个令牌: 成功")
131
  } else {
132
    fmt.Println("阻塞获取10个令牌: 超时")
133
  }
134

135
  fmt.Println("\n=== 并发测试 ===")
136
  // 重置限流器
137
  limiter = NewTokenBucket(100, 50)
138

139
  var wg sync.WaitGroup
140
  successTotal := int64(0)
141
  var successMu sync.Mutex
142

143
  // 10个goroutine并发请求
144
  for i := 0; i < 10; i++ {
145
    wg.Add(1)
146
    go func(id int) {
147
      defer wg.Done()
148
      localSuccess := 0
149
      for j := 0; j < 20; j++ {
150
        if limiter.TryAcquireOne() {
151
          localSuccess++
152
        }
153
        time.Sleep(10 * time.Millisecond)
154
      }
155
      successMu.Lock()
156
      successTotal += int64(localSuccess)
157
      successMu.Unlock()
158
      fmt.Printf("Goroutine %d: 通过 %d 个请求\n", id, localSuccess)
159
    }(i)
160
  }
161

162
  wg.Wait()
163
  fmt.Printf("并发总通过: %d 个请求\n", successTotal)
164
}

基于 Redis 的分布式实现（Go + Lua）#

1
package main
2

3
import (
4
  "context"
5
  "fmt"
6
  "time"
7

8
  "github.com/redis/go-redis/v9"
9
)
10

11
// Lua脚本：原子性获取令牌
12
const tokenBucketScript = `
13
-- KEYS[1]: 令牌桶key
14
-- KEYS[2]: 时间戳key
15
-- ARGV[1]: 桶容量
16
-- ARGV[2]: 令牌生成速率（每秒）
17
-- ARGV[3]: 当前时间戳（纳秒）
18
-- ARGV[4]: 请求令牌数
19

20
local capacity = tonumber(ARGV[1])
21
local refill_rate = tonumber(ARGV[2])
22
local now = tonumber(ARGV[3])
23
local tokens_required = tonumber(ARGV[4])
24

25
-- 获取当前令牌数和上次刷新时间
26
local tokens = tonumber(redis.call('GET', KEYS[1]) or capacity)
27
local last_refill_time = tonumber(redis.call('GET', KEYS[2]) or now)
28

29
-- 计算应该生成的令牌数
30
local elapsed = math.max(0, now - last_refill_time)
31
local tokens_to_add = math.floor((elapsed / 1e9) * refill_rate)
32

33
-- 更新令牌数（不超过容量）
34
if tokens_to_add > 0 then
35
    tokens = math.min(capacity, tokens + tokens_to_add)
36
    last_refill_time = now
37
end
38

39
-- 尝试获取令牌
40
if tokens >= tokens_required then
41
    tokens = tokens - tokens_required
42
    -- 保存状态
43
    redis.call('SET', KEYS[1], tokens)
44
    redis.call('SET', KEYS[2], last_refill_time)
45
    -- 设置过期时间（避免Redis内存泄漏）
46
    redis.call('EXPIRE', KEYS[1], 3600)
47
    redis.call('EXPIRE', KEYS[2], 3600)
48
    return 1  -- 成功
49
else
50
    return 0  -- 失败
51
end
52
`
53

54
// DistributedTokenBucket 分布式令牌桶限流器
55
type DistributedTokenBucket struct {
56
  rdb        *redis.Client
57
  key        string  // Redis key前缀
58
  capacity   int64   // 桶容量
59
  refillRate int64   // 每秒生成的令牌数
60
  script     *redis.Script
61
}
62

63
// NewDistributedTokenBucket 创建分布式令牌桶
64
func NewDistributedTokenBucket(rdb *redis.Client, key string, capacity, refillRate int64) *DistributedTokenBucket {
65
  return &DistributedTokenBucket{
66
    rdb:        rdb,
67
    key:        key,
68
    capacity:   capacity,
69
    refillRate: refillRate,
70
    script:     redis.NewScript(tokenBucketScript),
71
  }
72
}
73

74
// TryAcquire 尝试获取指定数量的令牌
75
func (dtb *DistributedTokenBucket) TryAcquire(ctx context.Context, tokensRequired int64) (bool, error) {
76
  keys := []string{
77
    dtb.key + ":tokens",
78
    dtb.key + ":timestamp",
79
  }
80
  args := []interface{}{
81
    dtb.capacity,
82
    dtb.refillRate,
83
    time.Now().UnixNano(),
84
    tokensRequired,
85
  }
86

87
  result, err := dtb.script.Run(ctx, dtb.rdb, keys, args...).Int()
88
  if err != nil {
89
    return false, err
90
  }
91

92
  return result == 1, nil
93
}
94

95
// TryAcquireOne 尝试获取1个令牌
96
func (dtb *DistributedTokenBucket) TryAcquireOne(ctx context.Context) (bool, error) {
97
  return dtb.TryAcquire(ctx, 1)
98
}
99

100
// GetAvailableTokens 获取当前可用令牌数（仅用于监控）
101
func (dtb *DistributedTokenBucket) GetAvailableTokens(ctx context.Context) (int64, error) {
102
  result, err := dtb.rdb.Get(ctx, dtb.key+":tokens").Int64()
103
  if err == redis.Nil {
104
    return dtb.capacity, nil
105
  }
106
  return result, err
107
}
108

109
func main() {
110
  // 连接Redis
111
  rdb := redis.NewClient(&redis.Options{
112
    Addr:     "localhost:6379",
113
    Password: "", // 根据实际情况设置
114
    DB:       0,
115
  })
116
  defer rdb.Close()
117

118
  ctx := context.Background()
119

120
  // 测试连接
121
  _, err := rdb.Ping(ctx).Result()
122
  if err != nil {
123
    fmt.Printf("无法连接Redis: %v\n", err)
124
    fmt.Println("请确保Redis服务正在运行")
125
    return
126
  }
127

128
  // 创建分布式限流器：容量200，每秒生成100个令牌
129
  limiter := NewDistributedTokenBucket(rdb, "rate_limit:api", 200, 100)
130

131
  fmt.Println("=== 分布式令牌桶测试 ===")
132

133
  // 测试1：突发流量
134
  fmt.Println("\n1. 测试突发流量")
135
  successCount := 0
136
  for i := 0; i < 150; i++ {
137
    ok, err := limiter.TryAcquireOne(ctx)
138
    if err != nil {
139
      fmt.Printf("错误: %v\n", err)
140
      return
141
    }
142
    if ok {
143
      successCount++
144
    }
145
  }
146
  fmt.Printf("突发150个请求，通过: %d\n", successCount)
147

148
  tokens, _ := limiter.GetAvailableTokens(ctx)
149
  fmt.Printf("剩余令牌: %d\n", tokens)
150

151
  // 测试2：持续流量
152
  fmt.Println("\n2. 测试持续流量（每秒120个请求）")
153
  for i := 0; i < 3; i++ {
154
    time.Sleep(1 * time.Second)
155
    pass := 0
156
    for j := 0; j < 120; j++ {
157
      ok, _ := limiter.TryAcquireOne(ctx)
158
      if ok {
159
        pass++
160
      }
161
    }
162
    fmt.Printf("第%d秒: 通过 %d 个请求\n", i+1, pass)
163
  }
164

165
  // 测试3：模拟多实例并发
166
  fmt.Println("\n3. 模拟3个服务实例并发请求")
167
  successChan := make(chan int, 3)
168

169
  for instance := 0; instance < 3; instance++ {
170
    go func(id int) {
171
      localSuccess := 0
172
      for j := 0; j < 50; j++ {
173
        ok, _ := limiter.TryAcquireOne(ctx)
174
        if ok {
175
          localSuccess++
176
        }
177
        time.Sleep(10 * time.Millisecond)
178
      }
179
      successChan <- localSuccess
180
      fmt.Printf("实例%d: 通过 %d 个请求\n", id, localSuccess)
181
    }(instance)
182
  }
183

184
  totalSuccess := 0
185
  for i := 0; i < 3; i++ {
186
    totalSuccess += <-successChan
187
  }
188
  fmt.Printf("总通过: %d 个请求\n", totalSuccess)
189

190
  fmt.Println("\n测试完成！")
191
}
192

193
/*
194
使用说明：
195
1. 安装依赖: go get github.com/redis/go-redis/v9
196
2. 启动Redis: docker run -p 6379:6379 redis
197
3. 运行程序: go run main.go
198

199
优势：
200
- 多实例间共享限流配额
201
- 原子性操作保证一致性
202
- 支持动态调整限流策略
203

204
注意事项：
205
- Redis性能成为瓶颈时考虑本地缓存
206
- 设置合理的key过期时间
207
- 监控Redis连接和网络延迟
208
*/

Java 实现（单机版）### Go 实现（单机版）### 基于 Redis 的分布式实现（Go + Lua）## 五、选型建议#

场景	推荐算法	原因
API 网关	令牌桶	需要处理突发流量，用户体验好
消息队列消费	漏桶	需要绝对平滑的处理速率
简单计数	固定窗口	实现简单，资源占用少
精确控制	滑动窗口	更平滑，无临界问题

六、进阶优化#

1. 预热机制#

系统启动时桶可能是空的，可以初始化一定数量的令牌

2. 动态调整#

根据系统负载动态调整 refillRate

3. 分层限流#

1
全局限流（1000 QPS）
2
  ↓
3
用户级限流（每用户 10 QPS）
4
  ↓
5
接口级限流（单接口 5 QPS）

4. 本地缓存 + Redis#

1
// 本地桶处理大部分请求，减少Redis调用
2
if localBucket.TryAcquire() {
3
    return true
4
}
5
// 本地失败时尝试Redis
6
return redisBucket.TryAcquire()

总结：令牌桶是最常用的限流算法，它在保证平均速率的同时支持突发流量，适合绝大多数业务场景。单机场景用本地实现即可，分布式场景推荐 Redis + Lua 方案。

Libz's Blog