Laoli

The world is big, you have to go and see

Announcement

Welcome to Laoli's blog!

Learn More

3508 字

18 分钟

Java Lambda底层原理

2026-03-20

Java

/

invoke dynamic

/

JVM

Java Lambda底层原理#

你有没有过这种经历？

写了一段无比简单的 Lambda 代码，满心欢喜想看看它到底是怎么编译的，结果打开反编译工具一看，直接懵了：

我的 Lambda 逻辑去哪了？怎么这个类里什么都没有？

没错，这就是我最近遇到的诡异现象。今天我就带你扒开 JVM 的底裤，把 Lambda 的底层实现、invokedynamic 的魔法、动态代理类的生成流程，一次性给你讲得明明白白。

一、诡异的现象：我的代码消失了？#

先还原一下场景，我写了一段最简单的 Lambda 代码：

1
public class LambdaWithParamsDemo {
2
    public static void main(String[] args) {
3
        Calculator add = (a, b) -> a + b;
4
        System.out.println(add.calculate(10, 5));
5
    }
6

7
    interface Calculator {
8
        int calculate(int a, int b);
9
    }
10
}

这段代码很简单：定义了一个函数式接口Calculator，然后用 Lambda 表达式实现了它的加法逻辑。

运行结果也很正常，输出15，没毛病。

但当我用 JD-GUI 打开编译后的 class 文件时，我直接傻了：

我点开那个LambdaWithParamsDemo$Calculator类，发现它居然是个空接口！

没有字段
只有一个抽象方法
完全看不到我写的a + b逻辑！

我写的 Lambda 代码去哪了？蒸发了？

二、第一步：用 javap 扒开宿主类的底裤#

反编译工具靠不住，那我就用 JDK 自带的javap来硬刚，直接看字节码：

1
javap -c -p LambdaWithParamsDemo.class

结果出来的瞬间，我发现了新大陆：

1
Compiled from "LambdaWithParamsDemo.java"
2
public class com.example.demo.LambdaWithParamsDemo {
3
  public com.example.demo.LambdaWithParamsDemo();
4
    Code:
5
       0: aload_0
6
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
7
       4: return
8

9
  public static void main(java.lang.String[]);
10
    Code:
11
       0: invokedynamic #7,  0              // InvokeDynamic #0:calculate:()Lcom/example/demo/LambdaWithParamsDemo$Calculator;
12
       5: astore_1
13
       6: getstatic     #11                 // Field java/lang/System.out:Ljava/io/PrintStream;
14
       9: aload_1
15
      10: bipush        10
16
      12: iconst_5
17
      13: invokeinterface #17,  3           // InterfaceMethod com/example/demo/LambdaWithParamsDemo$Calculator.calculate:(II)I
18
      18: invokevirtual #22                 // Method java/io/PrintStream.println:(I)V
19
      21: return
20

21
  private static int lambda$main$0(int, int);
22
    Code:
23
       0: iload_0
24
       1: iload_1
25
       2: iadd
26
       3: ireturn
27
}

哦！原来在这里！

我看到了一个诡异的方法：private static int lambda$main$0$int, int$

它的字节码太简单了：

加载第一个参数a
加载第二个参数b
执行iadd（整数加法）
返回结果

这不就是我写的(a, b) -> a + b吗！

原来 Lambda 的逻辑，被编译器偷偷藏进了宿主类的一个私有静态方法里！

三、编译期：Lambda 被偷偷藏进了宿主类#

到这里我才明白，Java 8 的 Lambda，在编译期根本没做你想的那些事。

传统匿名内部类的做法#

如果我用匿名内部类写这段代码：

1
Calculator add = new Calculator() {
2
    @Override
3
    public int calculate(int a, int b) {
4
        return a + b;
5
    }
6
};

编译器会直接生成一个新的 class 文件：LambdaWithParamsDemo$1.class

这个文件会被写到磁盘上
里面包含了完整的calculate方法逻辑
反编译工具能直接看到

Lambda 的做法#

但 Lambda 完全不一样：

编译器没有生成新的 class 文件
它把你的 Lambda 表达式，直接编译成了宿主类里的一个私有静态方法（就是那个lambda$main$0）
然后在main方法里，生成了一条奇怪的指令：invokedynamic

这就是为什么你在反编译工具里看不到 Lambda 逻辑 —— 因为它根本不在那个接口类里，它藏在宿主类的屁股后面！

四、运行期：invokedynamic 的魔法流水线#

那问题来了：invokedynamic到底是个什么东西？它是怎么把那个静态方法，变成一个Calculator接口对象的？

这就是 Java Lambda 最黑魔法的部分了。我带你走一遍 JVM 的底层执行流程，100% 还原真实的源码逻辑。

整个流程就像一条流水线：#

1
invokedynamic 指令触发
2
       ↓
3
调用 LambdaMetafactory 引导方法
4
       ↓
5
用 ASM 在内存中拼接字节码
6
       ↓
7
生成代理类：Lambda$$1 implements Calculator
8
       ↓
9
用 Unsafe 把字节码加载成Class
10
       ↓
11
创建代理实例，赋值给add变量

我们一步一步拆：

第 1 步：invokedynamic 触发引导方法#

当 JVM 第一次执行到invokedynamic这条指令时，它不会直接调用方法，而是先去查 class 文件里的BootstrapMethods属性。

对于 Lambda，这个属性固定指向 JDK 内置的一个方法：

1
java.lang.invoke.LambdaMetafactory.metafactory

意思就是：

“JVM，你帮我调用这个方法，它会告诉你接下来该调用谁。”

第 2 步：LambdaMetafactory 拿到所有参数#

这个metafactory方法会拿到 3 个关键信息：

要实现的接口：Calculator
接口的方法签名：calculate(int,int)
真正要执行的逻辑：宿主类的lambda$main$0(int,int)

拿到这三个信息，它就知道了：

“哦，我要造一个类，实现 Calculator 接口，它的 calculate 方法，直接调用那个静态方法就行。”

第 3 步：ASM 在内存里拼字节码！#

重点来了！JDK 内部用了ASM 字节码生成引擎，直接在内存里手写二进制 class 文件！

注意：它不会写磁盘！只在内存里拼！

它拼出来的 class 长这样：

1
// 内存中动态生成的类
2
final class LambdaWithParamsDemo$$Lambda$1 implements Calculator {
3
    private LambdaWithParamsDemo$$Lambda$1() {}
4

5
    @Override
6
    public int calculate(int a, int b) {
7
        // 唯一的逻辑：转发调用！
8
        return LambdaWithParamsDemo.lambda$main$0(a, b);
9
    }
10
}

没错！这个类就这么点东西！

没有字段
没有多余的方法
就一个空构造，一个转发方法

ASM 做的事情，就是把这段代码，翻译成二进制的字节码，拼出一个完整的 class 数组。

第 4 步：Unsafe 后门加载类#

拼完字节码，JVM 用了一个后门工具：Unsafe，直接把这个字节数组加载成了一个真正的 Class 对象：

1
Unsafe unsafe = Unsafe.getUnsafe();
2
Class<?> lambdaClass = unsafe.defineClass(
3
    name, classBytes, 0, classBytes.length,
4
    callerLoader, callerDomain
5
);

这一步走完，一个全新的类就诞生了！它只存在于 JVM 内存中，磁盘上永远找不到它。

第 5 步：创建实例，返回给你#

最后，JVM 创建这个类的实例，赋值给你的add变量：

1
Calculator add = (Calculator) lambdaClass.newInstance();

整个流程走完，你的代码就可以正常运行了。

五、灵魂拷问：为什么要绕这么大一圈？#

看到这里你肯定会问： 这也太麻烦了吧！直接调用lambda$main$0(10,5)不行吗？为什么非要搞个代理类？

答案很简单：Java 的语法规则不允许！

你写的代码是：

1
Calculator add = (a, b) -> a + b;

左边是一个接口类型的变量！

Java 的语法规定死了：接口类型的变量，必须存放一个「实现了该接口的对象」！

你不能直接把一个静态方法塞给接口变量！这在 Java 里是非法的！

打个比方：你有一个三孔插座（Calculator 接口），你手里有一个裸的电线头（lambda $main$ 0 静态方法）。线头不能直接插进插座，你必须给它装一个三孔插头（代理类）。这个插头啥也不干，就是把线头的电导出来而已。

这就是代理类的全部意义：把静态方法，包装成接口要求的对象格式。

六、打破误区：Lambda 真的是匿名内部类的语法糖吗？#

90% 的 Java 开发者都搞错了这个问题！

很多人说：“Lambda 不就是匿名内部类的语法糖吗？少写了点代码而已。”

大错特错！两者的实现机制天差地别！

对比项	匿名内部类	Lambda 表达式
编译期	生成独立的`.class`文件，写到磁盘	不生成新文件，Lambda 逻辑藏在宿主类里
类加载	类加载时就加载匿名类，每个 Lambda 一个类	第一次调用时才动态生成代理类，可复用
内存占用	每个匿名类都是独立的类，容易类膨胀	代理类极轻量，只有一个转发方法
性能	加载慢，调用有额外开销	加载快，JIT 更容易优化

Lambda不是匿名内部类的语法糖！它是一套全新的、基于invokedynamic的动态实现机制！

七、动手验证：亲眼看看那个内存里的代理类#

你肯定想问：“你说的那个内存里的代理类，我能看到吗？”

当然可以！JDK 早就给你留了后门！

加一个 JVM 启动参数，就能把 Lambda 生成的代理类 dump 到磁盘上：

1
-Djdk.internal.lambda.dumpProxyClasses=/tmp/lambda-dump

运行你的程序，然后去/tmp/lambda\-dump目录下，你会找到一个文件：

1
LambdaWithParamsDemo$$Lambda$1.class

反编译它，你会看到：

1
final class LambdaWithParamsDemo$$Lambda$1 implements Calculator {
2
    private LambdaWithParamsDemo$$Lambda$1() {}
3

4
    public int calculate(int a, int b) {
5
        return LambdaWithParamsDemo.lambda$main$0(a, b);
6
    }
7
}

没错！这就是我们之前说的那个极简代理类！它真的就只有这几行代码！没有任何多余的东西！

八、总结：Lambda 的完整生命周期#

到这里，整个 Lambda 的运行流程你就彻底懂了，我们来串一遍：

你写代码：Calculator add = (a,b)->a+b;
编译期：编译器把 Lambda 编译成宿主类的私有静态方法lambda$main$0，同时生成invokedynamic指令
运行期第一次调用：
- JVM 触发LambdaMetafactory
- 用 ASM 在内存拼出代理类字节码
- 用 Unsafe 加载成 Class
- 创建代理实例，赋值给add
后续调用：add.calculate(10,5) → 代理类转发调用lambda$main$0 → 得到结果

这就是为什么你最开始反编译会看到一个 “空类”—— 因为你看到的只是那个接口，真正的实现类，藏在内存里，你看不到而已。

最后#

Java 的 Lambda，看起来只是一个小小的语法糖，背后却是 JDK 团队花了好几年搞出来的invokedynamic动态调用机制。

它解决了匿名内部类的类膨胀问题，带来了更好的性能，也为 Java 支持函数式编程打下了基础。

下次你再写 Lambda 的时候，不妨想想背后这一套黑魔法，是不是瞬间觉得这行代码厚重了起来？

拓展：invokedynamic不止是 Lambda 用，它还是 Java 支持动态语言的基石，Groovy、Kotlin 这些 JVM 语言，都在靠它实现动态调用。

你也可以动手试试：写个 Lambda，加个 dump 参数，亲眼看看那个内存里的代理类！

九、拓展：变量捕获的底层秘密#

之前我们讲的都是无状态的 Lambda—— 也就是没有捕获外部变量的情况。那如果 Lambda 捕获了外部变量，底层会有什么不一样？

这也是很多人搞不懂的 “变量捕获” 的核心问题，我们同样扒开底层来看。

先看一段捕获变量的代码#

比如我们写一段带捕获的 Lambda：

1
public static void main(String[] args) {
2
    int base = 10; // 捕获这个外部变量
3
    Calculator add = (a, b) -> a + b + base;
4
    System.out.println(add.calculate(1, 2)); // 输出 1+2+10=13
5
}

这里的base就是 Lambda 捕获的外部变量，这时候 Lambda 的底层逻辑，就和之前的无捕获版本完全不一样了。

1. 编译期：捕获的变量变成了方法参数#

我们再用javap反编译，这次你会发现，那个 lambda 方法变了：

1
private static int lambda$main$0(int base, int a, int b);
2
    Code:
3
       0: iload_1  // 加载参数a
4
       1: iload_2  // 加载参数b
5
       2: iadd     // 执行 a + b
6
       3: iload_0  // 加载捕获的base
7
       4: iadd     // 执行 + base
8
       5: ireturn

哦！原来的 lambda 方法只有 2 个参数，现在变成了 3 个！ 编译器把你捕获的变量，偷偷加到了 lambda 方法的参数列表最前面！

2. 运行期：代理类多了字段，用来存捕获的变量#

这时候动态生成的代理类，也不再是无状态的了，它会把捕获的变量存到自己的字段里。我们用 dump 参数把它导出来，会看到：

1
final class LambdaWithParamsDemo$$Lambda$1 implements Calculator {
2
    // 多了一个字段，专门用来存捕获的base
3
    private final int arg$1;
4

5
    // 构造方法也多了参数，用来接收捕获的变量
6
    private LambdaWithParamsDemo$$Lambda$1(int arg$1) {
7
        this.arg$1 = arg$1;
8
    }
9

10
    @Override
11
    public int calculate(int a, int b) {
12
        // 调用lambda方法的时候，把存好的捕获值传进去！
13
        return LambdaWithParamsDemo.lambda$main$0(this.arg$1, a, b);
14
    }
15
}

这就是和无捕获 Lambda 的核心区别：

类型	代理类特征	实例特征
无捕获 Lambda	空构造、无字段	全局单例，永久复用
有捕获 Lambda	带参构造、有字段存捕获值	每次创建 Lambda 都会 new 新实例

3. 灵魂拷问：为什么捕获变量必须是 final 的？#

你肯定遇到过这个经典报错：

从 lambda 表达式引用的本地变量必须是最终变量或实际上的最终变量

这到底是为什么？

答案很简单：Lambda 是值捕获，不是引用捕获！

Lambda 捕获的不是变量本身，而是变量在创建 Lambda 那一刻的值拷贝！

也就是说：

1
int base = 10;
2
Calculator add = (a, b) -> a + b + base;
3
base = 20; // 你改了外部的base变量
4
System.out.println(add.calculate(1,2));
5
// 输出的还是13！不是23！

Lambda 里的 base，永远是创建 Lambda 那一刻的 10，不管你之后怎么改外部的 base，它都不会变！

Java 怕你搞混了，以为 Lambda 里的 base 会跟着外部变量同步变化，所以直接加了个限制： 你不能改外部的这个变量！这样就不会有误解了！

这就是为什么要求变量必须是final或者effectively final（事实上的 final，也就是你没写 final 但是也没改它）。

4. 误区：为什么我能修改捕获的对象的内容？#

很多人会问：

那为什么我捕获一个 List，就能往里面加元素？不是说不能改吗？

1
List<Integer> list = new ArrayList<>();
2
Consumer<Integer> c = i -> list.add(i);
3
c.accept(1); // 完全没问题！

答案还是：值捕获！

你捕获的list变量，是一个对象引用，拷贝的是这个引用的值（也就是对象的内存地址）。

你不能改list这个引用本身（比如list = new ArrayList<>()），因为那会改变变量的值，违反 effectively final
但是你可以改引用指向的对象的内容（比如list.add()），因为这没改引用本身，只是改了对象里的东西！

这就是为什么对象的内容可以改，但是变量引用不能改的原因。