当前位置：首页 > news >正文

Java面试34-Kafka的零拷贝原理

news 2025/4/30 14:12:14

在实际应用中，如果我们需要把磁盘中的某个文件内容发送到远程服务器上，那么它必须要经过几个拷贝的过程：

从磁盘中读取目标文件内容拷贝到内核缓冲区
CPU控制器再把内核缓冲区的数据复制到用户空间的缓冲区
在应用程序中，调用write()方法，把用户空间缓冲区中的数据拷贝到内核下的Socket Buffer中。
最后，把在内核模式下的Socket Buffer中的数据复制到网卡缓冲区（NIC Buffer），网卡缓冲区再把数据传输到目标服务器上。

在这个过程中可以发现，数据从磁盘到最终发送出去，要经历4次拷贝，而在这四次拷贝过程中，有两次拷贝是浪费的，分别是：从内核空间复制到用户空间和从用户空间再次复制到内核空间。除此之外，由于用户空间和内核空间的切换会带来CPU的上下文切换，对于CPU性能也会造成性能影响。

零拷贝，就是把这两次多余的拷贝省略掉，应用程序可以直接把磁盘中的数据从内核中直接传输给Socket，而不需要再经过应用程序所在的用户空间。零拷贝通过DMA（Direct Memory Access）技术把文件内容复制到内核空间中的Read Buffer，接着把包含数据位置和长度信息的文件描述符加载到Socket Buffer中，DMA引擎直接可以把数据从内核空间中传递给网卡设备。在这个流程中，数据只经历了两次拷贝就发送到了网卡中，并且减少了两次CPU的上下文切换，对于效率有非常大的提高。
所谓零拷贝，并不是完全没有数据复制，只是相对于用户空间来说，不再需要进行数据拷贝。对于前面说的整个流程来说，零拷贝只是减少了不必要的拷贝次数而已。在程序中实现零拷贝的方法有：