Linux中的零拷贝技术

如题所述

举报该问题

其他回答

第1个回答 2022-07-22

参考文章：浅析Linux中的零拷贝技术

内核和用户空间，共享内存。数据copy到内核区后，只需要把地址共享给应用程序即可，无需再copy一次数据到用户空间。

优点：

缺点：

应用：
kafka生产者发送消息到broker的时候，broker的网络接收到数据后，copy到broker的内核空间。然后通过mmap技术，broker会修改消息头，添加一些元数据。所以，写入数据很快。当然顺序IO也是关键技术

内核直接发送数据到socket，无需用户空间参与。

优点：

缺点：

为了节省内核里面的一次copy，我们可以使用优化过的sendfile。该系统方法需要由特定的硬件来支持，并不是所有系统都支持。如下：

sendfile的时候，直接把内核空间的地址传递给socket缓存，DMA直接从指定地址读取数据到流里面。

sendfile只适用于将数据从文件拷贝到套接字上，限定了它的使用范围。Linux在2.6.17版本引入splice系统调用，用于在两个文件描述符中移动数据。

splice调用在两个文件描述符之间移动数据，而不需要数据在内核空间和用户空间来回拷贝。他从fd_in拷贝len长度的数据到fd_out，但是有一方必须是管道设备，这也是目前splice的一些局限性。flags参数有以下几种取值：

splice调用利用了Linux提出的管道缓冲区机制，所以至少一个描述符要为管道。

以上几种零拷贝技术都是减少数据在用户空间和内核空间拷贝技术实现的，但是有些时候，数据必须在用户空间和内核空间之间拷贝。这时候，我们只能针对数据在用户空间和内核空间拷贝的时机上下功夫了。Linux通常利用写时复制(copy on write)来减少系统开销，这个技术又时常称作COW。

摘录网上：
传统的fork()系统调用直接把所有的资源复制给新创建的进程。这种实现过于简单并且效率低下，因为它拷贝的数据也许并不共享，更糟的情况是，如果新进程打算立即执行一个新的映像，那么所有的拷贝都将前功尽弃。Linux的fork()使用写时拷贝（copy-on-write）页实现。写时拷贝是一种可以推迟甚至免除拷贝数据的技术。内核此时并不复制整个进程地址空间，而是让父进程和子进程共享同一个拷贝。只有在需要写入的时候，数据才会被复制，从而使各个进程拥有各自的拷贝。也就是说，资源的复制只有在需要写入的时候才进行，在此之前，只是以只读方式共享。这种技术使地址空间上的页的拷贝被推迟到实际发生写入的时候。在页根本不会被写入的情况下—举例来说，fork()后立即调用exec()—它们就无需复制了。fork()的实际开销就是复制父进程的页表以及给子进程创建惟一的进程描述符。在一般情况下，进程创建后都会马上运行一个可执行的文件，这种优化可以避免拷贝大量根本就不会被使用的数据（地址空间里常常包含数十兆的数据）。由于Unix强调进程快速执行的能力，所以这个优化是很重要的。这里补充一点：Linux COW与exec没有必然联系。

我总结下： copy-on-write技术其实是一种延迟复制的技术，只有需要用(写)的时候，才去复制数据。

相似回答

linux下零拷贝技术介绍答：该零拷贝技术侧重于灵活的处理数据在用户进程中的缓冲区和操作系统的页缓冲区之间的拷贝操作。这种方式延续了传统的通信方式,但是更加灵活。linux中该方法主要利用写时复制技术。写时复制是计算机编程中常见的一种优化策略,基本思想是这样的:如果多个应用程序需要同时访问一块数据,那么可以为这些应用程序分配指向这块数据...

一文读懂零拷贝技术|splice使用答：深入探索零拷贝技术：splice系统调用的应用当服务器需要将文件内容传输到客户端连接时，传统的做法是通过一系列系统调用来实现。通常，服务端首先会调用 read() 读取文件，然后通过 write() 或 send() 将数据传递给客户端。然而，这种流程涉及多次数据拷贝，效率并非最优。从内核到用户态：零拷贝的挑战...

零拷贝Zero-copy技术详解答：基于上面两点优化，实现了这些零拷贝技术： mmap+write、sendfile、sendfile+DMA收集、splice等。mmap即memory map，也就是内存映射。我在 mmap的使用一文中详细介绍了mmap的用法、特点、注意事项等信息，感兴趣的同学可以去看看。mmap+write流程：小结：不管是ready+write还是mmap+write，都是使用两个接口...

一文搞懂什么是零拷贝答：零拷贝的实现方式sendfile: 在网络传输中，sendfile利用DMA技术，通过传递文件描述符而非数据，直接在内核和用户空间间传输，尤其在高性能网络场景中效果显著。mmap: Linux的mmap机制将文件映射到进程地址空间，用户空间和内核缓冲区共享同一地址，减少了CPU拷贝次数，对大文件传输特别有利，但需注意小文件和...

什么是零拷贝答：零拷贝描述的是客户端与服务器之间数据传输过程中，需要拷贝的问题客户端普通拷贝：用户发起指令给内核，内核拷贝磁盘的文件到内核缓冲区，然后由内核缓冲区拷贝到用户缓冲区，然后再由用户缓冲区拷贝到内核缓冲区，内核缓冲区通过网络发送到服务器，经过三次拷贝零拷贝：直接通过内核空间不经过用户空间...

Linux中的零拷贝技术,sendfile,splice和tee之间的区别是什么_百度知 ...答：1.sendfile用于两个fd之间零拷贝 2.splice类似sendfile但是两个fd之中至少有一个是pipe 3.tee类似splice但是两个fd都必须是管道，而且tee不消耗输入fd的数据 4.另外还有些参数使用上的区别

MMAP和零拷贝答：系统调用命令： mmap() 。使得进程之间通过映射同一个普通文件实现共享内存。普通文件被映射到进程地址空间后，进程可以像访问普通内存一样对文件进行访问，不必再调用read()，write() 等操作。零拷贝技术 是另一个系统调用，Linux 中如 sendfile 命令。它减少了内存中用户空间与内核空间数据的拷贝...

零拷贝技术答：但当前还没有达到零拷贝，如果底层网卡支持收集操作，可以进一步减少内核重复拷贝数据的操作。在 Linux 内核 2.4 及更高版本中，套接字缓冲区描述符支持该场景。Kafka 和 Nginx 都有实现零拷贝技术，这将大大提高文件传输的性能。拷贝技术，本质上讲就是通过减少非必要的内存拷贝以及上下文切换，来提高...

linux物理网卡不发包答：1、虚拟机网卡不通：在主机与虚拟机之间存在iperf通信，导致虚拟机网卡不通。2、前端环满：domU虚拟网卡对外发包使用的是零拷贝机制，报文在转发时不做数据拷贝，使用domU中的内存，在报文通过协议栈发给iperf服务端处理时，iperf未对报文处理，导致vring环上的buffer无法释放，vring环处于满的状态，后续的...

大家正在搜

nginx零拷贝 linux零拷贝零拷贝技术 Linux技术 nio零拷贝零拷贝的原理 linux 存储开发技术 aio是零拷贝吗 tx2内存零拷贝