管道 (Unix)

在类Unix 操作系统（以及一些其他借用了这个设计的操作系统，如Windows）中，管道（英语：Pipeline）是一系列将标准输入输出链接起来的进程，其中每一个进程的输出被直接作为下一个进程的输入。每一个链接都由匿名管道实现^{[来源请求]}。管道中的组成元素也被称作过滤程序（英语：Filter_(software)）。

这个概念是由道格拉斯·麦克罗伊为Unix 命令行发明的，因与物理上的管道相似而得名。

例子

简单样例

ls -l | less

在这个例子中，ls用于在Unix下列出目录内容，less是一个有搜索功能的交互式的文本分页器（英语：Terminal pager）。这个管线使得用户可以在列出的目录内容比屏幕长时目录上下翻页。

以less结束的管道（或more，这是个相似的标签页工具）是最常被使用的。这让用户可以阅览尚未显示的大量文字（受可用缓存限制，控制台的屏幕大小、屏幕缓存大小往往有限，不足以一次先输出所有输出内容，也不能自由滚动内容），若少了这工具则这些文字将会卷过终端而无法阅读到。换句话说，他们将程序员从为自己的软件开发分页器的负担中解放了出来：他们只需要把他们的输出用过“管道”导入到less程序中即可，甚至也可以完全不顾分页问题，去假定他们的用户会在需要将输出分页的时候自己去这样做。

复杂样例

以下是一个流水线的示例，执行由一URL标示的万维网资源的一种拼写检查器。之后是关于这个其作用的说明。注意“\”是用来把这六行转为一个命令行。

curl "https://en.wikipedia.org/wiki/Pipeline_(Unix)" | \
sed 's/[^a-zA-Z ]/ /g' | \
tr 'A-Z ' 'a-z\n' | \
grep '[a-z]' | \
sort -u | \
comm -23 - /usr/share/dict/words | \
less

curl 获取该网页的HTML内容（在有些系统上可以使用wget）。
sed 移除非空格的字符和网页内容的字母，并以空格取代之。
tr 把大写字母改成小写字母，并把行列里的空格换成新行（每个词现在各占有独立的一行）。
grep 过滤得到那些至少有一个小写字母的行（删除空行）。
sort（英语：Sort_(Unix)） 将“单词”（也就是每一个行）按照字母顺序排序，并且通过命令行的-u参数来删除重复的行。
comm（英语：comm） 查找两个文件中的共同行，-23过滤掉只有第二个文件拥有的行、两个文件共有的行，仅仅留下只在第一个文件中有的行。在文件名的位置上的-参数表示要求comm使用标准输入（在这个例子里，他的标准输入来自于管道上游的标准输出）作为输入，而不是以普通文件作为输入。最终得到一串没有出现在/usr/share/dict/words之中的“单词”（也就是一行）。
less 允许用户翻页浏览结果。

这个特殊的“|”字符告诉命令行解释器（Shell）将前一个命令的输出通过“管道”导入到接下来的一行命令作为输入。也就是说，curl命令的输出被作为sed命令的输入，后面的命令也是这样。

命令行界面中的管线

所有广泛应用于UNIX和Windows中的shell程序都有特殊的语法构建管线。典型语法是使用ASCII中的垂直线“|”（正是由于这个原因，这个符号常被称为管道符）。当出现这样的语法时shell会启动各个进程，并调整各个进程的标准流之间的连接（还包括安排一些缓存）。

错误流

通常，管线中的进程的标准错误流("stderr")不会通过管道传输；它们被合并输出到控制台。然而，很多Shell提供一些扩充的语法去改变这一行为。比如在csh Shell和bash中，使用“|&”代替“|”来表示错误流也需要被合并进入标准输出，并传递给下一个进程。Bourne shell也可以合并错误流，通过 2>&1 也可以将错误流重定向到一个不同的文件。

Pipemill

在一些常用的简单管线中，shell仅仅只是用管道来连接每个子进程，然后在子进程中执行外部命令。因此shell本身没有通过管线来处理数据。

然而，shell也有可能直接处理管线数据。构建这样的语法像这样：

command | while read var1 var2 ...; do
   # process each line, using variables as parsed into $var1, $var2, etc
   # (note that this is a subshell: var1, var2 etc will not be available
   # after the while loop terminates)
   done

... 这样的语法叫 "pipemill" 。

在程序中创造管道

匿名管道

使用C语言在UNIX中使用pipe(2)系统调用时，这个函数会让系统构建一个匿名管道，这样在进程中就打开了两个新的，打开的文件描述符：一个只读端和一个只写端。管道的两端是两个普通的，匿名的文件描述符，这就让其他进程无法连接该管道。为了避免死锁并利用进程的并行运行的好处，有一个或多个管道的UNIX进程通常会调用fork(2)产生新进程。并且每个子进程在开始读或写管道之前都会关掉不会用到的管道端。或者进程会产生一个子线程并使用管道来让线程进行数据交换。实现代码：

 
#include <sys/wait.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>

int
main(int argc, char *argv[])
{
  int pipefd[2];
  pid_t cpid;
  char buf;

  if (argc != 2) {
    fprintf(stderr, "Usage: %s <string>\n", argv[0]);
    exit(EXIT_FAILURE);
  }

  if (pipe(pipefd) == -1) {
    perror("pipe");
    exit(EXIT_FAILURE);
  }

  cpid = fork();
  if (cpid == -1) {
    perror("fork");
    exit(EXIT_FAILURE);
  }

  if (cpid == 0) {    /* Child reads from pipe */
    close(pipefd[1]);          /* Close unused write end */
    while (read(pipefd[0], &buf, 1) > 0)
      write(STDOUT_FILENO, &buf, 1);

    write(STDOUT_FILENO, "\n", 1);
    close(pipefd[0]);
    _exit(EXIT_SUCCESS);

  } else {            /* Parent writes argv[1] to pipe */
    close(pipefd[0]);          /* Close unused read end */
    write(pipefd[1], argv[1], strlen(argv[1]));
    close(pipefd[1]);          /* Reader will see EOF */
    wait(NULL);                /* Wait for child */
    exit(EXIT_SUCCESS);
  }
}

具名管道

具名管道可以通过调用mkfifo(2)或mknod(2)来构建，当被调用时表现为输入或输出的文件。这样可以允许建立多个管道，并且将其同标准错误重定向或tee结合起来使用更为有效。实现代码：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h> 
#include <sys/stat.h> 
#include <fcntl.h>
#include <unistd.h>

int main(int argc, char *argv[]) {
  char filename[] = "test_fifo";
  if (!mkfifo(filename,S_IRUSR | S_IWUSR| S_IRGRP|S_IWGRP)){
    pid_t pid = fork();
    if (pid == 0){	//child
      int fd = open(filename, O_WRONLY);
      if (fd < 0)
	perror("child open()");
      else{
	if (strlen(argv[1]) != write(fd, argv[1], strlen(argv[1])))
	  perror("child write error");
	else
	  close(fd);
      }
    }
    else if (pid > 0){	//father
      int fd = open(filename, O_RDONLY);
      if (fd < 0)
	perror("father open()");
      else{
	char buffer[200];
	int readed = read(fd, buffer, 199);
	close(fd);
	buffer[readed] = '\0';
	printf("%s\n",buffer);
      }
    }
    else
      perror("fork()");
  }
  else
    perror("mkfifo() error:");
}

以上代码在编译后运行时给出一个参数，子进程会将该参数内容写入管道（该管道在当前目录下，文件名为“test_fifo”），父进程从管道中读取内容并显示出来

实现

在大多数类UNIX操作系统中，管线上的所有进程同时启动，输入输出流也已经被正确地连接，并且这些进程被调度程序所管理。最为重要的一点就是，所有的UNIX管道和其他管道实现不一样的地方就是缓存的概念：输出进程可能会以每秒5000 byte的速度输出，但是接收进程也许每秒只能接收100 byte，但不会有数据丢失。原因就是管道上游的进程的所有输出都会被放入一个队列中。当下游进程开始接收数据时，操作系统就会将数据从队列传至接收进程，并将传完的数据从队列中移除。当缓存队列空间不足时，上游进程会被终止，直到接收进程读取数据为上游进程腾出空间。在Linux中，缓存队列的大小是65536 byte。

网络管线

根据Unix哲学——“一切都是文件”，netcat和socat这样的工具可以将管道连接到TCP/IP套接字。

历史

管道的概念以及垂直线的记号(|)都是由道格拉斯·麦克罗伊发明的，他是早期命令行外壳的作者。他发现他常常将一个程序的输出作为另一个程序的输入，于是便发明了“管道。它的想法在1973年被实现，Ken Thompson将管道添加到了UNIX操作系统。^[1]这个点子最终被移植到了其他的操作系统，比如DOS、OS/2、Microsoft Windows和BeOS，而且常常使用相同的记号(垂直线)。

虽然管道概念是独立发展的，但是 Unix 管道相似于、也确实晚于由Ken Lochner在20世纪60年代为Dartmouth Time Sharing System（英语：Dartmouth Time Sharing System）开发的'communication files'。^[2]^[3]

在苹果 Automator（类似管道一样将多个重复的命令链接起来）的那个机器人拿着一根管子的图标也是对于最初Unix管道概念的纪念。

其他操作系统

其他操作系统的这个特色源自于Unix，例如 Taos 和 MS-DOS，最终成为软件工程的管道与过滤器设计模式。

参见

匿名管道，一个用于进程间通信的 FIFO 架构。
GStreamer，一个基于管道的多媒体架构。
哈特曼管道（英语：Hartmann pipeline）
命名管道，用于进程间通信的持久性管道
流水线 (计算机)，与计算机相关的其他管线
管道 (软件)，软件管线的基本概念
重定向 (计算机)
tee，将管线内容取出的一个通用程序
XML管道（英语：XML pipeline），处理XML的管线

引用

^ http://www.linfo.org/pipe.html （页面存档备份，存于互联网档案馆） Pipes: A Brief Introduction by The Linux Information Project (LINFO)
^ 存档副本. [2010-08-14]. （原始内容存档于2021-02-25）.
^ 存档副本. [2010-08-14]. （原始内容存档于1999-02-20）.

Sal Soghoian on MacBreak Episode 3 "Enter the Automatrix"

外部链接

History of Unix pipe notation （页面存档备份，存于互联网档案馆）
- Doug McIlroy’s original 1964 memo （页面存档备份，存于互联网档案馆）, proposing the concept of a pipe for the first time
pipe: create an interprocess channel – 系统界面（System Interfaces）参考，单一UNIX®规范第7期，由国际开放标准组织发布
Pipes: A Brief Introduction （页面存档备份，存于互联网档案馆） by The Linux Information Project (LINFO)
Unix Pipes – powerful and elegant programming paradigm (Softpanorama) （页面存档备份，存于互联网档案馆）
Ad Hoc Data Analysis From The Unix Command Line at Wikibooks （页面存档备份，存于互联网档案馆） – Shows how to use pipelines composed of simple filters to do complex data analysis.
Use And Abuse Of Pipes With Audio Data （页面存档备份，存于互联网档案馆） – Gives an introduction to using and abusing pipes with netcat, nettee and fifos to play audio across a network.
stackoverflow.com （页面存档备份，存于互联网档案馆） – A Q&A about bash pipeline handling.

[1] ttp://www.linfo.org/pipe.html （页面存档备份，存于互联网档案馆） Pipes: A Brief Introduction by The Linux Information Project (LINFO)

[2] 存档副本. [2010-08-14]. （原始内容存档于2021-02-25）.

[3] 存档副本. [2010-08-14]. （原始内容存档于1999-02-20）.

[1]

[2]

[3]