Chan93

sed作为一个流处理器，在命令行里面必须拥有一袭地位。这个古老却很有魅力的工具拥有着巨大的可能，同时拥有正则的加持，更加是如虎添翼。本文整理了一些大部分的sed的用法。其他可以查看 [sed 单行脚本快速参考]

重定向

这个重定向和shell脚本中的不一样，并不是使用>>标志，而是直接通过w命令。

sed 'w output.txt' source.txt
sed -n '/xxx/,$ w output.txt' source.txt

注意一般是使用-i选项来强制将原文件修改掉，不要使用shell的重定向来定向到原文件中。

替换命令

s可以说是最常用的命令了，不过s可以接很多个flag来帮助更好的完成任务，其中有一个e。它的作用是当有替换发生时，会将shell命令放到pattern space中，然后会被执行，执行之后的结果会继续被放到pattern space中。比如:

$ cat file.txt
a.txt
b.txt
$ sed 's/^/ls -l /e' file.txt
-rw-r--r-- 1 root root 1627 Oct 14 14:30 a.txt
-rw-r--r-- 1 root root 807 Oct 14 14:30 b.txt

转换字符

大多数时候我们可以使用替换命令来实现，但是有y这个命令我们就可以这样做：

$ cat source.txt
It is a Big dog
$ sed 'y/IB/ib/' source.txt
it is a big dog

替换对应位置上的字符。

分组

使用()进行匹配，使用\1 \2等来引用：

$ echo "aaa:bbb:ccc" | sed 's/\(.*\):\(.*\)/\2:\1/'
ccc:aaa:bbb

默认 sed 是贪婪匹配的，所以会一次性匹配到第二个冒号。这边有两个分组，所以可以用\1 \2来引用，上面的命令中将其调换了位置。sed 是不支持非贪婪模式的，如果非要实现非贪婪则需要结合实际情况 trick 一下。此外大多时候推荐使用 perl 来做，但是 perl 用的人也不是很多。Google it！

匹配 HTML 标签

HTML/XML 的标签都有一定的规律，都是包裹在<>之中。可以使用如下的方式操作：

$ sed 's/\(<[^>]*>\).*//' test.html   # 匹配出前面的 html 标签
$ sed -n 's/<[^>]*>//gp' test.html  # 获取最内部的标签的内容

去除空行

当我们期望去除文件中的空行，可以有如下的几个方式

## 去除所有的空行，包括当前行里面有空白字符的情形。
$ sed '/^[[:space:]]*$/d' filename

## 适用于 GNU Sed 的场景下
$ sed '/^\s*$/d' filename
$ sed -n '/^\s*$/!p' filename

#重定向

#替换命令

#转换字符

#分组

#匹配 HTML 标签

#去除空行

重定向

替换命令

转换字符

分组

匹配 HTML 标签

去除空行