求shell脚本,删除一个a.txt文档中 完全包含 另外一个b.txt文档的行。

根据第二个文档,删除第一文档中 完全包含 另外第二个文档的行。
第一个文档的格式是“哈尔滨+tab符号+数字”。
希望的结果是:

求大神解答。

cat b.txt| xargs -I {} sed -i '/\<{}\>/d' a.txt

直接修改a.txt的话,那么可以按以上命令.命令解释一下:

显示b.txt,并重定向给xargs,xargs将每行锁定,然后每行执行删除匹配该字的行.

{}锁定的一行(一行一字), \<匹配字的开始, \>匹配字的结尾, d删除匹配行, i直接修改文件

缺点是直接将a.txt修改了.

如果不需要修改的话,那么就可以参考楼下的命令

grep -v -w "\<`cat b.txt`\>" a.txt

命令解释一下:

在a.txt中搜索不匹配cat 命令逐行(一字一行)显示的行.

-v 表示不匹配的, -w 按字匹配, \<匹配字的开始, \>匹配字的结尾

温馨提示:答案为网友推荐,仅供参考
第1个回答  2013-09-23

用这条命令应该能达到你的目的,你试试

grep -v -w "\<`cat b.txt`\>" a.txt


另外,你的b.txt里meiy哈尔滨,所以a.txt中的'哈尔滨    3'应该不会被删除。

追问

这个貌似不能完全匹配吧 ?
数据多的时候。输入 “北”"哈尔"
这样的话,也会过滤掉 "北京"“哈尔滨”"哈尔滨香坊"这样的

追答

上面已经给你解释了 -w就是精确匹配的意思。 \< \>是限定单词开头结尾的意思。

没有效果是因为匹配的是中文,匹配中文对字符编码格式有些要求。


你的字符编码是en_US.UTF-8吗?可以用locale看一下。

grep不行还是用上面的方法吧:

cat b.txt| xargs -I {} sed -i '/\<{}\>/d' a.txt

第2个回答  2013-09-22
#! /bin/sh

while read LINE
do
grep -v ${LINE} a.txt > a.txt
done < b.txt
相似回答