Linux基本操作10-----正则表达式与文件格式化处理

如题所述

第1个回答  2019-10-11

正则表达式
1
简单的说正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表达式通过一些特殊符号的辅助,可以让用户轻易的达到查找,删除,替换某特定字符串的处理程序
2
grep在数据中查找一个字符串时,是以整行为单位来进行数据的选取的,也就是说假如一个文件内有10行,那么其中两行是有用的,那么就将这两行显示出来,其它的丢弃
3
在bash当中,我们知道通配符*可以用来表示任意个字符,但是正则表达式中的*表示不同的含义
在正则表达式中,'.'表示的是一定有一个任意字符的意思
在正则表达式中,'*'表示的是重复前一个字符0到无穷多次的意思
4
基础的正则表达式
RE字符
意义
^word
查找行首为word的行
word$
查找结尾为word的行
.
代表一定有一个任意的字符
*
重复前一个字符0个到无穷多个
[list]
从字符集合里面选择一个字符
[n1-n2]
从要选择的范围里面选择一个字符
[^list]
从不是这个字符集合里面找出一个字符
/{n,m/}
连续n到m个的前一个字符,/{n/}则是连续n个前一个字符,/{n,/}则是联系n到无穷多个前一个字符

sed
工具
1
sed本省是一个管道命令,可以分析标转输入,而且sed还可以将数据进行替换,删除,新增,选取特定行等功能
2
sed的用法
sed
[-nefr]
[动作]
-n
使用安静模式,在一般模式中,所有来自stdin的数据一般都会被列出到屏幕上,但是如果加上-n这个参数的话,则只有经过sed特殊处理的那一行才会被列出
-e
直接在命令模式上进行sed的动作编辑
-f
直接将sed的动作写在一个文件内,-f
filename则可以执行filename内的sed动作
-r
sed的动作支持的是扩展正则表达式的语法
-i
直接修改文件的内容,而不是由屏幕输出
3
动作说明
n1,n2
function
n1,n2不见得会存在,一般代表的是进行的动作的行数
function有下面这些参数
a:
新增,a的后面可以接字符串,而这些字符串会在新的一行出现,目前的下一行
c:
替换,c的后面可以接字符串,这些字符串可以替换n1,n2之间的行
d:
删除,因为是删除,所以d后面通常不接任何参数
i:
插入,i的后面可以接字符串,而这些字符串会在新的一行,目前的上一行
p:
打印,也就是将某个选择的数据打印出来
s:
替换,可以直接进行替换的工作

文件的格式化以及相关处理
1
格式化打印
printf
'打印内容‘
实际内容
关于C程序语言内,常见的变量格式
%ns
那个n是数字,s代表的是string
%nd
那个n是数字,d代表的是整数
%N.nf
那个n与N都是数字,f代表浮点数
2
文件比较工具diff
diff就是用在比较两个文件之间的区别,并且是行为单位来比较的,一般是用在ASCLL纯文本文件的比较上
diff的用法
diff
[-bBi]
from_file
to_file
-b
忽略一行当中仅有多个空白的区别
-B
忽略空白行的区别
-i
忽略大小写的不同
3
如果我们要将旧的文件升级成为新的文件时,我们可以先利用diff比较出文件的区别,并将区别文件制作成为补丁文件,再由补丁文件更新旧文件即可。
一般来说我们使用diff制作出来的比较文件通常扩展名为.patch
更新:patch
-pN
<
patch_file
还原:patch
-R
-pN
<
patch_file
相似回答