最近学shell,在awk里,在语句的什么位置用正则表达式?例如 awk ✀BEGIN {FS=";" $4~⼀root⼀}✀ testfile

2025-05-18 00:44:11
推荐回答(2个)
回答(1):

awk中使用正则大致就下面三种形式。


形式一(跟你给出的类似):

awk '/正则/{主体处理}' file

默认匹配$0,相当于  $0~/正则/

正则匹配后默认会打印匹配到的内容,所以若主体语句仅仅是print,可直接省略。

  

形式二:

awk '{if($4~/root/) print}' file

在主体语句的if判断里使用正则。

 

形式三:

awk '{内置字符串处理函数}' file

在awk内置的字符串处理函数中使用正则,如sub, gsub, gensub, match等。

echo "ABC^H^H^H^HDEF" | awk '{gsub(/\^H/,"");print $0}'

将所有^H替换为空,输出替换后的字符串。

这里gsub中省略了第三个参数“源字符串”,默认使用$0来匹配。

 

------------------------------------------------------- 

大部分情况下,正则都是跟主体语句相关的,所以这里抛开awk的BEGIN和END语句块不看。

BEGIN语句块属于预处理,尚未读入要处理的数据,用不上正则;

END语句块属于后处理,可以用正则但少见,因为复杂的逻辑判断尽量都放在主体中完成。

回答(2):

假如你的例子 $4~/root/ (代表 第4列匹配 root)
你就可以加入正则表达式了。。/ xxx / 在匹配内容中用正则表达式代表匹配的内容