当前位置: 首页 > news >正文

AWK报告生成器

.awk简介

  • 其名称得自于它的创始人阿尔佛雷德·艾侯( Alfred Aho) 、彼得·温伯格(Peter Weinberger) 和布莱恩·柯林(Brian Kernighan) 姓氏的首个字母
  • AWK是一个文本处理工具,LinuxUnix环境中现有的功能最强大的数据处理引擎之一
  • 现在默认linux系统下日常使用的是gawk
  • 这种编程及数据操作语言的最大功能取决于一个人所拥有的知识

.Awk工作原理

  • 逐行读取文本,默认以空格或tab键为分隔符进行分隔,将分隔所得的各个字段保存到内建变量中,并按模式或者条件执行编辑命令;
  • sed命令常用于一整行的处理,而awk比较倾向于将一行分成多个字段再进行处理;
  • awk信息的读入也是逐行读取的,执行结果可以通过print的功能将字段数据打印显示;
  • 在使用awk命令的过程中,可以使用逻辑操作符“&&”表示与、“||”表示或、表示非,还可以进行简单的数学运算如+-*/%^,分别表示加减乘除取余和乘方

.AWK的基本语法 

awk -F 分隔符 'BEGIN{ commands } pattern{ commands } END{ commands }'
[INPUTFILE…]

3.1.awk的输出

3.1.1.print

语法
print item1,item2,……
  • 各项目之间使用逗号隔开,而输出时则以空白字符分隔;
  • item可以是字符串,可以是变量
示例;
[root@haha shells]# awk 'BEGIN{print "hello\nnihao\nhi"}'
hello
nihao
hi
[root@haha shells]# awk 'BEGIN{print "hello","nihao","hi"}'
hello nihao hi
[root@haha shells]# awk 'BEGIN{NUM=1;print NUM}'
1
[root@haha shells]# awk 'BEGIN{NUM=1;print "NUM"}'
NUM
AWK 命令使用时
字符不加引号,字符表示变量
字符加引号,字符表示其本身

3.1.2.printf

语法:

printf("format\n", [arguments])
格式说明
format 是一个用来描述输出格式的字符串, format 格式的指示符都以 % 开头,后跟一个字符,如下:

 示例:

[root@lee ~]# vim testfile
1 easy lee linux
2 timinglee rhce LINUX
3 LEE red hat
打印字符 ASIC
[root@haha shells]# echo 1111 |awk '{printf "%c\n",$0}'
ї
打印十进制整数
[root@haha shells]# echo 3.1415926 |awk '{printf "%d\n",$0}'
3
显示科学计算数值
[root@haha shells]# echo 100 | awk '{printf "%e\n",$0}'
1.000000e+02
显示浮点数
[root@haha shells]# echo 3.1415926 |awk '{printf "%.3f\n",$0}'
3.142
显示科学计算浮点
[root@haha shells]# echo 0.0000000001 | awk '{printf "%G\n",$0}'
1E-10
显示无符号整数
[root@haha shells]# echo -1 | awk '{printf "%u\n",$0}'
18446744073709551615
打印文件第一列
[root@haha shells]# vim testfile
1 easy lee linux
2 timinglee rhce LINUX
3 LEE red hat[root@haha shells]# vim testfile
[root@haha shells]# awk '{print $1}' testfile 
1
2
3
打印文件 1~2
[root@haha shells]# awk '{printf "%s+%s=%s\n",$1,$2,$3}' testfile 
1+easy=lee
2+timinglee=rhce
3+LEE=red
打印百分号
[root@haha shells]# awk 'BEGIN{printf "3%%\n"}'
3%
修饰符
示例
[root@haha shells]# echo -e "1\n2\n3" |awk '{printf "%3d\n",$0}'123
[root@haha shells]# echo -e "1\n2\n3" |awk '{printf "%4d\n",$0}'123
[root@haha shells]# echo -e "1\n2\n3" |awk '{printf "%+d\n",$0}'
+1
+2
+3
[root@haha shells]# echo -e "1\n2\n3" |awk '{printf "%+3d\n",$0}'+1+2+3
[root@haha shells]# echo -e "1\n2\n3" |awk '{printf "%-d\n",$0}'
1
2
3
[root@haha shells]# echo -e "1\n2\n3" |awk '{printf "%+-d\n",$0}'
+1
+2
+3
输出重定向
语法:
printf items > output-file
print items >> output-file
print items | command
示例:
重定向
[root@haha shells]# echo -e "1\n2\n3" |awk '{printf "%+-d\n",$0 > "file"}'
[root@haha shells]# cat file
+1
+2
+3

追加

[root@haha shells]# echo -e "1\n2\n3" |awk '{printf "%+4d\n",$0 >> "file"}'
[root@haha shells]# cat file
+1
+2
+3+1+2+3

管道

[root@haha shells]# echo -e "1\n2\n3" |awk '{printf "%+4d\n",$0 | "wc -l"}'
3

.awk中的变量

4.1.awk中的内置变量

示例:

显示所有
[root@haha shells]# head -5 /etc/passwd > testfile
[root@haha shells]# awk '{print $0}' testfile 
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
显示指定列
[root@haha shells]# awk -F : '{print $1,$2}' testfile 
root x
bin x
daemon x
adm x
lp x
显示每行有几列
[root@haha shells]# awk -F : '{print NF}' testfile 
7
7
7
7
7
显示行号
[root@haha shells]# awk -F : '{print NR,$1,$2}' testfile 
1 root x
2 bin x
3 daemon x
4 adm x
5 lp x

显示被处理的文件名称

[root@haha shells]# awk -F : '{print FILENAME,$1,$2}' testfile 
testfile root x
testfile bin x
testfile daemon x
testfile adm x
testfile lp x
指定分隔符:
[root@haha shells]# awk 'BEGIN{FS=":"}{print FILENAME,$1,$2}' testfile 
testfile root x
testfile bin x
testfile daemon x
testfile adm x
testfile lp x
指定输出结果分隔符
[root@haha shells]# awk 'BEGIN{FS=":";OFS="@"}{print FILENAME,$1,$2}' testfile 
testfile@root@x
testfile@bin@x
testfile@daemon@x
testfile@adm@x
testfile@lp@x
记录分隔符
[root@haha shells]# echo -e "a\nb\nc" | awk -F : 'BEGIN{RS="a";ORS="aa"}{print $1}'
aa
b
c
引用 shell 中的变量
[root@haha shells]# export a=1
[root@haha shells]# awk 'BEGIN{print ENVIRON["a"]}'
1
用户自定义变量
[root@haha shells]# awk 'BEGIN{test="lee";print test}'
lee

.awk中的运算

5.1.基本运算符

示例

[root@haha ~]# awk 'BEGIN{a=2;b=3;print a+b,a-b,a*b,a/b,a^b,a%b}'
5 -1 6 0.666667 8 2

 5.2.赋值运算

[root@haha ~]# awk 'BEGIN{a=2;print a}'
[root@haha ~]# vim file
1
2
3
[root@haha ~]# awk '{a+=2;print a}' file
[root@haha ~]# awk '{a-=2;print a}' file
[root@haha ~]# awk '{a*=2;print a}' file
[root@haha ~]# awk '{a%=2;print a}' file

 5.3.条件运算

  • awk中的条件运算符只有一个,其语法如下: expression?value1:value2
  • 这是一个三目运算符,当表达式expression的值为真时,返回值为value1;否则,返回值为value2

示例

[root@haha shells]# cat file
3 6
4 10
5 8
[root@haha shells]# awk '{max=$1>$2?$1:$2;print NR,"max=",max}' file
1 max= 6
2 max= 10
3 max= 8

 5.4.逻辑运算符

awk 支持 3 种逻辑运算,分别为逻辑与、逻辑或和逻辑非

 示例

[root@haha shells]# awk 'BEGIN{if (2>4 && 4>3) print "yes"}'
[root@haha shells]# awk 'BEGIN{if (2>4 || 4>3) print "yes"}'
yes
[root@haha shells]# awk 'BEGIN{if (!(2<4)) print "yes"}'
[root@haha shells]# awk 'BEGIN{if (!(2>4)) print "yes"}'
yes

5.5 关系运算

示例 

[root@haha shells]# head -5 /etc/passwd > passwd
[root@haha shells]# cat passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
[root@haha shells]# awk -F : '$7~/bash/{print $0}' passwd
root:x:0:0:root:/root:/bin/bash
[root@haha shells]# awk -F : '$6!~/home/&&$7~/bash/{print $0}' passwd
root:x:0:0:root:/root:/bin/bash
[root@haha shells]# awk -F : '$3=="1"{print $0}' passwd
bin:x:1:1:bin:/bin:/sbin/nologin
[root@haha shells]# awk -F : '$3!="1"&&/bash/{print $0}' passwd
root:x:0:0:root:/root:/bin/bash
[root@haha shells]# awk -F : '$3 <= 10 {print $0}' passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

.awk中的模式

  • awk中,匹配模式处于非常重要的地位,它决定着匹配模式后面的操作会影响到哪些文本行
  • awk中的匹配模式主要包括
                                关系表达式
                                正则表达式
                                混合模式
                                BEGIN 模式
                                END 模式等

 6.1 awk的关系模式

awk 提供了许多关系运算符, awk 允许用户使用关系表达式作为匹配模式,当某个文本行满足关系表达式时,将会执行相应的操作
[root@haha shells]# cat file 
liming 80
wangmei 70
zhangsan 90
lisi 81
[root@haha shells]# awk '$2>80 {print $0}' file
zhangsan 90
lisi 81

6.2 正则表达式

awk 支持以正则表达式作为匹配模式
用户需要将正则表达式放在两条斜线之间
其基本语法如下: /regular_expression/
[root@haha shells]# awk '/^l/{print $0}' file
liming 80
lisi 81
[root@haha shells]# awk '/^l|z/{print $0}' file
liming 80
zhangsan 90
lisi 81

6.3 混合模式

awk 不仅支持单个的关系表达式或者正则表达式作为模式,还支持使用逻辑运算符 && || 或者 ! 将多个表达式组合起来作为一个模式。其中,&& 表示逻辑与, || 表示逻辑或, ! 表示逻辑非
[root@haha shells]# awk '/^l|z/ && $2>80 {print $0}' file
zhangsan 90
lisi 81

6.4 区间模式

awk 以某个条件开始到某个条件结束,取这个区间内的所有,格式如下: pattern1, pattern2
[root@haha shells]# awk '/^wangmei/,$2==81 {print $0}' file
wangmei 70
zhangsan 90
lisi 81

6.5 BEGIN模式

  • BEGIN模式是一种特殊的内置模式,其成立的时机为awk程序刚开始执行,但是又尚未读取任何数据之前
  • 该模式所对应的操作仅仅被执行一次,当awk读取数据之后,BEGIN模式便不再成立
  • 用户可以将与数据文件无关,而且在整个程序的生命周期中,只需执行1次的代码放在BEGIN模式对应的操作中
[root@haha shells]# awk 'BEGIN{print "helloworld"}'
helloworld

6.6 end模式

END 模式是 awk 的另外一种特殊模式,该模式成立的时机与 BEGIN 模式恰好相反,它是在 awk 命令处理完所有的数据,即将退出程序时成立,在此之前,END 模式并不成立。无论数据文件中包含多少行数据,在整个程序的生命周期中,该模式所对应的操作只被执行1 次。因此,一般情况下,用户可以将许多善后工作放在END 模式对应的操作中
[root@haha shells]# awk -F : '{print $1}END{print "end"}' passwd
root
bin
daemon
adm
lp
end

http://www.mrgr.cn/news/79738.html

相关文章:

  • Kudu 1.17.1版本编译-aarch
  • SAP Ariba Buying _Managing PO
  • 设计模式:19、桥接模式
  • OpenCV相机标定与3D重建(14)用于组合两个旋转和平移(R|T)变换函数composeRT()的使用
  • 5G中的随机接入过程可以不用收RAR?
  • UE4 骨骼网格体合并及规范
  • 【伪代码】数据结构-期末复习 线性表
  • 【git】git回退到之前版本+拓展git命令
  • TCP/IP杂记
  • 本地搭建MQTT服务器
  • Onedrive技巧与问题
  • v-for遍历多个el-popover;el-popover通过visible控制显隐;点击其他隐藏el-popover
  • 【实操GPT-SoVits】声音克隆模型图文版教程
  • Python爬虫之urllib库使用总结
  • Mac软件推荐
  • maxscript中BoundingBox求一个模型的高度
  • C#-WPF 常见类型转换方法(持续更新)
  • 5G Multi-TRP R16~R18演进历程
  • Linux网络基础知识————网络编程
  • rk3588-ubuntu22.04系统网关实现路由器功能: