Linux awk命令详解与使用

需积分: 10 100 浏览量更新于2024-07-25 收藏 338KB PDF 举报

"这是一份关于AWK的简明学习笔记，主要涵盖了AWK命令的基础知识，包括其三个版本（awk、nawk和gawk）的介绍，如何调用AWK，以及AWK的运行过程和脚本结构。这份笔记还提到了一些常用的AWK选项和变量，以及awk_cmd的组成和执行流程。" 在Linux系统中，AWK是一种强大的文本分析工具，用于处理和解析文件中的数据。AWK的三个主要版本——awk、nawk和gawk，其中gawk是GNU项目实现的版本，通常默认在系统中可用。AWK的基本功能是基于用户定义的模式或规则，对文件或字符串进行信息提取和格式化输出。调用AWK有三种常见方式： 1) 直接在命令行中使用，通过指定选项、脚本和输入文件。例如，`awk -Ffs 'awk_script' input_file`，其中-F选项用于设置字段分隔符，不指定则使用IFS环境变量的值。 2) 将脚本写入文件，并以`#!/bin/awk -f`作为第一行，使脚本具有可执行权限，然后直接运行脚本文件。 3) 将所有脚本内容写入一个文件，然后使用`awk -f awk_script_file input_file`调用。 awk脚本通常包含一系列命令（awk_cmd），每条命令由模式（awk_pattern）和对应的操作（actions）组成。模式可以是正则表达式或逻辑表达式，用于匹配输入记录。操作则是在模式匹配时执行的语句块。例如，`awk 'pattern { actions }'`。脚本可以分为多个部分，包括可选的BEGIN和END区块。BEGIN区块在处理任何输入之前执行，用于初始化变量或进行预处理。END区块在处理完所有输入后执行，通常用于进行最后的汇总或清理工作。当AWK运行时，它按照以下步骤操作： 1. 如果有BEGIN区块，先执行其中的actions。 2. 读取输入文件的一行（如果没有指定输入文件，则从标准输入读取）。 3. 将读到的记录按字段分隔符拆分成字段，字段默认以空格或制表符分隔，但可以通过-F选项自定义。字段可以使用特殊变量$1、$2等访问，$0表示整个记录。 4. 对于脚本中的每条awk_cmd，AWK将当前记录与模式进行匹配，匹配成功则执行相应的actions，否则跳过。通过这些基本概念和运行机制，你可以编写复杂的AWK脚本来处理和分析文本数据，实现数据过滤、统计、转换等多种功能。在实际应用中，AWK的强大在于其灵活性和对文本数据处理的高效性。

awk

用法小结

awk

用法：

awk ' pattern {action} '

变量名含义

ARGC 命令行变元个数

ARGV 命令行变元数组

FILENAME

当前输入文件名

FNR 当前文件中的记录号

FS 输入域分隔符，默认为一个空格

输入记录分隔符

当前记录里域个数

NR 到目前为止记录数

OFS 输出域分隔符

ORS

输出记录分隔符

1、awk '/101/' file 显示文件 file 中包含 101 的匹配行。

awk'/101/,/105/' file

awk'$1 == 5' file

awk'$1 == "CT"' file 注意必须带双引号

awk'$1 * $2 >100 ' file

awk'$2 >5 && $2<=15' file

、

awk '{print NR,NF,$1,$NF,}' file

显示文件

file

的当前记录号、域数和每一行的第一个和最后一个域。

awk'/101/ {print $1,$2 + 10}' file

显示文件

file

的匹配行的第一、二个域加

。

awk'/101/ {print $1$2}' file

awk'/101/ {print $1 $2}' file 显示文件 file 的匹配行的第一、二个域，但显示时域中间没有分隔符。

、

df |awk'$4>1000000 '

通过管道符获得输入，如：显示第

个域满足条件的行。

4、awk -F "|" '{print $1}' file 按照新的分隔符“|”进行操作。

awk 'BEGIN { FS="[: \t|]" }

{print $1,$2,$3}' file 通过设置输入分隔符（FS="[: \t|]"）修改输入分隔符。

Sep="|"

awk-F $Sep '{print $1}' file 按照环境变量 Sep 的值做为分隔符。

awk-F '[ :\t|]' '{print $1}' file 按照正则表达式的值做为分隔符，这里代表空格、:、TAB、|同时做为分隔符。

awk-F '[][]' '{print $1}' file 按照正则表达式的值做为分隔符，这里代表[、]

5、awk -f awkfile file 通过文件 awkfile 的内容依次进行控制。

cat awkfile

/101/{print "\047 Hello! \047"} --遇到匹配行以后打印 ' Hello! '.\047 代表单引号。

{print $1,$2} --

因为没有模式控制，打印每一行的前两个域。

6、awk '$1 ~ /101/ {print $1}' file 显示文件中第一个域匹配 101 的行（记录）。

7、awk 'BEGIN { OFS="%"}

{print $1,$2}' file

通过设置输出分隔符（

OFS="%"

）修改输出格式。

8、awk 'BEGIN { max=100 ;print "max=" max} BEGIN 表示在处理任意行之前进行的操作。

{max=($1 >max ?$1:max); print $1,"Now max is "max}' file 取得文件第一个域的最大值。

（表达式 1?表达式 2:表达式 3 相当于：

if (

表达式

else

表达式

awk'{print ($1>4 ? "high "$1: "low "$1)}' file

、

awk '$1 * $2 >100 {print $1}' file

显示文件中第一个域匹配

101

的行（记录）。

10、awk '{$1 == 'Chi' {$3 = 'China'; print}' file 找到匹配行后先将第 3 个域替换后再显示该行（记录）。

awk'{$7 %= 3; print $7}' file 将第 7 域被 3 除，并将余数赋给第 7 域再打印。

11、awk '/tom/ {wage=$2+$3; printf wage}' file 找到匹配行后为变量 wage 赋值并打印该变量。

12、awk '/tom/ {count++;}

END {print "tom was found "count" times"}' file END 表示在所有输入行处理完后进行处理。

、

awk 'gsub(/\$/,"");gsub(/,/,""); cost+=$4;

END {print "The total is $" cost>"filename"}' file gsub

函数用空串替换

和

再将结果输出到

filename

中。

1 2 3 $1,200.00

1 2 3 $2,300.00

1 2 3 $4,000.00

awk'{gsub(/\$/,"");gsub(/,/,"");

if ($4>1000&&$4<2000) c1+=$4;

else if ($4>2000&&$4<3000) c2+=$4;

else if ($4>3000&&$4<4000) c3+=$4;

else c4+=$4; }

END {printf "c1=[%d];c2=[%d];c3=[%d];c4=[%d]\n",c1,c2,c3,c4}"' file

通过

和

else if

完成条件语句

awk'{gsub(/\$/,"");gsub(/,/,"");

if ($4>3000&&$4<4000) exit;

剩余19页未读，继续阅读

wooowlili

粉丝: 15
资源: 5

Linux awk命令详解与使用

linux-常用命令学习笔记.pdf

PDF电子书《Awk学习笔记2010修改版》

《LINUX与UNIX SHELL编程指南》读书笔记.pdf

linux运维学习笔记：Shell前言.pdf

linux运维学习笔记：Shell条件语句.pdf

linux运维学习笔记：Shell生成随机数的方法.pdf

linux运维学习笔记：企业Shell面试题总结-1.pdf

linux与unix shell编程指南.pdf

清华大学—学堂在线—高级大数据系统课件笔记.zip

信息安全_数据安全_Finding Evil with Skadi.pdf

最新资源