Linux/Unix下的文本处理利器：Awk入门教程

需积分: 10 129 浏览量更新于2024-07-24 收藏 235KB PDF 举报

"这篇文档是关于awk编程语言的简介，主要面向Linux/Unix环境。awk用于处理文本和数据，可以从标准输入、文件或其他命令输出中获取数据。它支持用户自定义函数和动态正则表达式，是Linux/Unix下强大的文本处理工具。通常在命令行中或作为脚本使用。awk的工作方式是逐行扫描文件，根据指定的模式对匹配的行执行操作。在未指定动作时，默认将匹配的行输出。Gawk是awk的GNU版本，包含了额外的扩展功能。本文档将基于Gawk进行awk的介绍，包括命令格式、选项以及基本用法。" awk命令格式和选项是理解awk工作方式的关键： 1. 命令格式有两种： - 直接在命令行中写入脚本：`awk[options]'script'var=valuefile(s)` - 从外部脚本文件读取：`awk[options]-fscriptfilevar=valuefile(s)` 2. 常见的命令选项： - `-F fs` 或 `--field-separator fs`：指定输入字段的分隔符，fs可以是字符串或正则表达式。 - `-v var=value` 或 `--assign var=value`：设置用户自定义变量的值。 - `-f scriptfile` 或 `--file scriptfile`：从指定的脚本文件中读取awk命令。 - `-m f nnn` 和 `-m r nnn`：在Bell实验室的awk扩展中，限制内存分配和记录的最大数目，但在标准awk中不适用。 - `-W compat` 或 `--compat`, `-W traditional` 或 `--traditional`：使gawk在兼容模式下运行，与标准awk行为一致，不使用扩展功能。 - `-W copyleft` 或 `--copyleft`, `-W copyright` 或 `--copyright`：打印版权信息。 awk的基本用法涉及模式匹配和动作： 3. 模式匹配：awk基于模式来决定哪些行需要处理。模式可以是正则表达式，例如`/pattern/`，也可以是逻辑表达式，如`NR==1`（处理第一行）。 4. 动作：匹配到模式后，awk会执行相应的动作。动作通常包含一系列命令，用大括号`{}`包围，如`{print $1}`会打印每一行的第一个字段。 5. 内置变量：awk有许多内置变量，如`NR`（当前行号），`NF`（当前行的字段数），`$0`（整个记录），`$n`（第n个字段）等，这些变量可以帮助处理文本。 6. 表达式和函数：awk支持算术、关系和逻辑表达式，还有丰富的内建函数，如`length()`（计算字符串长度），`split()`（分割字符串），`printf()`（格式化输出）等。 7. 用户自定义函数：awk允许用户定义自己的函数，增强了其灵活性和可复用性。 8. 正则表达式：awk中的正则表达式用于模式匹配，支持各种元字符和操作，如`.`（匹配任意字符），`^`（行首），`$`（行尾），`*`（重复零次或多次），`+`（重复一次或多次）等。通过上述知识点，我们可以使用awk处理各种文本数据任务，如数据分析、日志分析、数据提取等。在实际应用中，awk脚本可以结合其他Linux命令行工具，如sed、grep、cut等，形成强大的数据处理流水线。在理解并熟练掌握awk之后，开发者能更高效地处理大量文本数据，提升工作效率。

Awk 使用简介

变量描述

ARGV 包含命令行参数的数组。

CONVFMT 数字转换格式(默认值为%.6g)

ENVIRON 环境变量关联数组。

ERRNO 最后一个系统错误的描述。

FIELDWIDTHS 字段宽度列表(用空格键分隔)。

FILENAME 当前文件名。

FNR 同 NR，但相对于当前文件。

FS 字段分隔符(默认是任何空格)。

IGNORECASE 如果为真，则进行忽略大小写的匹配。

NF 当前记录中的字段数。

NR 当前记录数。

OFMT 数字的输出格式(默认值是%.6g)。

OFS 输出字段分隔符(默认值是一个空格)。

ORS 输出记录分隔符(默认值是一个换行符)。

RLENGTH 由 match 函数所匹配的字符串的长度。

RS 记录分隔符(默认是一个换行符)。

RSTART 由 match 函数所匹配的字符串的第一个位置。

SUBSEP 数组下标分隔符(默认值是\034)。

5. awk 运算符

Table 2. 运算符

运算符描述

= += -= *= /= %= ^= **= 赋值

?: C 条件表达式

|| 逻辑或

&& 逻辑与

~ ~! 匹配正则表达式和不匹配正则表达式

< <= > >= != == 关系运算符

空格连接

+ - 加，减

* / & 乘，除与求余

+ - ! 一元加，减和逻辑非

HEALTHY FLY

剩余16页未读，继续阅读

ThinkingH

粉丝: 9
资源: 19

Linux/Unix下的文本处理利器：Awk入门教程

AWK使用简介.pdf

awk使用手册,awk使用手册

awk命令简介

awk 命令简介

awk使用手册awk使用手册

awk用法简介.doc

awk-lesson:awk简介

AWK使用手册 介绍在linux如何使用awk工具

Unix awk 使用手册

awk使用基本理论

最新资源

AWK使用手册介绍在linux如何使用awk工具