GAWK中文手册:国人编撰,全面解析

需积分: 9 14 下载量 65 浏览量 更新于2024-07-27 收藏 113KB PDF 举报
"gawk使用手册 国人所做 中文 详细 使用 实例说明 容易入门" GAWK,全称GNU Awk,是一种强大的文本分析工具,它基于AWK编程语言,由Alfred V. Aho, Peter J. Weinberger, 和 Brian W. Kernighan三位计算机科学家设计。awk的名称来源于他们的姓氏首字母。GAWK是GNU项目下的实现,它包含了原版awk的所有功能,并且不断进行改进和更新,以提供更加强大的文本处理能力。 在GAWK手册中,第一章介绍了awk的基本概念。awk擅长处理文本文件中的数据,进行修改、比对和抽取等操作。相比使用C或Pascal等更复杂的编程语言,awk的代码更简洁,执行效率高。awk可以根据用户自定义的模式(patterns)和动作(actions)处理输入数据,它能解析输入的每一行,并对匹配模式的行执行相应的动作。 例如,手册中提供了两个示例文件:'BBS-list'和'shipped'。'BBS-list'包含了一些用户信息,每行由电话号码、分机号和连接速率组成。'shipped'记录了每月的发货量。这些例子展示了awk如何处理这些数据,比如筛选特定模式的行,或者进行数据统计。 第二章简要概述了gawk的主要工作方式。gawk会逐行读取输入文件,寻找用户定义的模式。一旦找到匹配的模式,它就执行相应定义的动作。这种模式-动作的组合使得awk在数据分析时非常灵活。例如,你可以设定模式来查找所有包含特定字符串的行,然后定义动作来打印这些行,或者进行其他复杂的数据处理。 在实际应用中,gawk可以用于处理日志文件、进行数据转换、生成报告等多种任务。其强大的正则表达式支持使得模式匹配功能强大,同时,内置的函数和变量让数据处理变得简单。手册中的实例和详细说明有助于初学者快速掌握gawk的使用,使其能够高效地处理各种文本数据。 通过深入学习gawk,你可以掌握如何定义模式、编写动作,以及如何使用awk的内建函数和变量。随着技能的提升,你会发现gawk在日常的文本处理工作中是无可替代的工具,尤其对于那些需要快速处理大量结构化文本的情况。
2015-02-04 上传
AWK是一种优良的文本处理工具。它不仅是 Linux 中也是任何环境中现有的功能最强大的数据处理引擎之一。这种编程及数据操作语言(其名称得自于它的创始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首个字母)的最大功能取决于一个人所拥有的知识。AWK 提供了极其强大的功能:可以进行样式装入、流控制、数学运算符、进程控制语句甚至于内置的变量和函数。它具备了一个完整的语言所应具有的几乎所有精美特性。实际上 AWK 的确拥有自己的语言:AWK 程序设计语言, 三位创建者已将它正式定义为“样式扫描和处理语言”。它允许您创建简短的程序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有无数其他的功能。 最简单地说, AWK 是一种用于处理文本的编程语言工具。AWK 在很多方面类似于 shell 编程语言,尽管 AWK 具有完全属于其本身的语法。它的设计思想来源于 SNOBOL4 、sed 、Marc Rochkind设计的有效性语言、语言工具 yacc 和 lex ,当然还从 C 语言中获取了一些优秀的思想。在最初创造 AWK 时,其目的是用于文本处理,并且这种语言的基础是,只要在输入数据中有模式匹配,就执行一系列指令。该实用工具扫描文件中的每一行,查找与命令行中所给定内容相匹配的模式。如果发现匹配内容,则进行下一个编程步骤。如果找不到匹配内容,则继续处理下一行。 尽管操作可能会很复杂,但命令的语法始终是: awk '{pattern + action}' 或者 awk 'pattern {action}' 其中 pattern 表示 AWK 在数据中查找的内容,而 action 是在找到匹配内容时所执行的一系列命令。花括号 ({}) 不需要在程序中始终出现,但它们用于根据特定的模式对一系列指令进行分组。 gawk 是 AWK 的 GNU 版本。 一般的UNIX作业系统,本身即附有AWK,不同的UNIX作业系统所附的AWK其版本亦不尽相同,若读者所使用的系统上未附有AWK,可通过 anonymous ftp 到下列地方取得: phi./pub/gnu ftp/UNIX/gnu preppub/gnu 注 解:一种编程语言,因其模式匹配语法而特别有用,通常用于数据检索和数据转换。一个GNU版本称为Gawk。