Linux awk基础教程:文本处理与变量操作

需积分: 6 0 下载量 172 浏览量 更新于2024-08-06 收藏 4KB TXT 举报
本文档主要介绍了awk编程语言的基本使用方法,这是一款在Linux系统中常用的脚本语言,尤其适合于Linux管理员和开发人员。awk的核心在于其强大的文本处理能力,它主要用于数据过滤、格式化和分析,常用于处理结构化的文本数据。 一、基本用法 awk的基本语法结构是:`$ awk 行操作命令 文件名`。在这个结构中,`awk` 是命令,行操作命令定义了对文本文件进行操作的规则,而文件名则是awk要处理的文本文件。例如,`$ awk '{print $0}' demo.txt` 这一行命令表示读取demo.txt文件中的每一行,并打印出整个行($0代表当前行)。如果使用标准输入,如`$ echo 'thisisatest' | awk '{print $0}'`,awk将读取标准输入并原样打印。 awk会根据输入的分隔符(默认为空格)将每行分割成多个字段,这些字段可以用$1、$2、$3等符号来引用。例如,`$ echo 'thisisatest' | awk '{print $3}'` 将打印出'a',因为'a'位于第三个字段。 二、变量使用 awk提供了多种变量供用户使用,其中: - `$NF` 表示当前行的最后一个字段。 - `$(NF-1)` 代表倒数第二个字段。 - 在输出时,可以利用逗号`,`来分隔多个字段,如`$ awk-F ':' '{print $1, $(NF-1)}' demo.txt`,这将打印出每个用户的用户名和路径,如`root/root`。 此外,还可以使用自定义变量和条件语句来实现更复杂的文本处理。比如,通过`if`语句筛选满足特定条件的行,或者通过`for`循环遍历字段。 三、文件示例中的应用 文章提到的例子中,通过`awk -F : '{print $1}' demo.txt`,我们看到awk如何根据指定的分隔符(冒号)处理/etc/passwd文件,提取每个用户的用户名。 awk是一个强大而灵活的工具,适用于处理各种文本数据,尤其在Linux环境下的数据处理任务中表现出色。掌握awk的基本用法和变量使用,能极大地提高系统管理效率和自动化脚本编写能力。学习者可以通过实践和案例来加深对awk的理解和运用。

解释以下shell代码每行的意义echo "××××××欢迎使用字符串匹配系统×××××" while : do echo " ××××××××××××××××××" echo " × 请选择功能" × echo " × 0.检查程序功能"× echo " × 1.字符串匹配" × echo " × 2.排 序" × echo " × 3.查 找" × echo " × 4.数据可视化" × echo " × 5.退 出" × echo " ××××××××××××××××××" read -rsN1 number case $number in 0) sudo apt-get install bowtie2 sudo apt-get install dos2unix sudo apt-get install samtools ;; 1) dos2unix ref.fa dos2unix reads1.fq bowtie2-build ref.fa ref bowtie2 -x ref -U reads1.fq -S result1.sam echo "匹配完成" echo "匹配结果存入result1.sam" ;; 2) declare -a y1 declare -a y2 declare -a y3 y1=(`awk '{print $1}' result1.sam`) y2=(`awk '{print $4}' result1.sam`) y3=(`awk '{print $10}' result1.sam`) length=0 length=${#y1[@]} for((i=0;i<length;i++));do { echo "${y1[i+3]} ${y2[i+1]} ${y3[i]}">>result1.txt } done sort -n -k 2 -t " " result1.txt>>result2.txt #将result.txt以第二列排序,输出存储到result2.txt grep -v ' 0 ' result2.txt >> result3.txt #排除匹配结果为0的结果并保存在result3.txt里 echo "排序完成!结果已经放在result3.txt里面" ;; 3)echo "请输入查找的左/右边界" read l1 r1 cat result1.txt | awk '{if($2>='$l1'&&$2<='$r1'){print $0>"result.txt"}}' echo "查找结果已经放在了resuyt.txt文件里。" ;; 4) echo "数据可视化" samtools view -bS result1.sam > result1.bam #sam文件转换为bam格式 samtools sort result1.bam result1.sort #对bam文件进行排序 samtools index result1.sorted.bam #创建bai索引 samtools tview result1.sort.bam ref.fa #可视化界面展示 ;; 5)echo "你已安全退出,欢迎下次使用!" exit 0 ;; esac done

2023-06-03 上传