Shell脚本优化:文本转CSV高效转换方法

本篇文章主要讨论的是如何使用Shell脚本将文本数据转换成CSV格式。标题"shell_txt_to_csv"明确指出了该主题,而描述也强调了优化现有程序的需求,即处理一个包含多种字段的文本文件,如`DESCRIPTION`, `LASTYEAR`, `HOMEOWNER`, `FEES`, `RENTAL`, `YEAR`, 和 `ACTUALS`,并根据这些字段的值填充CSV文件。
原始程序使用了多个步骤,包括创建临时文件(testA.txt, testB.txt)、使用`sed`进行替换操作、计数特定行的数量、条件判断以决定输出格式,并使用`awk`处理字段和分隔符。然而,这个方法不仅冗余,效率较低,还涉及复杂的文件操作,增加了出错的可能性。
优化后的建议是,通过直接读取源文件,减少对临时文件的依赖,使用`awk`一次处理完成转换。新代码中,首先删除目标CSV文件(`rm-f$1.csv`),然后使用`awk`命令行处理工具,通过正则表达式替换逗号为分隔符,并根据条件决定是否添加描述字段。这里的关键在于`gsub`函数,它全局搜索并替换匹配项,使得一行数据在经过处理后,可以直接输出到CSV文件中。
以下是一个简化版的优化代码示例:
```bash
rm -f $1.csv
awk -F',' '{
if ($0 !~ /DESCRIPTION/) {
# 如果不存在DESCRIPTION字段,则直接输出
print $0 >> $1.csv
} else {
# 否则,处理DESCRIPTION字段
gsub(/DESCRIPTION/, "DESCRIPTION,", $0)
if ($2 > 0 || $3 > 0 || $4 > 0 || $5 > 0 || $6 > 0) {
# 如果其他非DESCRIPTION字段不为空,则输出带有DESCRIPTION的行
print $0 >> $1.csv
} else {
# 否则,只输出DESCRIPTION字段
print "DESCRIPTION," >> $1.csv
}
}
}' input.txt > $1.csv
```
在这个优化版本中,输入文件名(例如`input.txt`)代替了`testB.txt`,且省去了`while`循环。awk使用了`-F','`选项指定分隔符为逗号,`$0`表示当前行,`gsub`函数用于替换`DESCRIPTION`。条件判断语句确保了只有满足要求的行才会被写入CSV文件。
通过这种方法,代码更简洁,执行效率更高,同时减少了文件操作带来的复杂性和潜在错误。如果源文件结构和上述预期一致,那么这个优化方案应该能够满足将文本数据转换为CSV格式的需求。
点击了解资源详情
465 浏览量
125 浏览量
2019-03-06 上传
101 浏览量
点击了解资源详情
点击了解资源详情
168 浏览量
点击了解资源详情

丢丢来
- 粉丝: 418
最新资源
- C#实现DataGridView过滤功能的源码分享
- Python开发者必备:VisDrone数据集工具包
- 解决ESXi5.x安装无网络适配器问题的第三方工具使用指南
- GPRS模块串口通讯实现与配置指南
- WinCvs客户端安装使用指南及服务端资源
- PCF8591T AD实验源代码与使用指南
- SwiftForms:Swift实现的表单创建神器
- 精选9+1个网站前台模板下载
- React与BaiduMapNodejs打造上海小区房价信息平台
- 全面解析手机软件测试的实战技巧与方案
- 探索汇编语言:实验三之英文填字游戏解析
- Eclipse VSS插件版本1.6.2发布
- 建站之星去版权补丁介绍与下载
- AAInfographics: Swift语言打造的AAChartKit图表绘制库
- STM32高频电子线路实验完整项目资料下载
- 51单片机实现多功能计算器的原理与代码解析