Shell脚本优化:文本转CSV高效转换方法
5星 · 超过95%的资源 需积分: 38 181 浏览量
更新于2024-09-14
收藏 25KB DOCX 举报
本篇文章主要讨论的是如何使用Shell脚本将文本数据转换成CSV格式。标题"shell_txt_to_csv"明确指出了该主题,而描述也强调了优化现有程序的需求,即处理一个包含多种字段的文本文件,如`DESCRIPTION`, `LASTYEAR`, `HOMEOWNER`, `FEES`, `RENTAL`, `YEAR`, 和 `ACTUALS`,并根据这些字段的值填充CSV文件。
原始程序使用了多个步骤,包括创建临时文件(testA.txt, testB.txt)、使用`sed`进行替换操作、计数特定行的数量、条件判断以决定输出格式,并使用`awk`处理字段和分隔符。然而,这个方法不仅冗余,效率较低,还涉及复杂的文件操作,增加了出错的可能性。
优化后的建议是,通过直接读取源文件,减少对临时文件的依赖,使用`awk`一次处理完成转换。新代码中,首先删除目标CSV文件(`rm-f$1.csv`),然后使用`awk`命令行处理工具,通过正则表达式替换逗号为分隔符,并根据条件决定是否添加描述字段。这里的关键在于`gsub`函数,它全局搜索并替换匹配项,使得一行数据在经过处理后,可以直接输出到CSV文件中。
以下是一个简化版的优化代码示例:
```bash
rm -f $1.csv
awk -F',' '{
if ($0 !~ /DESCRIPTION/) {
# 如果不存在DESCRIPTION字段,则直接输出
print $0 >> $1.csv
} else {
# 否则,处理DESCRIPTION字段
gsub(/DESCRIPTION/, "DESCRIPTION,", $0)
if ($2 > 0 || $3 > 0 || $4 > 0 || $5 > 0 || $6 > 0) {
# 如果其他非DESCRIPTION字段不为空,则输出带有DESCRIPTION的行
print $0 >> $1.csv
} else {
# 否则,只输出DESCRIPTION字段
print "DESCRIPTION," >> $1.csv
}
}
}' input.txt > $1.csv
```
在这个优化版本中,输入文件名(例如`input.txt`)代替了`testB.txt`,且省去了`while`循环。awk使用了`-F','`选项指定分隔符为逗号,`$0`表示当前行,`gsub`函数用于替换`DESCRIPTION`。条件判断语句确保了只有满足要求的行才会被写入CSV文件。
通过这种方法,代码更简洁,执行效率更高,同时减少了文件操作带来的复杂性和潜在错误。如果源文件结构和上述预期一致,那么这个优化方案应该能够满足将文本数据转换为CSV格式的需求。
2019-03-06 上传
2022-09-20 上传
2020-08-29 上传
2018-08-29 上传
2019-05-27 上传
点击了解资源详情
点击了解资源详情
丢丢来
- 粉丝: 347
- 资源: 23
最新资源
- 探索数据转换实验平台在设备装置中的应用
- 使用git-log-to-tikz.py将Git日志转换为TIKZ图形
- 小栗子源码2.9.3版本发布
- 使用Tinder-Hack-Client实现Tinder API交互
- Android Studio新模板:个性化Material Design导航抽屉
- React API分页模块:数据获取与页面管理
- C语言实现顺序表的动态分配方法
- 光催化分解水产氢固溶体催化剂制备技术揭秘
- VS2013环境下tinyxml库的32位与64位编译指南
- 网易云歌词情感分析系统实现与架构
- React应用展示GitHub用户详细信息及项目分析
- LayUI2.1.6帮助文档API功能详解
- 全栈开发实现的chatgpt应用可打包小程序/H5/App
- C++实现顺序表的动态内存分配技术
- Java制作水果格斗游戏:策略与随机性的结合
- 基于若依框架的后台管理系统开发实例解析