Shell脚本优化:文本转CSV高效转换方法
5星 · 超过95%的资源 需积分: 38 91 浏览量
更新于2024-09-14
收藏 25KB DOCX 举报
本篇文章主要讨论的是如何使用Shell脚本将文本数据转换成CSV格式。标题"shell_txt_to_csv"明确指出了该主题,而描述也强调了优化现有程序的需求,即处理一个包含多种字段的文本文件,如`DESCRIPTION`, `LASTYEAR`, `HOMEOWNER`, `FEES`, `RENTAL`, `YEAR`, 和 `ACTUALS`,并根据这些字段的值填充CSV文件。
原始程序使用了多个步骤,包括创建临时文件(testA.txt, testB.txt)、使用`sed`进行替换操作、计数特定行的数量、条件判断以决定输出格式,并使用`awk`处理字段和分隔符。然而,这个方法不仅冗余,效率较低,还涉及复杂的文件操作,增加了出错的可能性。
优化后的建议是,通过直接读取源文件,减少对临时文件的依赖,使用`awk`一次处理完成转换。新代码中,首先删除目标CSV文件(`rm-f$1.csv`),然后使用`awk`命令行处理工具,通过正则表达式替换逗号为分隔符,并根据条件决定是否添加描述字段。这里的关键在于`gsub`函数,它全局搜索并替换匹配项,使得一行数据在经过处理后,可以直接输出到CSV文件中。
以下是一个简化版的优化代码示例:
```bash
rm -f $1.csv
awk -F',' '{
if ($0 !~ /DESCRIPTION/) {
# 如果不存在DESCRIPTION字段,则直接输出
print $0 >> $1.csv
} else {
# 否则,处理DESCRIPTION字段
gsub(/DESCRIPTION/, "DESCRIPTION,", $0)
if ($2 > 0 || $3 > 0 || $4 > 0 || $5 > 0 || $6 > 0) {
# 如果其他非DESCRIPTION字段不为空,则输出带有DESCRIPTION的行
print $0 >> $1.csv
} else {
# 否则,只输出DESCRIPTION字段
print "DESCRIPTION," >> $1.csv
}
}
}' input.txt > $1.csv
```
在这个优化版本中,输入文件名(例如`input.txt`)代替了`testB.txt`,且省去了`while`循环。awk使用了`-F','`选项指定分隔符为逗号,`$0`表示当前行,`gsub`函数用于替换`DESCRIPTION`。条件判断语句确保了只有满足要求的行才会被写入CSV文件。
通过这种方法,代码更简洁,执行效率更高,同时减少了文件操作带来的复杂性和潜在错误。如果源文件结构和上述预期一致,那么这个优化方案应该能够满足将文本数据转换为CSV格式的需求。
2019-03-06 上传
2022-09-20 上传
2020-08-29 上传
2018-08-29 上传
2019-05-27 上传
点击了解资源详情
点击了解资源详情
丢丢来
- 粉丝: 347
- 资源: 23
最新资源
- Android圆角进度条控件的设计与应用
- mui框架实现带侧边栏的响应式布局
- Android仿知乎横线直线进度条实现教程
- SSM选课系统实现:Spring+SpringMVC+MyBatis源码剖析
- 使用JavaScript开发的流星待办事项应用
- Google Code Jam 2015竞赛回顾与Java编程实践
- Angular 2与NW.js集成:通过Webpack和Gulp构建环境详解
- OneDayTripPlanner:数字化城市旅游活动规划助手
- TinySTM 轻量级原子操作库的详细介绍与安装指南
- 模拟PHP序列化:JavaScript实现序列化与反序列化技术
- ***进销存系统全面功能介绍与开发指南
- 掌握Clojure命名空间的正确重新加载技巧
- 免费获取VMD模态分解Matlab源代码与案例数据
- BuglyEasyToUnity最新更新优化:简化Unity开发者接入流程
- Android学生俱乐部项目任务2解析与实践
- 掌握Elixir语言构建高效分布式网络爬虫