pluckr:简化命令行下csv列提取，避免分隔符转义问题

需积分: 16 117 浏览量更新于2024-11-01 收藏 9KB ZIP 举报

资源摘要信息:"pluckr:在命令行中从csv文件中提取列。像cut或awk，但不要因分隔符转义而窒息" pluckr是一个用于在命令行环境中处理CSV（逗号分隔值）文件的Python工具。它的设计目标是为了从CSV文件中提取特定的列，类似于Unix/Linux中的cut命令或awk工具。然而，pluckr的优势在于它可以很好地处理由分隔符转义导致的复杂情况，这些复杂情况通常会让cut和awk难以处理。 pluckr的安装非常简单，可以通过Python的包管理工具pip来安装。只需在命令行中输入"pip install pluckr"即可完成安装。 pluckr的基本使用方法是通过"-f"选项后跟要提取的列的索引或索引范围。例如，"pluckr -f 2,3 < sample1.csv"命令会从名为"sample1.csv"的文件中提取第2列和第3列的数据。如果需要从文件直接读取，可以省略输入重定向符号"<"，如"pluckr -f 2,1 sample1.csv"。 pluckr还支持对提取的列顺序进行控制，这意味着用户可以指定想要输出的列的顺序。例如，"pluckr -f 1,2 sample1.csv"与"pluckr -f 2,1 sample1.csv"将输出不同的列顺序。 pluckr支持使用Python的负索引方式来获取列，比如使用"-f 1,-1"可以获取到第一列和最后一列的数据。此外，pluckr也允许混合使用单个索引和范围，比如"-f 2,4-6,9"。当用户不确定CSV文件中存在哪些列或它们的索引时，pluckr提供了"--names"选项，允许用户先查看所有列的名称，然后再决定要提取哪些列。 pluckr的这些功能使其成为一个非常灵活和强大的工具，特别适合于数据提取、分析和预处理等场景。在数据量大、数据格式复杂且需要频繁提取不同列的场合，pluckr可以提供一个高效的解决方案，极大地简化数据处理工作。此外，pluckr的使用场景不限于数据科学或数据分析专业人员，它也可以作为系统管理员、开发人员和其他需要处理CSV文件的用户的辅助工具，提升他们在命令行环境下处理数据的能力。 pluckr的出现表明了在不断发展的IT行业，尤其是在数据处理领域，工具的创新和改进总是受到欢迎的。它不仅提高了工作效率，而且还扩展了用户在命令行环境中处理复杂数据的能力。最后，pluckr作为一个开源项目，"pluckr-master"可能是该项目的源代码文件夹名称。开源项目意味着它的源代码可以被公开访问和审查，这也意味着社区可以参与到pluckr的开发过程中来，共同改进这个工具。

收起资源包目录

pluckr:在命令行中从 csv 文件中提取列。像 cut 或 awk，但不要因分隔符转义而窒息（18个子文件）

__init__.py 22B

requirements.txt 5B

pluckr 229B

helpers.py 0B

CHANGES.txt 511B

serenity-crew.tsv 81B

LICENSE.txt 752B

README.md 10B

.gitignore 22B

core.py 4KB

pluckr-test.sh 2KB

README.txt 2KB

test 237B

setup.py 592B

sample1.tsv 1KB

serenity-crew.csv 81B

Makefile 300B

sample1.csv 1KB

共 18 条

chsqi

粉丝: 22
资源: 4655

pluckr:简化命令行下csv列提取，避免分隔符转义问题

AWK教程：快速掌握命令行工具

Linux awk命令行教程：快速入门

Safari Cookie管理利器：cookieutil命令行工具

AWK Statistics:awkStatistics使用awk从csv数据生成统计信息。-开源

Platypus：从命令行脚本创建本机Mac应用程序

LEDE项目：从命令行升级LEDE固件1

深入探索：Linux 命令行指南

awk的默认域分隔符是什么？如何改变awk的域分隔符？

awk命令可以按分隔符输出不同的列

用 AWK 命令从以：为分隔符的文本中提取第1列和第二列的数据的命令。

最新资源