首页python 2GB以上csv统计行数

python 2GB以上csv统计行数

时间: 2023-06-29 12:05:49 浏览: 128

可以使用pandas库来读取csv文件，并统计行数。以下是示例代码： ```python import pandas as pd # 读取csv文件，使用chunksize参数分块读取 reader = pd.read_csv('your_file.csv', chunksize=1000000) # 统计行数 row_count = 0 for chunk in reader: row_count += len(chunk) print('Total rows: ', row_count) ``` 在这个示例中，我们将文件分成了1,000,000行一块进行读取，并且在每一块中统计行数。最后将所有块的行数相加得到总行数。注意，这个方法需要足够的内存来存储数据块。如果内存不足，可以增加chunksize参数的值，或者使用其他分块处理的方法。

python 20GB以上csv统计行数

对于 20GB 以上的 CSV 文件，一次性读取到内存可能会导致内存溢出。因此，建议使用逐行读取的方式统计行数。可以使用 Python 内置的 `csv` 模块和 `gzip` 模块来处理压缩的 CSV 文件，具体代码如下： ```python import csv import gzip # 打开压缩的 CSV 文件 with gzip.open('large_file.csv.gz', 'rt', encoding='utf-8') as f: reader = csv.reader(f) row_count = 0 for row in reader: row_count += 1 print('行数：', row_count) ``` 如果 CSV 文件没有压缩，可以直接使用以下代码： ```python import csv # 打开 CSV 文件 with open('large_file.csv', 'r', encoding='utf-8') as f: reader = csv.reader(f) row_count = 0 for row in reader: row_count += 1 print('行数：', row_count) ``` 注意，这两种方法都需要逐行读取整个文件，可能需要一些时间来完成。

阅读全文