分块读取csv文件,每次读取两万行,读取的数据分别用数据框A1,A2,A3...表示,然后打印出数据框A1,A2,A3...
时间: 2023-09-22 18:06:10 浏览: 335
### 回答1:
您好,针对您的问题,我可以给出以下代码实现:
```python
import pandas as pd
chunk_size = 20000 # 每次读取的行数
filename = 'example.csv' # csv文件名
reader = pd.read_csv(filename, chunksize=chunk_size) # 分块读取csv文件
for i, chunk in enumerate(reader):
# 将每个数据块存储为一个数据框,命名为A1,A2,A3...
globals()['A{}'.format(i+1)] = pd.DataFrame(chunk)
# 打印出每个数据框
print(globals()['A{}'.format(i+1)])
```
上述代码通过使用pandas库中的`read_csv()`函数分块读取指定文件名的csv文件,并且通过循环将每个数据块存储为一个数据框,并分别命名为A1,A2,A3...依次类推。然后通过调用`print()`函数,打印出每个数据框的内容。
希望对您有所帮助!
### 回答2:
分块读取CSV文件是一种读取大型数据文件的有效方法,可以提高内存的利用率,并减少读取时间。下面是一个使用Python进行分块读取CSV文件并打印数据框的示例:
```python
import pandas as pd
# 设置分块大小为20000行
chunk_size = 20000
# 计数器,用于标识读取的数据框个数
count = 1
# 读取CSV文件
for chunk in pd.read_csv('filename.csv', chunksize=chunk_size):
# 将每个分块的数据保存到对应的数据框中
globals()[f'A{count}'] = chunk
# 打印数据框
print(globals()[f'A{count}'])
# 增加计数器
count += 1
```
在上述示例中,首先设置了分块大小为20000行,并定义了一个计数器count。然后通过`pd.read_csv`函数迭代地读取CSV文件的每个分块,每个分块的数据保存在一个独立的数据框中,通过`globals()[f'A{count}']`来动态命名数据框。最后在每个数据块中,打印出相应的数据框。
请将`filename.csv`替换为你要读取的CSV文件的文件名,并根据需要调整分块大小。
### 回答3:
分块读取csv文件可以使用pandas库中的read_csv函数,并设置参数chunksize为20000,表示每次读取20000行数据。然后,可以使用for循环遍历每个数据块,并将每个数据块存储到一个对应的数据框中(A1,A2,A3...)。最后,可以使用print函数打印出每个数据框。
下面是具体的代码实现:
```python
import pandas as pd
# 读取csv文件,每次读取两万行
csv_filename = "your_csv_file.csv"
chunksize = 20000
# 创建一个列表存储所有数据块的数据框
data_frames = []
# 依次读取每个数据块,并存储到对应的数据框中
for chunk in pd.read_csv(csv_filename, chunksize=chunksize):
data_frames.append(chunk)
# 打印每个数据框
for i, df in enumerate(data_frames):
print("数据框A" + str(i+1) + ":")
print(df)
```
通过以上代码,可以将读取到的每个数据块分别存储在data_frames列表中的数据框中,然后按照A1、A2、A3...的命名规则依次打印出每个数据框的内容。
阅读全文