#********** Begin **********# #1.导入pandas包 #2.read_excel()函数读取“一、车次上车人数统计表.xlsx”中的数据,用一个数据框df1来存储 #3.通过read_table()函数可以读取"txt1.txt"文件中的数据(不带表头),用一个数据框df2来表示 #4.通过read_csv()函数读取用分块读取的方式读取“data.csv”文件,每次读取20000行,并输出每次读取的数据集行数 #5.输出格式为“第n次读取数据规模为:20000 /n (20000, 列数)” #在函数中编写程序 def return_values(): #********** End **********#
时间: 2023-07-13 08:31:45 浏览: 580
python pandas生成时间列表
```python
import pandas as pd
def return_values():
# 1.导入pandas包
import pandas as pd
# 2.read_excel()函数读取“一、车次上车人数统计表.xlsx”中的数据,用一个数据框df1来存储
df1 = pd.read_excel("一、车次上车人数统计表.xlsx", sheet_name='Sheet2')
# 3.通过read_table()函数可以读取"txt1.txt"文件中的数据(不带表头),用一个数据框df2来表示
df2 = pd.read_table("txt1.txt", header=None)
# 4.通过read_csv()函数读取用分块读取的方式读取“data.csv”文件,每次读取20000行,并输出每次读取的数据集行数
chunk_size = 20000
num_lines = sum(1 for line in open('data.csv'))
num_chunks = num_lines // chunk_size + 1
for i in range(num_chunks):
start = i * chunk_size
end = min((i+1) * chunk_size, num_lines)
df_chunk = pd.read_csv('data.csv', header=0, skiprows=start, nrows=end-start)
print(f"第{i+1}次读取数据规模为:{df_chunk.shape}")
return df1, df2
df1, df2 = return_values()
```
阅读全文