首页有一个5000行5列的数据，每100行为一组数据，在数矩阵中只保留前50行，并输出2500行5列的数据

有一个5000行5列的数据，每100行为一组数据，在数矩阵中只保留前50行，并输出2500行5列的数据

时间: 2024-03-20 20:44:49 浏览: 33

可以使用Python中的pandas库来操作数据。首先，读入原始数据： ```python import pandas as pd data = pd.read_csv("data.csv", header=None) ``` 假设数据文件名为"data.csv"，数据中没有列名，因此header参数设为None。然后，将数据按照每100行分成50组，只保留前50行： ```python grouped = data.groupby(data.index // 100) new_data = grouped.apply(lambda x: x[:50]).reset_index(drop=True) ``` 这里使用了pandas的groupby函数将数据按照每100行分组，然后使用apply函数对每组数据进行操作，将每组数据保留前50行。最后，使用reset_index函数重置索引，并将结果存储在new_data变量中。最后，输出2500行5列的数据： ```python print(new_data.head(2500)) ``` 这将输出new_data的前2500行，即保留前50行后的数据。

阅读全文