有一个5000行5列的数据,每100行为一组数据,在数矩阵中只保留前50行,并输出2500行5列的数据
时间: 2024-03-20 08:44:49 浏览: 30
一个储存过程,5300多行
4星 · 用户满意度95%
可以使用Python中的pandas库来操作数据。首先,读入原始数据:
```python
import pandas as pd
data = pd.read_csv("data.csv", header=None)
```
假设数据文件名为"data.csv",数据中没有列名,因此header参数设为None。然后,将数据按照每100行分成50组,只保留前50行:
```python
grouped = data.groupby(data.index // 100)
new_data = grouped.apply(lambda x: x[:50]).reset_index(drop=True)
```
这里使用了pandas的groupby函数将数据按照每100行分组,然后使用apply函数对每组数据进行操作,将每组数据保留前50行。最后,使用reset_index函数重置索引,并将结果存储在new_data变量中。最后,输出2500行5列的数据:
```python
print(new_data.head(2500))
```
这将输出new_data的前2500行,即保留前50行后的数据。
阅读全文