Pandas数据的筛选与排序】创建一个至少有四列、五行数据的DataFrame(包含数值和字符串类型数据),根据某列的数值条件(如第3列的值大于20)筛选数据,并根据第1列进行排序,输出结果。
时间: 2024-12-19 21:20:51 浏览: 7
首先,我们需要导入pandas库并创建一个包含四种类型(数值和字符串)的DataFrame。假设我们的数据如下:
```python
import pandas as pd
import numpy as np
# 创建一个DataFrame
data = {
'A': [1, 'B', 21, 'C', 'D'],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500],
'D': ['apple', 'banana', 'cherry', 'date', 'elderberry']
}
df = pd.DataFrame(data)
# 打印原始DataFrame
print("Original DataFrame:")
print(df)
```
现在,我们要根据第三列`C`的值大于20进行筛选,并按第一列`A`进行升序排序。我们可以这样做:
```python
# 筛选条件:第三列C的值大于20
filtered_df = df[df['C'] > 20]
# 按照第一列A进行升序排序
sorted_df = filtered_df.sort_values('A')
# 输出筛选并排序后的结果
print("\nFiltered and sorted DataFrame based on column C (values greater than 20) and sorted by column A:")
print(sorted_df)
```
执行上述代码后,你会看到一个新的DataFrame,其中只有`C`列的值大于20的记录,并且这些记录按照`A`列的值进行了升序排列。
阅读全文