1、读取Sales.xlsx表格,得到DataFrame对象df。 2、删除缺失数据,得到新的 df 3、删除“销售数量”等于0的数据,得到新的 df 。 4、修改“社保卡号”字段的数据类型为str。 5、输出“实收金额”至少为400的记录数量。 6、输出“实收金额”至少为400的记录,并按“实收金额”降序排序。
时间: 2024-02-11 20:09:46 浏览: 18
好的,我会按顺序回答你的问题。
1、要读取Sales.xlsx表格,可以使用 pandas 库中的 read_excel() 函数。示例代码如下:
```python
import pandas as pd
# 读取表格
df = pd.read_excel('Sales.xlsx')
```
2、要删除缺失数据,可以使用 dropna() 函数。示例代码如下:
```python
# 删除缺失数据
df = df.dropna()
```
3、要删除“销售数量”等于0的数据,可以使用布尔索引。示例代码如下:
```python
# 删除“销售数量”等于0的数据
df = df[df['销售数量'] != 0]
```
4、要修改“社保卡号”字段的数据类型为str,可以使用 astype() 函数。示例代码如下:
```python
# 修改“社保卡号”字段的数据类型为str
df['社保卡号'] = df['社保卡号'].astype(str)
```
5、要输出“实收金额”至少为400的记录数量,可以使用 count() 函数。示例代码如下:
```python
# 输出“实收金额”至少为400的记录数量
print((df['实收金额'] >= 400).sum())
```
6、要输出“实收金额”至少为400的记录,并按“实收金额”降序排序,可以使用 sort_values() 函数。示例代码如下:
```python
# 输出“实收金额”至少为400的记录,并按“实收金额”降序排序
df = df[df['实收金额'] >= 400]
df = df.sort_values(by='实收金额', ascending=False)
print(df)
```
希望这些代码对你有帮助!如果你还有其他问题,可以继续问我。