import matplotlib.pyplot as plt import pandas as pd plt.rcParams['font.sans-serif']=['Arial Unicode MS'] plt.rcParams['axes.unicode_minus']=False df = pd.read_csv("vehicles-数据.csv",encoding='gbk')将汽车的传动方式(trany)改为“Auto”和”Manual”。统计不同类型的记录数量
时间: 2024-03-27 22:37:43 浏览: 228
10.Pandas、Matplotlib、PCA绘图实用代码补充1
这段代码片段中,首先导入了matplotlib.pyplot和pandas库,并对字体进行了设置以支持中文显示。然后使用pandas的read_csv函数读取了名为“vehicles-数据.csv”的csv文件,通过设置encoding参数为'gbk'来解决中文乱码问题。
接下来,需要将汽车的传动方式(trany)改为“Auto”和”Manual”。可以使用pandas的replace函数来实现:
```python
df["trany"].replace({"Automatic (A1)": "Auto", "Automatic (AV)": "Auto", "Automatic (S1)": "Auto", "Automatic (S5)": "Auto",
"Automatic (S6)": "Auto", "Automatic (S7)": "Auto", "Automatic (variable gear ratios)": "Auto",
"Manual 5-spd": "Manual", "Manual 6-spd": "Manual", "Manual 7-spd": "Manual",
"Manual(M7)": "Manual", "Manual(M6)": "Manual"}, inplace=True)
```
在这个实现中,将“Automatic (A1)”,“Automatic (AV)”等传动方式替换为“Auto”,将“Manual 5-spd”等传动方式替换为“Manual”。使用pandas的inplace参数将修改应用到原始数据中。
最后,可以使用value_counts函数来统计不同类型的记录数量:
```python
counts = df["trany"].value_counts()
print(counts)
```
这个函数将返回一个Series,其中包含不同类型的记录数量。例如,输出结果可能为:
```
Auto 22405
Manual 3558
Name: trany, dtype: int64
```
其中,“Auto”类型的记录数量为22405,“Manual”类型的记录数量为3558。
阅读全文