评论数(review)作为检索依据,通过函数对googleplaystore.csv进行数据清洗
时间: 2024-02-27 13:52:53 浏览: 68
可以先定义一个函数,用于将 review 列中的非数字字符去除,并将其转换为整数类型:
```
def clean_review(review):
review = str(review)
review = review.replace(',', '')
review = review.replace('M', '000000')
review = review.replace('k', '000')
review = review.replace('+', '')
if '.' in review:
review = review[:review.index('.')]
return int(review)
```
然后,可以使用 Pandas 库读取 csv 文件,并对 review 列应用该函数进行清洗:
```
import pandas as pd
# 读取 csv 文件
df = pd.read_csv('googleplaystore.csv')
# 清洗 review 列
df['review'] = df['review'].apply(clean_review)
# 输出清洗后的结果
print(df)
```
这样就可以将 review 列中的非数字字符去除,并将其转换为整数类型,方便后续的数据分析和检索。
阅读全文