豆瓣top250电影数据类型转换Python代码
时间: 2023-11-05 21:06:55 浏览: 88
基于python抓取豆瓣电影TOP250的数据及进行分析.zip
5星 · 资源好评率100%
下面是将豆瓣top250电影数据中的一些字段类型进行转换的Python代码示例:
```python
import json
import pandas as pd
# 读取豆瓣top250电影数据
with open('top250_movies.json', 'r', encoding='utf-8') as f:
data = json.load(f)
# 将数据转换为DataFrame格式
df = pd.DataFrame(data)
# 将评分人数字段转换为整数类型
df['rating_num'] = df['rating_num'].astype(int)
# 将上映年份字段转换为整数类型
df['release_year'] = df['release_year'].astype(int)
# 将电影时长字段转换为分钟数
df['duration'] = df['duration'].apply(lambda x: int(x.split('分钟')[0]))
# 输出转换后的数据
print(df.head())
```
其中,`top250_movies.json` 是豆瓣top250电影数据的 JSON 文件。在这段代码中,我们使用了 Pandas 库将数据转换为 DataFrame 格式,并使用了一些 Pandas 的函数将字段类型进行转换。具体地,我们使用了 `astype` 函数将评分人数和上映年份字段转换为整数类型,使用了 `apply` 函数将电影时长字段的字符串格式转换为分钟数。最后,我们输出转换后的数据。
阅读全文