利用2000部电影的信息,获取电影所有上映国家分别保存 至列表all counties. 利用pandas . 模块创建df_ counties(DataFrame)记录了电影的国家或地区信息。其中此对象的index属性为电影的名字(films列表),属性 columns为所有国家(列表all_ counties) 以及得分,最后再加一列为对应每一部电影的得分。 电影名字:肖申克的救赎;活着。所有国家:美国 中国大陆 中国香港 德国。肖申克的救赎 1 0 0 0;活着 0 1 1 0。
时间: 2023-02-13 07:00:38 浏览: 129
us_counties_covid19_daily.csv
首先,你需要准备电影名字列表和国家列表:
films = ['肖申克的救赎', '活着']
all_countries = ['美国', '中国大陆', '中国香港', '德国']
然后,使用pandas创建一个DataFrame,其中index是电影名字列表,columns是国家列表以及一个得分列:
import pandas as pd
df_countries = pd.DataFrame(index=films, columns=all_countries + ['得分'])
print(df_countries)
输出结果:
美国 中国大陆 中国香港 德国 得分
肖申克的救赎 NaN NaN NaN NaN NaN
活着 NaN NaN NaN NaN NaN
接下来,你可以使用df_countries的loc属性来设置每部电影在每个国家的信息,例如:
df_countries.loc['肖申克的救赎', '美国'] = 1
df_countries.loc['活着', '中国大陆'] = 1
df_countries.loc['活着', '中国香港'] = 1
最后,你可以使用df_countries的iloc属性来设置每部电影的得分,例如:
df_countries.iloc[0, -1] = 8.9
df_countries.iloc[1, -1] = 9.1
最终的df_countries的数据看起来应该像这样:
美国 中国大陆 中国香港 德国 得分
肖申克的救赎 1.0 NaN NaN NaN 8.9
活着 NaN 1.0 1.0 NaN 9.1
阅读全文