pandas模块创建DataFrame对象df_data记录的是所有电影的属性信息,其中此对象的index属性为电影的名字(films列表)和电影的年代,属性columns 分别为所有特征(列表all attrs), 最后对此对象添加一列(列名字为“评分”)。电影名字:肖申克的救赎,霸王别姬。电影属性:犯罪 剧情 爱情 同性。肖申克的救赎 1 0 0 0。霸王别姬 0 1 1 1。评分9.7 9.6。
时间: 2023-02-13 11:55:22 浏览: 83
首先,需要导入pandas模块:
```python
import pandas as pd
```
然后,可以使用pandas的DataFrame函数创建一个DataFrame对象,并设置index属性和columns属性:
```python
films = ['肖申克的救赎', '霸王别姬']
all_attrs = ['犯罪', '剧情', '爱情', '同性']
data = [[1, 0, 0, 0], [0, 1, 1, 1]]
df_data = pd.DataFrame(data, index=films, columns=all_attrs)
```
此时,df_data的数据如下:
| | 犯罪 | 剧情 | 爱情 | 同性 |
|--- |--- |--- |--- |--- |
| 肖申克的救赎 | 1 | 0 | 0 | 0 |
| 霸王别姬 | 0 | 1 | 1 | 1 |
接下来,可以使用pandas的assign函数在df_data中添加一列,列名为“评分”,并赋值为[9.7, 9.6]:
```python
df_data = df_data.assign(评分=[9.7, 9.6])
```
最后,df_data的数据如下:
| | 犯罪 | 剧情 | 爱情 | 同性 | 评分 |
|--- |--- |--- |--- |--- |--- |
| 肖申克的救赎 | 1 | 0 | 0 | 0 | 9.7 |
| 霸王别姬 | 0 | 1 | 1 | 1 | 9.6 |
相关问题
pandas模块创建DataFrame对象df_data记录的是所有电影的属性信息,其中此对象的index属性为电影的名字(films列表了和电影的年代,属性columns 分别为所有特征(列表all attrs), 最后对此对象添加-列(列名字为“评分”)。
要使用 pandas 模块创建 DataFrame 对象,可以使用以下代码:
```
import pandas as pd
# 创建电影名字列表
films = ['电影1', '电影2', '电影3']
# 创建所有特征列表
all_attrs = ['属性1', '属性2', '属性3']
# 创建空的 DataFrame 对象
df_data = pd.DataFrame(index=films, columns=all_attrs)
# 添加 "评分" 列
df_data['评分'] = [1, 2, 3]
```
这样就可以创建一个名为 `df_data` 的 DataFrame 对象,其中的 index 属性为电影的名字,columns 属性为所有特征,并且添加了一列名为 "评分" 的列。
注意,在上面的代码中,我们使用了空的 DataFrame 对象来创建 DataFrame,然后再添加列。你也可以直接传递数据来创建 DataFrame,例如:
```
df_data = pd.DataFrame({
'电影名字': films,
'属性1': [1, 2, 3],
'属性2': [4, 5, 6],
'属性3': [7, 8, 9],
'评分': [10, 11, 12]
})
```
这样就可以通过传递字典来创建一个含有所有列的 DataFrame 对象。
电影名字:肖申克的救赎;活着。所有国家:美国 中国大陆 中国香港 德国。肖申克的救赎 1 0 0 0;活着 0 1 1 0。利用2000部电影的信息,获取电影所有上映国家分别保存 至列表all counties. 利用pandas . 模块创建df_ counties(DataFrame)记录了电影的国家或地区信息。其中此对象的index属性为电影的名字(films列表),属性 columns为所有国家(列表all_ counties) 以及得分,最后再加一列为对应每一部电影的得分。
这个信息描述了两部电影,肖申克的救赎和活着,在四个不同的国家上映的情况。肖申克的救赎在美国上映,在中国大陆、中国香港和德国上映的情况是0。活着在中国大陆和中国香港上映,在美国和德国上映的情况是0。
基于这2000部电影的信息,你需要创建一个名为"df_countries"的DataFrame,它记录了这些电影在不同国家或地区上映的情况。其中,DataFrame的index属性为电影的名字(即films列表),columns属性为所有国家的名称(即all_countries列表)以及得分。最后,还需要加一列,记录每一部电影的得分。
你可以使用pandas模块中的DataFrame函数来创建这个DataFrame。例如:
```
import pandas as pd
df_countries = pd.DataFrame(data, index=films, columns=all_countries + ['score'])
```
其中,data是一个字典,它的键是电影的名字,值是一个列表,包含电影在每个国家上映的情况以及电影的得分。例如,对于肖申克的救赎,你可以这样定义:
```
data = {'肖申克的救赎': [1, 0, 0, 0, 8.9],
'活着': [0, 1, 1, 0, 9.0]}
```
然后你就可以使用这个字典来创建DataFrame了。
最终
阅读全文