python爬虫电影可视化
时间: 2023-12-22 19:28:46 浏览: 78
以下是使用Python爬虫和pandas库进行电影数据可视化的示例:
1. 爬取电影数据并保存为CSV文件
```python
import requests
import pandas as pd
# 爬取电影数据并保存为CSV文件
# 这里放置爬取电影数据的代码
# ...
# 假设数据已经保存为'电影数据.csv'
```
2. 使用pandas打开爬取的CSV文件
```python
import pandas as pd
# 使用pandas打开爬取的CSV文件
data = pd.read_csv('电影数据.csv', encoding='utf-8')
print(data)
```
3. 对电影名进行分词以及词频统计
```python
import jieba
from collections import Counter
# 对电影名进行分词
data['分词后的电影名'] = data['电影名'].apply(lambda x: ' '.join(jieba.cut(x)))
# 词频统计
word_count = Counter(' '.join(data['分词后的电影名']).split())
print(word_count.most_common(10) # 输出词频最高的前10个词
```
阅读全文