python抓取网页新闻并表格化
时间: 2023-04-04 20:03:25 浏览: 181
你可以使用 Python 的 requests 库和 BeautifulSoup 库来抓取网页新闻。首先,使用 requests 库发送 GET 请求获取网页内容,然后使用 BeautifulSoup 库解析网页内容,提取出需要的信息,最后将信息表格化。
以下是一个简单的示例代码:
```python
import requests
from bs4 import BeautifulSoup
import pandas as pd
url = 'https://news.sina.com.cn/'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
news_list = []
for news in soup.select('.news-item'):
title = news.select_one('.news-title').text.strip()
time = news.select_one('.time').text.strip()
link = news.select_one('a')['href']
news_list.append({'标题': title, '时间': time, '链接': link})
df = pd.DataFrame(news_list)
print(df)
```
这段代码会抓取新浪新闻首页的新闻标题、时间和链接,并将其表格化输出。你可以根据自己的需求修改代码,抓取不同网站的新闻信息。
阅读全文