写一个爬取旅游景点的python代码
时间: 2024-02-06 15:02:24 浏览: 78
好的,以下是一个简单的爬取旅游景点的Python代码:
```python
import requests
from bs4 import BeautifulSoup
url = "https://www.tripadvisor.com/Attractions-g294212-Activities-Beijing.html" # 想要爬取的网页
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
attractions = soup.find_all("div", {"class": "attraction_element"})
for attraction in attractions:
name = attraction.find("div", {"class": "listing_title"}).text.strip()
rating = attraction.find("span", {"class": "ui_bubble_rating"})["alt"]
address = attraction.find("span", {"class": "format_address"}).text.strip()
print(f"Name: {name}\nRating: {rating}\nAddress: {address}\n")
```
这个代码使用了`requests`和`BeautifulSoup`库。首先,我们通过`requests`库获取旅游景点网页的HTML代码,然后使用`BeautifulSoup`库解析HTML代码。
接着,我们使用`find_all`方法查找所有的景点元素,并使用`find`方法获取每个景点的名称、评分和地址等信息。最后,我们将这些信息打印出来。
请注意,在实际使用中,可能需要使用更复杂的爬虫策略来应对反爬虫机制。
阅读全文