用python从http://www.iecity.com/beijing/brand/197.html上爬取北京所有万达影城的地址
时间: 2023-06-29 15:08:43 浏览: 49
可以使用Python中的requests和BeautifulSoup库来实现网页爬取和解析。以下是基本的爬取代码:
```python
import requests
from bs4 import BeautifulSoup
url = "http://www.iecity.com/beijing/brand/197.html"
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")
# 定位到所有影城的地址信息
addresses = soup.find_all("div", {"class": "address"})
for address in addresses:
print(address.text)
```
上述代码中,我们首先通过requests库获取网页内容,然后使用BeautifulSoup库解析网页。接着,我们通过定位到所有影城的地址信息,使用find_all()方法获取到所有div标签中class为"address"的元素,最后循环输出每个元素的文本内容,即为所有万达影城的地址信息。
需要注意的是,一些网站可能会对爬虫进行限制,因此在爬取时需要尊重网站的规则,并且不要频繁地进行爬取操作。