首页用python从http://www.iecity.com/beijing/brand/197.html上爬取北京所有万达影城的地址

用python从http://www.iecity.com/beijing/brand/197.html上爬取北京所有万达影城的地址

时间: 2023-06-29 15:08:43 浏览: 49

可以使用Python中的requests和BeautifulSoup库来实现网页爬取和解析。以下是基本的爬取代码： ```python import requests from bs4 import BeautifulSoup url = "http://www.iecity.com/beijing/brand/197.html" response = requests.get(url) soup = BeautifulSoup(response.content, "html.parser") # 定位到所有影城的地址信息 addresses = soup.find_all("div", {"class": "address"}) for address in addresses: print(address.text) ``` 上述代码中，我们首先通过requests库获取网页内容，然后使用BeautifulSoup库解析网页。接着，我们通过定位到所有影城的地址信息，使用find_all()方法获取到所有div标签中class为"address"的元素，最后循环输出每个元素的文本内容，即为所有万达影城的地址信息。需要注意的是，一些网站可能会对爬虫进行限制，因此在爬取时需要尊重网站的规则，并且不要频繁地进行爬取操作。