编写程序实现采集株洲市所有肯德基门店信息,存放到文本文件中
时间: 2024-04-14 20:32:18 浏览: 13
您可以使用Python编写程序来实现这个任务。以下是一个简单的示例代码,使用了`requests`和`BeautifulSoup`库来获取网页内容并解析HTML。
```python
import requests
from bs4 import BeautifulSoup
def get_kfc_stores():
url = 'https://www.kfc.com.cn/kfccda/storelist/index.aspx'
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36'
}
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
stores = []
store_items = soup.select('.store_list ul li')
for item in store_items:
name = item.select_one('.store_name > a').text.strip()
address = item.select_one('.store_add > span').text.strip()
stores.append({'name': name, 'address': address})
return stores
def save_to_file(stores):
with open('kfc_stores.txt', 'w', encoding='utf-8') as f:
for store in stores:
f.write(f"门店名称: {store['name']}\n")
f.write(f"门店地址: {store['address']}\n\n")
stores = get_kfc_stores()
save_to_file(stores)
```
上述代码中,我们首先使用`requests`库发送HTTP请求,获取肯德基门店列表页面的HTML内容。然后使用`BeautifulSoup`库解析HTML,并通过CSS选择器选取门店名称和地址。最后将门店信息写入到名为`kfc_stores.txt`的文本文件中。
请注意,此代码仅适用于特定的网页结构,如果网页结构发生变化,可能需要进行相应的修改。另外,爬取网页内容需要遵守网站的使用条款和政策,确保合法合规。