帮我写个python爬虫爬取招聘信息的代码
时间: 2023-04-02 21:03:44 浏览: 190
好的,以下是一个简单的 Python 爬虫示例,可以爬取某个招聘网站的职位信息:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.example.com/jobs'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
jobs = soup.find_all('div', class_='job')
for job in jobs:
title = job.find('h2').text.strip()
company = job.find('p', class_='company').text.strip()
location = job.find('p', class_='location').text.strip()
salary = job.find('p', class_='salary').text.strip()
print(title, company, location, salary)
```
请注意,这只是一个示例,实际上爬取招聘信息需要更复杂的代码和技术,而且需要遵守网站的使用条款和法律法规。
相关问题
帮我写个python爬虫爬取招聘信息的代码并用xlsx格式储存
好的,我可以为您提供一个简单的 Python 爬虫代码,用于爬取招聘信息并将其保存为 xlsx 格式的文件。以下是代码:
```python
import requests
from bs4 import BeautifulSoup
import openpyxl
# 设置请求头,模拟浏览器访问
headers = {
'User-Agent': 'Mozilla/5. (Windows NT 10.; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58..3029.110 Safari/537.3'}
# 发送请求,获取页面内容
url = 'https://www.example.com/recruitment'
response = requests.get(url, headers=headers)
soup = BeautifulSoup(response.text, 'html.parser')
# 解析页面内容,获取招聘信息
job_list = soup.find_all('div', class_='job-item')
# 创建 Excel 文件
workbook = openpyxl.Workbook()
sheet = workbook.active
# 写入表头
sheet['A1'] = '职位名称'
sheet['B1'] = '公司名称'
sheet['C1'] = '工作地点'
sheet['D1'] = '薪资待遇'
sheet['E1'] = '发布时间'
# 写入招聘信息
for i, job in enumerate(job_list):
title = job.find('a', class_='job-title').text.strip()
company = job.find('div', class_='company-name').text.strip()
location = job.find('div', class_='job-location').text.strip()
salary = job.find('span', class_='job-salary').text.strip()
date = job.find('div', class_='job-pub-time').text.strip()
sheet.cell(row=i+2, column=1, value=title)
sheet.cell(row=i+2, column=2, value=company)
sheet.cell(row=i+2, column=3, value=location)
sheet.cell(row=i+2, column=4, value=salary)
sheet.cell(row=i+2, column=5, value=date)
# 保存 Excel 文件
workbook.save('job_list.xlsx')
# 提示爬取完成
print('招聘信息已保存为 job_list.xlsx 文件')
```
希望这个代码对您有所帮助!
python爬虫爬取招聘
回答: 如果你想使用Python爬虫来爬取招聘信息,可以参考以下步骤。首先,你可以定义一个类,继承自object,并在该类中定义一个init方法和一个主函数main。在init方法中,你可以设置需要爬取的网址。然后,导入需要的库,比如requests、lxml和fake_useragent。接下来,在主函数main中,你可以编写具体的爬取代码。使用requests库发送HTTP请求,使用lxml库解析HTML页面,使用xpath语法提取所需的信息。最后,使用for循环遍历提取到的信息,并将其保存到一个变量中。你可以根据需要自定义保存的格式。\[2\]\[3\]希望这些信息对你有帮助!
#### 引用[.reference_title]
- *1* *2* *3* [手把手教你使用Python网络爬虫获取招聘信息](https://blog.csdn.net/weixin_46089319/article/details/107250818)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文