基于lxml解析boss的职位名称、薪资、地区、工作经验、学历、职位类别、招聘人数、职位描述、岗位职责、职位福利、公司名称、公司类型、公司规模数据

```python import requests from lxml import etree url = 'https://www.zhipin.com/job_detail/?query=python&city=101010100&industry=&position=' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) html = etree.HTML(response.text) # 职位名称 job_title = html.xpath('//div[@class="job-banner"]/div[@class="info-primary"]/div[@class="name"]/h1/text()')[0] # 薪资 salary = html.xpath('//div[@class="job-banner"]/div[@class="info-primary"]/div[@class="name"]/span/text()')[0] # 地区 location = html.xpath('//div[@class="job-banner"]/div[@class="info-primary"]/p/text()')[0] # 工作经验 experience = html.xpath('//div[@class="job-banner"]/div[@class="info-primary"]/p/text()')[1] # 学历 education = html.xpath('//div[@class="job-banner"]/div[@class="info-primary"]/p/text()')[2] # 职位类别 job_type = html.xpath('//div[@class="job-banner"]/div[@class="info-primary"]/p/text()')[3] # 招聘人数 recruit_num = html.xpath('//div[@class="job-banner"]/div[@class="info-primary"]/p/text()')[4] # 职位描述 job_description = html.xpath('//div[@class="job-detail"]/div[@class="detail-content"]/div[@class="job-sec"]/div[@class="text"]/text()') job_description = ''.join(job_description).strip() # 岗位职责 job_responsibility = html.xpath('//div[@class="job-detail"]/div[@class="detail-content"]/div[@class="job-sec"][1]/div[@class="text"]/text()') job_responsibility = ''.join(job_responsibility).strip() # 职位福利 job_benefits = html.xpath('//div[@class="job-detail"]/div[@class="detail-content"]/div[@class="job-sec"][2]/div[@class="text"]/text()') job_benefits = ''.join(job_benefits).strip() # 公司名称 company_name = html.xpath('//div[@class="job-sec company-info"]/div[@class="name"]/text()')[0] # 公司类型 company_type = html.xpath('//div[@class="job-sec company-info"]/div[@class="text"]/p/text()')[0] # 公司规模 company_size = html.xpath('//div[@class="job-sec company-info"]/div[@class="text"]/p/text()')[1] print('职位名称：', job_title) print('薪资：', salary) print('地区：', location) print('工作经验：', experience) print('学历：', education) print('职位类别：', job_type) print('招聘人数：', recruit_num) print('职位描述：', job_description) print('岗位职责：', job_responsibility) print('职位福利：', job_benefits) print('公司名称：', company_name) print('公司类型：', company_type) print('公司规模：', company_size) ``` --相关问题--: 1. 如何使用beautifulsoup解析网页？ 2.

阅读全文

基于lxml解析boss的职位名称、薪资、地区、工作经验、学历、职位类别、招聘人数、职位描述、岗位职责、职位福利、公司名称、公司类型、公司规模数据

相关推荐

爬取boss招聘数据

boss招聘源码，具体分析

数据解析xml

lxml解析器

lxml解析网页.docx

Python基于lxml模块解析html获取页面内所有叶子节点xpath路径功能示例

Python lxml解析HTML并用xpath获取元素的方法

Python爬虫基于lxml解决数据编码乱码问题

lxml

Python高效率XML/HTML处理库：lxml解析

Python利用lxml解析HTML获取全部叶子节点XPath路径技巧

Python爬虫Mac版教程：豆瓣电视案例与xpath/lxml解析

【进阶篇】数据解析与提取进阶技巧：使用lxml解析XML数据

python lxml解析

直接输出boss直聘网站招聘信息100条包含：公司名称、学历要求、工作类型、工作名称、薪资、城市名称、公司规模、岗位职责、工作经验

使用 lxml 解析器来解析 HTML

Python使用lxml解析xml

使用scrapy框架完成对拉勾招聘网“大数据”相关职位职位名称、薪水、学历要求、职位描述等特征数据采集；

使用xpath爬取智联招聘数据分析师的职位名称，薪资范围，地点，工作经验，学历要求，岗位标签，公司名称，公司类型，公司规模，省份，城市并保存csv的最新网址的代码

无法解析导入lxml

大家在看

华为CloudIVS 3000技术主打胶片v1.0（C20190226）.pdf

dosbox:适用于Android的DosBox Turbo FreeBox

功率谱密度：时间历程的功率谱密度。-matlab开发

南京工业大学Python程序设计语言题库及答案

Windows6.1--KB2533623-x64.zip

最新推荐

基于机器学习的疾病数据集分析

Windows下操作Linux图形界面的VNC工具

【SketchUp Ruby API：从入门到精通】

VMware虚拟机打开虚拟网络编辑器出现由于找不到vnetlib.dll,无法继续执行代码。重新安装程序可能会解决问题

基于Preact的高性能PWA实现定期天气信息更新

从停机到上线，EMC VNX5100控制器SP更换的实战演练

ubuntu labelme中文版安装

全新免费HTML5商业网站模板发布

EMC VNX5100控制器SP更换全流程指南：新手到高手的必备技能

lamada函数