job_salary = job_html.find('p', class_='job_salary').find('strong').contents[0]
时间: 2023-04-04 22:04:20 浏览: 87
这是一个关于 Python 爬虫的问题,我可以回答。这段代码的作用是从 job_html 中找到 class 为 job_salary 的 p 标签中的 strong 标签的第一个内容,并将其赋值给 job_salary 变量。
相关问题
class Job(db.Model): __tablename__ = 'jobs' id = db.Column(db.Integer, primary_key=True) job_name = db.Column(db.String(255)) location = db.Column(db.String(255)) salary = db.Column(db.String(255)) job_tags = db.Column(db.String(255)) company = db.Column(db.String(255)) def __repr__(self): return f"<Job id={self.id} job_name={self.job_name} location={self.location} salary={self.salary} job_tags={self.job_tags} company={self.company}>"
这是一个使用 SQLAlchemy ORM 框架创建的 Job 模型类,它映射了一个名为 'jobs' 的数据表。该类有以下属性:
- id: 主键,自增的整数类型。
- job_name: 职位名称,字符串类型。
- location: 工作地点,字符串类型。
- salary: 工资,字符串类型。
- job_tags: 职位标签,字符串类型。
- company: 公司名称,字符串类型。
该类的 __repr__ 方法定义了对象在被打印时所显示的字符串格式,它返回一个包含对象属性的字符串。
import requests from bs4 import BeautifulSoup url = 'https://search.51job.com/list/010000,000000,0000,00,9,99,python,2,1.html' r = requests.get(url) soup = BeautifulSoup(r.text, 'html.parser') job_list = soup.find_all('div', class_='el') for job in job_list: job_name = job.find('a').text.strip() company_name = job.find('span', class_='t2').text.strip() location = job.find('span', class_='t3').text.strip() salary = job.find('span', class_='t4').text.strip() print(f'{job_name} | {company_name} | {location} | {salary}')
这段代码是之前我给出的爬取 51job 网站数据的代码。这个代码可以爬取 51job 网站上关键词为 python 的职位信息,并输出职位名称、公司名称、工作地点和薪资。你可以根据需要修改关键词或输出的信息。需要注意的是,爬取网站数据时需要遵守网站的 robots.txt 文件,不要过于频繁地爬取同一个页面。
阅读全文