python爬取51job公司名称并写入csv
时间: 2023-09-20 11:10:21 浏览: 150
以下是使用Python爬取51job公司名称并将其写入CSV文件的代码示例:
```
import requests
from bs4 import BeautifulSoup
import csv
# 设置请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 发送请求
url = 'https://search.51job.com/list/040000,000000,0000,00,9,99,python,2,1.html'
response = requests.get(url, headers=headers)
response.encoding = 'gbk'
# 解析网页
soup = BeautifulSoup(response.text, 'html.parser')
job_list = soup.select('.dw_table .el .t2')
# 将公司名称写入CSV文件
with open('companies.csv', 'w', newline='') as csvfile:
writer = csv.writer(csvfile)
for job in job_list:
company = job.select_one('a').text.strip()
writer.writerow([company])
```
在这个示例中,使用`requests`库向51job发送请求,然后使用`BeautifulSoup`库解析网页。我们从网页中选择了公司名称,然后将其写入CSV文件中。
注意,我们使用`csv`库来将公司名称写入CSV文件。在`with open('companies.csv', 'w', newline='') as csvfile:`语句中,我们打开一个名为`companies.csv`的文件,并创建一个`csv.writer`对象来将公司名称写入该文件中。然后我们使用`writer.writerow([company])`将每个公司名称写入新的行中。
最后,我们得到一个名为`companies.csv`的CSV文件,其中包含了从51job网站爬取的公司名称。
阅读全文