def parse_onepage(html): soup =BeautifulSoup(html,'lxml') div_list=soup.select('div.li_txt') jsons=[] # a = li_list[0].select('div > div.info > div.hd >a > span.title')[0].get.text() # print(a) for node in div_list: title = node.select('h4')[0].get_text() name = node.select('h3 ')[0].get_text() info = node.select('p')[0].get_text() pic=node.select('src') data = {'头衔':title,'老师':name,'简介':info,'图片':pic} jsons.append(data) save(jsons)下载教师图片
时间: 2024-02-23 08:02:09 浏览: 358
rails_parse_head:解析head元素(https:developer.mozilla.orgen-USdocsWebHTMLElementhead)
在这段代码中,获取教师图片的代码是有问题的。应该使用node.select('img')来获取图片,而不是node.select('src')。修改后的代码如下:
```
def parse_onepage(html):
soup = BeautifulSoup(html, 'lxml')
div_list = soup.select('div.li_txt')
jsons = []
for node in div_list:
title = node.select('h4')[0].get_text()
name = node.select('h3')[0].get_text()
info = node.select('p')[0].get_text()
pic = node.select('img')[0].get('src') # 修改这里的代码
data = {'头衔':title, '老师':name, '简介':info, '图片':pic}
jsons.append(data)
save(jsons)
```
这样就可以获取教师图片了。
阅读全文