for tag in soup.find_all(attrs={"class": "item"}): # 爬取序号 num = tag.find('em').get_text() print(num) infofile.write(num + "\r\n") # 电影名称 name = tag.find_all(attrs={"class": "title"}) zwname = name[0]
时间: 2024-04-10 15:28:54 浏览: 70
Python爬虫利器二之Beautiful Soup的用法.zip_python_爬虫_爬虫 python_爬虫 pyth
这段代码是用来爬取网页中的电影序号和名称。首先,通过`soup.find_all`方法找到所有具有`class`属性为"item"的标签。然后,通过`tag.find('em').get_text()`获取序号,并将其打印出来和写入到文件中。接下来,通过`tag.find_all(attrs={"class": "title"})`找到所有具有`class`属性为"title"的标签,并将第一个标签的文本内容赋值给变量`zwname`。
阅读全文