没有合适的资源?快使用搜索试试~ 我知道了~
首页Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释
如何利用Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释等操作下面就为大家介绍一下 一、Tag(标签)对象 1.Tag对象与XML或HTML原生文档中的tag相同。 from bs4 import BeautifulSoup soup = BeautifulSoup('Extremely bold','lxml') tag = soup.b type(tag) bs4.element.Tag 2.Tag的Name属性 每个tag都有自己的名字,通过.name来获取 tag.name 'b' tag.name = "blockquote" # 对原始文档进
资源详情
资源评论
资源推荐

Python爬虫库爬虫库BeautifulSoup获取对象获取对象(标签标签)名名,属性属性,内容内容,注注
释释
如何利用Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释等操作下面就为大家介绍一下
一、Tag(标签)对象
1.Tag对象与XML或HTML原生文档中的tag相同。
from bs4 import BeautifulSoup
soup = BeautifulSoup('Extremely bold','lxml')
tag = soup.b
type(tag)
bs4.element.Tag
2.Tag的Name属性
每个tag都有自己的名字,通过.name来获取
tag.name
'b'
tag.name = "blockquote" # 对原始文档进行修改
tag
Extremely bold
3.Tag的Attributes属性
获取单个属性
tag['class']
['boldest']
按字典的方式获取全部属性
tag.attrs
{'class': ['boldest']}
添加属性
tag['class'] = 'verybold'
tag['id'] = 1
print(tag)
Extremely bold
删除属性
del tag['class'] del tag['id'] tag
Extremely bold
4.Tag的多值属性
多值属性会返回一个列表
css_soup = BeautifulSoup('
','lxml')
print(css_soup.p['class'])
['body', 'strikeout']
rel_soup = BeautifulSoup('
Back to the homepage
','lxml')
print(rel_soup.a['rel'])



















安全验证
文档复制为VIP权益,开通VIP直接复制

评论0