soup.select获取属性值

使用BeautifulSoup库的select方法可以获取元素的属性值。下面是一个示例代码： ```python from bs4 import BeautifulSoup html = ''' <html> <body> <div class="container"> <h1>Example</h1> <p class="content">Hello, world!</p> </div> </body> </html> ''' soup = BeautifulSoup(html, 'html.parser') element = soup.select('.content')[0] attribute_value = element['class'][0] print(attribute_value) ``` 在上述代码中，我们先创建了一个包含HTML内容的字符串。然后，我们使用BeautifulSoup库将其解析为一个Soup对象。接下来，我们使用select方法选择class为"content"的元素，并取得该元素的class属性值。最后，我们打印出属性值"content"。请注意，select方法返回的是一个元素列表，所以我们需要使用索引来访问具体的元素。在上述示例中，我们使用了索引[0]来获取列表中的第一个元素。

for row in soup.select(".table-row"): departure_port = soup.select_one("div:contains('Shanghai East Container Terminal')").text.strip() departure_time = soup.select_one("div[data-test='departure-date']").text.strip() arrival_port = soup.select_one("div:contains('PSA Singapore Terminal')").text.strip() arrival_time = soup.select_one("div[data-test='arrival-date']").text.strip() vessel_name = soup.select_one("span:contains('NIMTOFTE MAERSK')").text.strip()这一步是什么意思

这一步的作用是使用CSS选择器来从BeautifulSoup对象`soup`中提取所需的数据，并将其存储在变量中。首先，`soup.select(".table-row")`使用CSS选择器`.table-row`来匹配所有的class为`table-row`的元素，这些元素包含了船期信息的各个字段。然后，对于每个匹配到的元素，使用相应的CSS选择器来取出所需的字段值，例如： - `departure_port = soup.select_one("div:contains('Shanghai East Container Terminal')").text.strip()`: 使用CSS选择器`div:contains('Shanghai East Container Terminal')`匹配到第一个包含"Shanghai East Container Terminal"文本的div元素，并将其文本内容去除空格和换行符后存储在`departure_port`变量中。 - `departure_time = soup.select_one("div[data-test='departure-date']").text.strip()`: 使用CSS选择器`div[data-test='departure-date']`匹配到第一个包含`data-test`属性值为`departure-date`的div元素，并将其文本内容去除空格和换行符后存储在`departure_time`变量中。 - `arrival_port = soup.select_one("div:contains('PSA Singapore Terminal')").text.strip()`: 使用CSS选择器`div:contains('PSA Singapore Terminal')`匹配到第一个包含"PSA Singapore Terminal"文本的div元素，并将其文本内容去除空格和换行符后存储在`arrival_port`变量中。 - `arrival_time = soup.select_one("div[data-test='arrival-date']").text.strip()`: 使用CSS选择器`div[data-test='arrival-date']`匹配到第一个包含`data-test`属性值为`arrival-date`的div元素，并将其文本内容去除空格和换行符后存储在`arrival_time`变量中。 - `vessel_name = soup.select_one("span:contains('NIMTOFTE MAERSK')").text.strip()`: 使用CSS选择器`span:contains('NIMTOFTE MAERSK')`匹配到第一个包含"NIMTOFTE MAERSK"文本的span元素，并将其文本内容去除空格和换行符后存储在`vessel_name`变量中。最后，将上述变量的值存储在一个字典中，表示一条船期信息。这个字典可以用于后续的数据处理和存储。

soup.select() 方法获取a的href值

`soup.select()` 方法是BeautifulSoup库中的一个强大功能，用于从HTML文档中选择匹配特定CSS选择器的元素。当你需要从网页抓取数据，特别是提取像链接（通常在`<a>`标签中）的属性时，这个方法非常有用。当你调用 `soup.select('a')` 或者 `soup.select('a[href]')`，它会返回一个列表，其中包含所有`<a>`标签（如果有href属性的话）。如果想获取每个`<a>`标签的`href`属性值，你可以通过遍历这个列表并访问每个元素的`get('href')`方法： ```python for link in soup.select('a'): href_value = link.get('href') print(href_value) ``` 这里，`link.get('href')`会返回`<a>`标签的`href`属性的值。如果你只想对有`href`属性的链接做处理，可以使用条件判断： ```python for link in soup.select('a[href]'): href_value = link['href'] # 对href_value做进一步操作... ```

阅读全文

soup.select获取属性值

soup.select() 方法获取a的href值

相关推荐

获取select的值

python3爬虫获取html内容及各属性值的方法

HTML解析库Beautiful Soup.7z

soup.select函数如何使用

for row in soup.select(".table-row"):这一句应该遍历的是#main > div > div.schedules-view__results > div:nth-child(5)；#main > div > div.schedules-view__results > div:nth-child(6)等等我应该如何写呢

python获取html的select的属性值

beautiful soup

Python爬虫利器二之Beautiful Soup的用法.zip_python_爬虫_爬虫 python_爬虫 pyth

Beautiful Soup 4.4.0 文档

入门Beautiful Soup库

beautiful soup里select格式

怎么用soup获取div的src的值

python获取html的select的id值

Beautiful Soup怎么获取id下的div

python soup

用BeautifulSoup怎么爬取一个标签嵌套另一个标签的属性值

python beautiful soup的使用

大家在看

Lecture-6-Import-Design-and-Floorplan.pdf

计算机网络_自顶向下方法_第四版_课后习题答案

基于springboot的智慧食堂系统源码.zip

华为备份解压工具4.8

YRC1000 PROFINET通信功能说明书（西门子 CP1616）.pdf

最新推荐

034-基于AT89C52的矩阵键盘扫描proteus仿真设计.rar

探索zinoucha-master中的0101000101奥秘

【Qt与OpenGL集成】：提升框选功能图形性能，OpenGL的高效应用案例

ffmpeg 指定屏幕输出

个人网站技术深度解析：Haskell构建、黑暗主题、并行化等

Qt框选功能的国际化实践：支持多语言界面的核心技术解析

内网如何运行docker pull mysql:5.7

ImgToString开源工具：图像转字符串轻松实现

Qt框选功能安全性增强指南：防止恶意操作的有效策略

在ros平台中实现人脸识别

for row in soup.select(".table-row"):这一句应该遍历的是#main > div > div.schedules-viewresults > div:nth-child(5)；#main > div > div.schedules-viewresults > div:nth-child(6)等等我应该如何写呢